【Python】Amazonの口コミをスクレイプ(Scrape)しよう

Python入門
この記事は約3分で読めます。

今回は、Pythonを使ってAmazonの口コミをスクレイプする方法について紹介したいと思います。

以前こちらのページで、WindowsFormとC#を使ってAmazonの口コミをスクレイプする方法を紹介しました。

そして、こちらのページでは、Pythonを使ったスクレイプ用の自作クラスを紹介しました。

今回はこの2つの記事を合体させたような内容となります。

このページだけ読んで頂いても事が足りる用にしてありますが、スクレイプについて詳しく知りたい方は、併せてこちらの記事もご一読ください。

概要

今回は関数として作成しており、引数にamazon の商品URLを渡すと、口コミ収集してくれるようになっています。

関数内部では、こちらの記事で紹介した自作クラス(Scrape)を呼び出しています。

私が今回解析したURLやHTMLのパターン以外のものや、amazon のページの仕様が変わった場合は、うまくスクレイプできなくなりますがご了承ください。

関数のソースは次の様になります。

出来るだけ多くのコメントを記載していますので、ソースに目を通していただければ、おおよそのことが分かるかと思います。

関数の使い方

使い方は簡単で、引数にスクレイプしたい商品のURLを渡すだけです。

scrape_amazon(スクレイプしたいURL)

アマゾンのページのスクリーンショットをサンプルで掲載したいところですが、違反になるので割愛します。

下記商品のスクレイピングなので、実際にページに移動してご確認下さい。

下記は、スクレイピングした結果のCSVをEXCELで開いた画面です。

name は個人情報に抵触するかどうかわかりませんが、念のためボカしています。

全ソース(自作クラスを含む)

自作クラスを含む全てのソースを掲載しておきます。

まとめ

今回は、Amazonの口コミをPythonでスクレイピングする方法について紹介しました。

関数化しているので、コピペしてお使いいただけます。

但し、全ての商品について確認できておりませんので、商品の中にはうまくスクレイピングできない可能性もあります。

また、将来Amazonのページの仕様が変わった場合もスクレイピングできなくなりますので、その場合はソースのコメントを見ながら、適宜修正して頂ければと思います。

今回のスクレイピングで得た口コミに対して、ワードクラウドや文書要約など適応すれば、全ての口コミに目を通すことなく、全体の概要が掴めるかもしれませんので、興味のある方はお試しください。

今回の記事が皆様のプログラミングの一助になれば幸いです。

タイトルとURLをコピーしました