【Python】価格COMのレビューをスクレイプ(Scrape)しよう

当ページのリンクには広告が含まれています。

今回は、Pythonを使って価格COMのレビューをスクレイプする方法について紹介したいと思います。

今回紹介するソースコードは、こちらのページで紹介した自作のScrape クラスを使っていますので、ご自身の環境で動作させたい場合は、Scrapeクラスも合わせてご利用ください。

また、スクレイプについて詳しく知りたい方は、併せてこちらの記事もご一読ください。

目次

概要

今回も関数として作成しており、引数に価格COM の商品レビューのURLを渡すと、レビュー内容を収集してくれるようになっています。

 URLの例:https://review.kakaku.com/review/J0000037949/#tab'

引用元:価格.COM

関数内部では、こちらの記事で紹介した自作クラス(Scrape)を呼び出しています。

今回、私が解析したレビューはノートPCの製品レビューであるため、別の商品だとうまくスクレイプ出来ない可能性があります。

また、価格COM のページの仕様が変わった場合も同様ですので、その点はあらかじめご了承ください。

関数のソースは以下の様になります。

出来るだけ多くのコメントを記載しましたので、ざっくり目を通していただければ、おおよそのことが分かるかと思います。

関数の使い方

使い方は簡単で、引数にスクレイプしたい商品のURLを渡すだけです。

scrape_kakaku(スクレイプしたいURL)

下記は、スクレイピングした結果のCSVをEXCELで開いた画面です。

まとめ

今回は、価格COMのレビューをPythonでスクレイピングする方法について紹介しました。

関数化しているので、コピペしてお使い下さい。

尚、今回はノートPCについてのスクレイピングであり、それ以外の商品は確認出来ていませんが、ご了承ください。

途中でエラーになった場合は、ソースのコメントを見ながら、適宜修正して頂ければと思います。

今回のスクレイピングで得たレビューに対して、ワードクラウドや文書要約がしたい場合は、下記URLから関連議事をご参照ください。

【実践】PythonでWordCloud(ワードクラウド)しようぜ!

【実践】Python+pysummarizationで文書要約(テキストマイニング)しよう!

【実践】Python+sumyで文書要約(テキストマイニング)しよう!

今回の記事が皆様のプログラミングの一助になれば幸いです。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次