今後、ディープラーニングのためのデータ集めにWebスクレイピングをすることが多くなると思っているのですが、Pythonを用いたWebスクレイピングの代表的なものの2つにBeautiful SoupとPyQueryがあると思います。
今から始めるにあたってこの2つのどちらするのが良いでしょうか。
(特に日本語の)ネットに落ちている情報の多さ、
(特に日本語の)書籍の量、
学習コスト、
利便性や汎用性の高さ
などの観点から教えていただきたく思っています。
以前一度だけWebスクレイピングをする必要があったときに、jqueryが書けたのでコードの形式が近そうなpyqueryのコードを技術ブログから拾ってきて適当に書き換えてその時はたまたま上手く行ったのですが、今後多用するとなるとちゃんとした文法などを知っておく必要があるように思いました。
そこで、少し調べてみたのですが、日本語で1からしっかり書かれている「pyqueryの使い方」なるものはなかったように思われます。
ですので、英語のチュートリアルを見ようかベースのlxml(?)を勉強すれば良いのかなどを思っているところです。
しかし、どのみち勉強し直すのであれば、もし「beautiful soupの方がどう考えても優れてるでしょ!」のような意見があるのであれば、そちらを勉強してみても良いかなと思っております。
よろしくお願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。