googleで検索した際に、タイトルのみ(ディスクリプション非表示、パンくずリスト非表示)にしたいです。
ツールを使う方法でも、ブラウザを変えるなど方法があればお教えください。
目的は、googleの検索結果を一覧で
表示して、リスト化し、データ収集したいです。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
回答2件
0
ベストアンサー
サイトごとのスタイルを適用するのであれば、下記のようなChrome拡張でユーザースタイルシートを作成する手段があります。(Firefoxとかにもあるはず)
【Chrome拡張「Stylish」でユーザースタイルシートを設定する - 地雷持ちが快適にpixivを楽しむための備忘録】
http://pixadversaria.web.fc2.com/page01.htm
lightsonさんの書いておられる、Google Custom Search API は一日あたり 100 検索クエリまでは無料のAPIで、有料であればもっと取得できるはずです。
【Google Custom Search API を使ってみる - Qiita】
http://qiita.com/megu_ma/items/8cad39f61e35588e5476
【Google Custom Search APIを使って検索結果のURLを取得する【PHP】 - autofocus onfocus】
http://tanakayu.hatenablog.jp/entry/2015/02/22/133158
【Google Custom Search API(カスタムサーチAPI)を使ってプログラム的に検索結果を取得する方法 | urashita.com】
http://urashita.com/archives/8158
投稿2016/04/25 05:12
総合スコア69407
0
スクリプトを何度か動かしていたら、次のようなメッセージが出てデータが取れなくなってしまいました。
APIの利用には制限があるようです。
この方法でやるなら、通常のページからタイトルを切り出したほうがよさそうです。
Suspected Terms of Service Abuse. Please see http://code.google.com/apis/error
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
こちらのサイトに
http://so-zou.jp/web-app/tech/web-api/google/search/
このような感じでパタメータを渡すと、結果がJSONで返ってくると書かれていました。
http://ajax.googleapis.com/ajax/services/search/web?v=1.0&q=test
試してみると、一回の検索で3件の情報が返ってきましたので、30件のデータを取るスクリプトをpythonで書いてみました。このようにタイトルが取れます。
0 Start — Zope.org
0 Zope Interface - PyPI - Python
0 zope.interface 3.8.0 : Python Package Index
3 zope.interface 3.8.0 : Python Package Index
3 What is Zope? - Quintagroup
3 Zope Application Server
6 GitHub - zopefoundation/zope.interface: Interfaces for Python
6 Pillars of Python: Zope 2 Web framework | InfoWorld
6 A Comprehensive Guide to Zope Component Architecture
python
1import urllib2 2import json 3 4query = u'python+zope' 5for cnt in range(0,33,3): 6 url = 'http://ajax.googleapis.com/ajax/services/search/web?v=1.0&q='+ \ 7 query + '&safe=off&start=' + str(cnt) 8 #print url 9 req = urllib2.Request(url) 10 response = urllib2.urlopen(req) 11 my_page = response.read() 12 my_json = json.loads(my_page) 13 for no in range(3): 14 print cnt, my_json[u'responseData'][u'results'][no][u'titleNoFormatting']
投稿2016/04/24 09:18
編集2016/04/24 09:26総合スコア553
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
質問の解決につながる回答をしましょう。 サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。 また、読む側のことを考えた、分かりやすい文章を心がけましょう。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/04/25 11:40