質問編集履歴

タイトルの修正

2018/08/18 14:01

投稿

スコア23

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- 指定した単語が存在するWebページからスクレイピング
1	+ 指定した単語が存在するWebページからスクレイピング(python)

body CHANGED Viewed

File without changes

問題点の追記

2018/08/18 14:01

投稿

スコア23

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -16,30 +16,27 @@
 #【進捗】
 現在は指定したサイトのクラスからURLを抽出しようとしています。
+※以前の【AttributeError: 'NoneType' object has no attribute 'get'】が出て来るエラーは直りました。ありがとうございます。(8/18追記)
 ###ソースコード
 ```python
 # coding: UTF-8
 import requests
 from bs4 import BeautifulSoup
 response = requests.get('URL')
 #HTMLを取得して変数へ格納
-soup = BeautifulSoup(responsew.text,'lxml')
+soup = BeautifulSoup(response.text,'lxml')
-#lxmlというツールでresponse.textを変換、変数へ格納
+#lxmlというツールでresponse.textを変換、スクレイピングできる形にして変数へ格納
-data = soup.find('a',class_='クラス名').get('href')
+Cdata = soup.find_all("div", class_="クラス名")
+for x in Cdata:
+	Udata = x.get("href")
-print(data)
+	print (Udata)
 ```
 ###エラー
-次のようなエラーガ出てしまいます。
-クラスを指定せずにサイト全体のURLを抽出するパターンはうまくいきました。
+「None」と表示され、URLの取得ができません。
-```実行結果
-AttributeError: 'NoneType' object has no attribute 'get'
+指定したクラス内に実際に存在するはずなのですが・・・
-```
 以上、よろしくお願い致します。

※8/18追記すみません、記載情報があまりに少なすぎました

2018/08/18 11:43

投稿

スコア23

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,3 +1,8 @@
+#【実行環境および使用言語】
+-CentOS 7
+-Python 2.7.5
+#【やりたいこと】
 次のような操作を行いたいと考えております。
 ①とあるWebページからURL一覧を取得する（スクレイピング？）
@@ -9,6 +14,32 @@
 →取得したURL先の全てのページから『スイカ』という単語が含まれたものがあるか調べる
 →『スイカ』という単語がある全てのページから『タイトル』や『画像』といったデータを取得する
+#【進捗】
-自身で調べたところスクレイピングはpythonで出来るようなのですが、上記の手順は分かりません。
+現在は指定したサイトのクラスからURLを抽出しようとしています。
+###ソースコード
+```python
+# coding: UTF-8
+import requests
+from bs4 import BeautifulSoup
+response = requests.get('URL')
+#HTMLを取得して変数へ格納
+soup = BeautifulSoup(responsew.text,'lxml')
+#lxmlというツールでresponse.textを変換、変数へ格納
+data = soup.find('a',class_='クラス名').get('href')
+print(data)
+```
+###エラー
+次のようなエラーガ出てしまいます。
+クラスを指定せずにサイト全体のURLを抽出するパターンはうまくいきました。
+```実行結果
+AttributeError: 'NoneType' object has no attribute 'get'
+```
 以上、よろしくお願い致します。