回答編集履歴

ソースコードを追記しました。

2019/06/24 06:43

投稿

7vvXi

スコア24

answer CHANGED Viewed

@@ -4,4 +4,67 @@
 https://docs.python.org/ja/3/tutorial/errors.html
 順位を正しくするには、空白をappendするのが現状一番かと思われます。
-ループやインクリメント処理については、インデントやスコープをよく見て書いてみるといいかもしれません。
+ループやインクリメント処理については、インデントやスコープをよく見て書いてみるといいかもしれません。
+※ここから追記です
+このようなことでしょうか？
+一応ですが、実行確認済みです。
+```Python
+import requests
+from bs4 import BeautifulSoup
+import time
+import os
+import re
+import csv
+from urllib.parse import urljoin
+#URL
+url = ["http://hoge.co.jp", \
+       "http://fuga.co.jp", \
+       "http://piyo.co.jp"
+      ]
+def scraping():
+    #URLカウンタ（初期化）
+    n = 0
+    while n < len(url):
+        #取得する値（配列）
+        res = requests.get(url[n])
+        res.raise_for_status()
+        #配列カウンタ（初期化）
+        count = 0
+        #指定のURLにアクセス
+        html = BeautifulSoup(res.content, "lxml")
+        #タグの内容を取得
+        arr1 = []
+        arr2 = []
+        data1 = html.find_all("h3", class_="hoge")
+        data2 = html.find_all("p")
+        if data1 is not None:
+            for tmp1 in data1:
+                arr1.append(tmp1.get_text())
+        if data2 is not None:
+            for tmp2 in data2:
+                data3 = tmp2.find_all("a")
+                if data3 is not None:
+                    for pt in data3:
+                        arr2.append(pt.get("href"))
+        #ファイル書き出し
+        filename = "output" + str(n) + ".csv"
+        with open(filename, 'w') as f:
+            writer = csv.writer(f)
+            writer.writerow(arr1)
+            writer.writerow(arr2)
+        #次のURLへ
+        n += 1
+if __name__ == '__main__':
+    scraping()
+```