質問編集履歴

詳しく

2020/04/01 03:37

投稿

pythonbegginer

スコア25

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -79,7 +79,8 @@
 ```
 宜しくお願いします。
-#頂いた回答を参考にもう1度コードを書いてみたのですが、エラーが出てしまいます。
+#頂いた回答を参考にもう1度コードを書いてみたのですが、次は1種類しか画像が取得できなくなりました。
+エラーは出ません。
 もう1度見ていただいてもよろしいでしょうか。
 ```Python
@@ -141,5 +142,11 @@
         print("ValueError!")
 ```
+このコードの結果↓
+10499
+C:\python\img\150x150_square_83722393.jpg
+10499
+C:\python\img\150x150_square_83722393.jpg
-何度もすいません。
+です。何度もすいません。
 宜しくお願いします。

マークダウンの追加

2020/04/01 03:37

投稿

pythonbegginer

スコア25

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -79,7 +79,7 @@
 ```
 宜しくお願いします。
-頂いた回答を参考にもう1度コードを書いてみたのですが、エラーが出てしまいます。
+#頂いた回答を参考にもう1度コードを書いてみたのですが、エラーが出てしまいます。
 もう1度見ていただいてもよろしいでしょうか。
 ```Python

頂いた回答を元にもう1度コードを書いたけどエラーが出てします。

2020/04/01 03:36

投稿

pythonbegginer

スコア25

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -77,4 +77,69 @@
         # ④-④.失敗した場合はエラー表示
         print("ValueError!")
 ```
+宜しくお願いします。
+頂いた回答を参考にもう1度コードを書いてみたのですが、エラーが出てしまいます。
+もう1度見ていただいてもよろしいでしょうか。
+```Python
+#●画像ファイルをダウンロードするための準備
+# ①-①.ライブラリをインポート
+import time
+import re
+import requests
+from pathlib import Path
+from bs4 import BeautifulSoup
+# 出力フォルダを作成
+output_folder = Path('C:\python\img')
+output_folder.mkdir(exist_ok=True)
+# スクレイピングしたいURLを設定
+import pandas as pd
+csv_file = r"C:\python\tabelog.csv"
+df = pd.read_csv(csv_file)
+# NOTE: df.列名.tolist()で指定列をリスト化する
+url_list = df.URL.tolist()
+# 画像ページのURLを格納するリストを用意
+linklist = []
+for url in url_list:
+    # ②-①.検索結果ページのhtmlを取得
+    html = requests.get(url).text
+    # ②-②.検索結果ページのオブジェクトを作成
+    soup = BeautifulSoup(html, 'lxml')
+    # ②-③.画像リンクのタグをすべて取得
+    a_list =soup.select('div.rstdtl-menu-lst__img')
+    # ②-④.画像リンクを1つずつ取り出す
+    for a in a_list:
+        # ②-⑤.画像ページのURLを抽出
+        link_url = a.img['src']
+        # ②-⑥.画像ページのURLをリストに追加
+        linklist.append(link_url)
+        time.sleep(1.0)
+        # ③-⑦.画像ファイルの名前を抽出
+        filename = re.search(".*/(.*png|.*jpg)$",link_url)
+        # ③-⑧.保存先のファイルパスを生成
+        save_path = output_folder.joinpath(filename.group(1))
+        time.sleep(1.0)
+    # ●画像ファイルのURLからデータをダウンロード
+    try:
+    # ④-①.画像ファイルのURLからデータを取得
+        image = requests.get(link_url)
+    # ④-②.保存先のファイルパスにデータを保存
+        open(save_path, 'wb').write(image.content)
+    # ④-③.保存したファイル名を表示
+        print(save_path)
+        time.sleep(1.0)
+    except ValueError:
+    # ④-④.失敗した場合はエラー表示
+        print("ValueError!")
+```
+何度もすいません。
 宜しくお願いします。