編集履歴

回答編集履歴

Pathlib.mkdirを使うように変更！

2018/04/22 19:10

投稿

スコア5846

answer CHANGED Viewed

@@ -88,7 +88,7 @@
         # sec
         self.timeout = 10
         self.download_dir = Path('download')
-        os.makedirs(str(self.download_dir), exist_ok=True)
+        self.download_dir.mkdir(exist_ok=True)
     def get(self, url: str, params: dict=None):
         # 実際のリクエスト処理はここ

追記

2018/04/22 19:10

投稿

umyu

スコア5846

answer CHANGED Viewed

@@ -74,7 +74,7 @@
     def search(self):
         search_word = self.key_word.get()
         # ※画面をブロックさせないためにスレッドを生成して、startを呼び出す。
-        t = Thread(target=hack,args=search_word)
+        t = Thread(target=hack, args=(search_word,))
         t.start()
     def owari(self):

追記

2018/04/22 13:40

投稿

umyu

スコア5846

answer CHANGED Viewed

@@ -48,6 +48,10 @@
         # ロゴ？を表示
         # image1 = tk.PhotoImage(file = 'LOGO.gif')
         # tk.Label(frame1, image = image1).pack()#.grid(row=0, column=0)
+        # ※検索キーワードのテキストボックスを作成
+        self.key_word = tk.StringVar(value='草')
+        self.txt_key_word = tk.Entry(self, textvariable=self.key_word)
+        self.txt_key_word.pack()
         # 探すボタンを作成
         serch = tk.Button(self, text='探す', padx=45, pady=7, command=self.search)
         serch.pack()
@@ -68,8 +72,9 @@
         owa.pack()
     def search(self):
+        search_word = self.key_word.get()
         # ※画面をブロックさせないためにスレッドを生成して、startを呼び出す。
-        t = Thread(target=hack)
+        t = Thread(target=hack,args=search_word)
         t.start()
     def owari(self):
@@ -144,9 +149,9 @@
 #ダウンロード用(HTML)関数
-def hack(): #wordeで取得したURLから画像のURLを抜き出す(解析)　使用ライブラリ:bs4
+def hack(search_word: str): #wordeで取得したURLから画像のURLを抜き出す(解析)　使用ライブラリ:bs4
     url = 'https://search.yahoo.co.jp/image/search'
-    params = {'n': '60', 'p': "草", 'search.x': '1'}
+    params = {'n': '60', 'p': search_word, 'search.x': '1'}
     res = dl.get(url, params)
     print(res.text)
     soup = bs4.BeautifulSoup(res.text, "html.parser") #わかんね

補足

2018/04/22 07:34

投稿

umyu

スコア5846

answer CHANGED Viewed

@@ -1,20 +1,35 @@
+> bs4で画像のURLを取得する方法が解らないです。
+これに関しては質問文のソースコードでurl_listでURLを取得できているので、ダウンロードの仕方と保存の仕方が分からないと判断しました。
+極論を言えば以下のコードでも可能かと。
+```Python
+import os
+for s in url_list:
+    res = requests.get(s)
+    file_name = os.path.basename(s)
+    with open(file_name, 'wb') as f:
+        f.write(res.content)
+```
+---
 > ※超初心者です。
 うーん、少し悩みましたが、ソースコードを頑張って読み取ってくれることを期待して。
 |クラス|役割|
 |:--|:--:|
 |MyFrame|画面|
 |DownLoader|ダウンロード処理|
 ```Python
 # -*- coding: utf-8 -*-
 from concurrent.futures import ThreadPoolExecutor, as_completed
 from io import BytesIO
-from threading import Thread
 import os
 from pathlib import Path
+from threading import Thread
 from time import sleep
 #おまじない
 import urllib #URLエンコード用
@@ -67,6 +82,8 @@
         self.interval = 500 / 1000
         # sec
         self.timeout = 10
+        self.download_dir = Path('download')
+        os.makedirs(str(self.download_dir), exist_ok=True)
     def get(self, url: str, params: dict=None):
         # 実際のリクエスト処理はここ
@@ -93,17 +110,19 @@
             for future in as_completed(future_to_url):
                 url = future_to_url[future]
                 try:
-                    # 保存ファイル名はURLのパス部分をそのまま取得
-                    # 重複が発生するので連番を付けたりして対応してくださいな。
-                    basename = os.path.basename(url)
                     # get_contentの戻り値はここで取得
                     buffer, content_type = future.result()
                     # 保存対象のファイルかどうか。
                     if not self.save_content_type(content_type):
                         continue
+                    # 保存ファイル名はURLのパス部分をそのまま取得
+                    # 重複が発生するので連番を付けたりして対応してくださいな。
+                    file_name = self.download_dir / os.path.basename(url)
-                    print(content_type, basename)
+                    print(content_type, file_name)
                     # 保存
-                    self.save_file(buffer, basename)
+                    self.save_file(buffer, file_name)
                     count += 1
                 except Exception as ex:
                     print(f"url:{url}, {ex}")
@@ -115,8 +134,8 @@
         is_saved = ["image/jpeg", "image/png", "image/gif"]
         return content_type.lower() in is_saved
-    def save_file(self, buffer: BytesIO, file_name: str) ->None:
+    def save_file(self, buffer: BytesIO, file_name: Path) ->None:
-        with open(file_name, 'wb') as f:
+        with file_name.open('wb') as f:
             f.write(buffer.getvalue())