質問編集履歴
1
書式の改善
title
CHANGED
File without changes
|
body
CHANGED
@@ -5,7 +5,12 @@
|
|
5
5
|
### 発生している問題・エラーメッセージ
|
6
6
|
|
7
7
|
```
|
8
|
+
href_str = html_parser.HTMLParser().unescape(div.a['m'])
|
9
|
+
AttributeError: 'HTMLParser' object has no attribute 'unescape'
|
10
|
+
2020-12-05 23:31:25,777 - INFO - downloader - no more download task for thread downloader-001
|
11
|
+
2020-12-05 23:31:25,777 - INFO - downloader - thread downloader-001 exit
|
12
|
+
2020-12-05 23:31:25,780 - INFO - icrawler.crawler - Crawling task done!
|
8
|
-
コードを実行すると
|
13
|
+
コードを実行すると上記メッセージが出てしまい保存が出来ません。
|
9
14
|
crawling task done と出ているので、コード自体は実行されていると思うのですが保存がされていません。
|
10
15
|
AttributeError: 'HTMLParser' object has no attribute 'unescape'
|
11
16
|
恐らくこれが原因だとは思うのですが、解決法が見当つきません。
|
@@ -14,14 +19,7 @@
|
|
14
19
|
### 該当のソースコード
|
15
20
|
|
16
21
|
```python3.9
|
17
|
-
|
22
|
+
from icrawler.builtin import BingImageCrawler
|
18
|
-
|
23
|
+
Bing_crawler=BingImageCrawler(downloader_threads=1,storage={"root_dir":"img"})
|
19
|
-
2020-12-05 22:59:58,055 - INFO - downloader - no more download task for thread downloader-004
|
20
|
-
2020-12-05 22:59:58,055 - INFO - downloader - no more download task for thread downloader-003
|
21
|
-
2020-12-05 22:59:58,055 - INFO - downloader - no more download task for thread downloader-001
|
22
|
-
|
24
|
+
Bing_crawler.crawl(keyword="猫",max_num=100)
|
23
|
-
2020-12-05 22:59:58,055 - INFO - downloader - thread downloader-004 exit
|
24
|
-
2020-12-05 22:59:58,055 - INFO - downloader - thread downloader-003 exit
|
25
|
-
2020-12-05 22:59:58,056 - INFO - downloader - thread downloader-001 exit
|
26
|
-
2020-12-05 22:59:59,056 - INFO - icrawler.crawler - Crawling task done!
|
27
25
|
```
|