質問編集履歴
3
ソースコードを修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -34,14 +34,14 @@
|
|
34
34
|
img_list = []
|
35
35
|
url = 'https://project-imas.wiki/THE_IDOLM@STER_SHINY_COLORS_SOLO_COLLECTION_-1stLIVE_FLY_TO_THE_SHINY_SKY-' # 任意のurlを指定
|
36
36
|
url_cont = BeautifulSoup(requests.get(url).content,'lxml') # url解析
|
37
|
-
#img_all = url_cont.find("meta")
|
37
|
+
#img_all = url_cont.find("meta")
|
38
|
-
img_all = url_cont.find_all("meta")
|
38
|
+
img_all = url_cont.find_all("meta")
|
39
39
|
|
40
40
|
|
41
41
|
|
42
42
|
|
43
43
|
for d in img_all: # imgタグ情報を一つずつ抽出
|
44
|
-
d = d.get("content")
|
44
|
+
d = d.get("content")
|
45
45
|
if d.startswith("http") and (d.endswith("jpg") or d.endswith("png")):
|
46
46
|
print(d);
|
47
47
|
img_list.append(d) # srcの末尾が.jpgか.pngの場合リストに追加
|
2
URLを修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -14,7 +14,7 @@
|
|
14
14
|
アルバム名を入力してそのアルバムのアートワークの高解像度のものをダウンロードしたい。
|
15
15
|
|
16
16
|
このページ(https://project-imas.wiki/THE_IDOLM@STER_SHINY_COLORS_SOLO_COLLECTION_-1stLIVE_FLY_TO_THE_SHINY_SKY-)
|
17
|
-
のアルバムアートワーク画像をクリックした(https://project-imas.wiki/File:SOLO_COLLECTION_-1stLIVE_FLY_TO_THE_SHINY_SKY-.jpg)
|
17
|
+
のアルバムアートワーク画像をクリックした(https://project-imas.wiki/File:SOLO_COLLECTION_-1stLIVE_FLY_TO_THE_SHINY_SKY-.jpg)
|
18
18
|
のoriginal file URLをクリックした(https://images.project-imas.wiki/e/ef/SOLO_COLLECTION_-1stLIVE_FLY_TO_THE_SHINY_SKY-.jpg)
|
19
19
|
ページの画像を保存したい
|
20
20
|
|
1
文章を大幅に追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,36 +1,74 @@
|
|
1
|
-
提示コードですがアルバムアートワークが欲しいのでproject im@s wiki というサイトから
|
1
|
+
提示コードですがアルバムアートワークが欲しいのでproject im@s wiki というサイトからoriginal fileの画像をダウンロードしたいのですがこれするにはどうすればいいのでしょうか?画像のURLを見ると `CINDERELLA MASTER`の部分が`CM`という省略されておりこれでは`CD名を入力してアルバムアートワークをダウンロード`いう行為ができません。
|
2
|
+
|
3
|
+
##### おそらく行ること
|
4
|
+
このページ(https://project-imas.wiki/THE_IDOLM@STER_SHINY_COLORS_SOLO_COLLECTION_-1stLIVE_FLY_TO_THE_SHINY_SKY-)
|
5
|
+
のソースから<meta>タグで語尾が.jpgのURL(https://images.project-imas.wiki/e/ef/SOLO_COLLECTION_-1stLIVE_FLY_TO_THE_SHINY_SKY-.jpg)を探して
|
6
|
+
保存
|
7
|
+
|
8
|
+
##### 困っていること
|
9
|
+
おそらく行うことの`<meta>タグで語尾が.jpgのURL(https://images.project-imas.wiki/e/ef/SOLO_COLLECTION_-1stLIVE_FLY_TO_THE_SHINY_SKY-.jpg)を探して`を探す方法
|
10
|
+
|
2
11
|
|
3
12
|
|
4
13
|
##### やりたいこと
|
5
14
|
アルバム名を入力してそのアルバムのアートワークの高解像度のものをダウンロードしたい。
|
6
15
|
|
16
|
+
このページ(https://project-imas.wiki/THE_IDOLM@STER_SHINY_COLORS_SOLO_COLLECTION_-1stLIVE_FLY_TO_THE_SHINY_SKY-)
|
17
|
+
のアルバムアートワーク画像をクリックした(https://project-imas.wiki/File:SOLO_COLLECTION_-1stLIVE_FLY_TO_THE_SHINY_SKY-.jpg)z
|
18
|
+
のoriginal file URLをクリックした(https://images.project-imas.wiki/e/ef/SOLO_COLLECTION_-1stLIVE_FLY_TO_THE_SHINY_SKY-.jpg)
|
19
|
+
ページの画像を保存したい
|
7
20
|
|
21
|
+
##### Error
|
22
|
+
```
|
23
|
+
Traceback (most recent call last):
|
24
|
+
File "C:\Users\yw325\Desktop\Main.py", line 14, in <module>
|
25
|
+
if d.startswith("http") and (d.endswith("jpg") or d.endswith("png")):
|
26
|
+
AttributeError: 'NoneType' object has no attribute 'startswith'
|
8
27
|
|
9
|
-
欲しい画像のURL: https://project-imas.wiki/File:CM_3Chord_for_the_Rock!.jpg
|
10
|
-
|
11
|
-
このページ(https://project-imas.wiki/THE_IDOLM@STER_CINDERELLA_MASTER_3chord_for_the_Rock!)
|
12
|
-
の画像をクリックした
|
13
|
-
このURL(https://project-imas.wiki/File:CM_3Chord_for_the_Rock!.jpg)
|
14
|
-
|
28
|
+
```
|
15
29
|
|
16
30
|
参考サイト: http://arduinopid.web.fc2.com/R19.html
|
17
31
|
```py
|
18
32
|
from bs4 import BeautifulSoup
|
19
33
|
import requests
|
20
34
|
img_list = []
|
21
|
-
url = 'https://project-imas.wiki/THE_IDOLM@STER_
|
35
|
+
url = 'https://project-imas.wiki/THE_IDOLM@STER_SHINY_COLORS_SOLO_COLLECTION_-1stLIVE_FLY_TO_THE_SHINY_SKY-' # 任意のurlを指定
|
22
36
|
url_cont = BeautifulSoup(requests.get(url).content,'lxml') # url解析
|
37
|
+
#img_all = url_cont.find("meta") # imgタグ情報を取得
|
23
|
-
img_all = url_cont.find_all("
|
38
|
+
img_all = url_cont.find_all("meta") # imgタグ情報を取得
|
39
|
+
|
40
|
+
|
41
|
+
|
24
42
|
|
25
43
|
for d in img_all: # imgタグ情報を一つずつ抽出
|
26
|
-
d = d.get("
|
44
|
+
d = d.get("content") # src情報を取得
|
27
45
|
if d.startswith("http") and (d.endswith("jpg") or d.endswith("png")):
|
46
|
+
print(d);
|
28
47
|
img_list.append(d) # srcの末尾が.jpgか.pngの場合リストに追加
|
48
|
+
|
49
|
+
|
50
|
+
|
51
|
+
|
29
52
|
|
30
53
|
for img_data in img_list: # 画像データをファイルに保存
|
31
54
|
with open(img_data.split('/')[-1], 'wb') as f:
|
32
55
|
f.write(requests.get(img_data).content) # ファイル保存
|
56
|
+
|
33
57
|
print(img_data.split('/')[-1]) # 保存ファイル名出力
|
58
|
+
|
59
|
+
|
60
|
+
|
61
|
+
|
62
|
+
"""
|
63
|
+
url_image = BeautifulSoup(requests.get(img_list[0]).content,'lxml') # url解析
|
64
|
+
|
65
|
+
|
66
|
+
for img_data in img_list: # 画像データをファイルに保存
|
67
|
+
with open(img_data.split('/')[-1], 'wb') as f:
|
68
|
+
f.write(requests.get(url_image).content) # ファイル保存
|
69
|
+
|
70
|
+
print(img_data.split('/')[-1]) # 保存ファイル名出力
|
71
|
+
"""
|
34
72
|
|
35
73
|
```
|
36
74
|
|