質問編集履歴

4

xz

2023/09/24 16:30

投稿

lilliveon
lilliveon

スコア9

test CHANGED
File without changes
test CHANGED
@@ -61,7 +61,7 @@
61
61
  ### 試したこと
62
62
  調べてみた結果、Seleniumを使うと実現できるのではないかと思いました。ですが、その場合は動作が遅くなるデメリットがあるためできるだけ使用したくありません。
63
63
 
64
- 加えて、開発者ツールを除いてみると、擬人化の作品ページには下の写真のような黄色で示してある部分がありました。ですがその部分はrenposeで解析したhtmlにはなかったため、対処ができないという状態です。
64
+ 加えて、開発者ツールを除いてみると、擬人化の作品ページには下の写真のような黄色で示してある部分がありました。ですがその部分はrenposeで解析したhtmlにはなかったため、find等で認識ができないという状態です。
65
65
 
66
66
  ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-09-25/bbc019da-97d7-4e3e-87e9-27591c6fa6aa.png)
67
67
 

3

ごじていせい

2023/09/24 16:28

投稿

lilliveon
lilliveon

スコア9

test CHANGED
File without changes
test CHANGED
@@ -60,6 +60,7 @@
60
60
 
61
61
  ### 試したこと
62
62
  調べてみた結果、Seleniumを使うと実現できるのではないかと思いました。ですが、その場合は動作が遅くなるデメリットがあるためできるだけ使用したくありません。
63
+
63
64
  加えて、開発者ツールを除いてみると、擬人化の作品ページには下の写真のような黄色で示してある部分がありました。ですがその部分はrenposeで解析したhtmlにはなかったため、対処ができないという状態です。
64
65
 
65
66
  ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-09-25/bbc019da-97d7-4e3e-87e9-27591c6fa6aa.png)

2

ついか

2023/09/24 16:27

投稿

lilliveon
lilliveon

スコア9

test CHANGED
File without changes
test CHANGED
@@ -60,7 +60,9 @@
60
60
 
61
61
  ### 試したこと
62
62
  調べてみた結果、Seleniumを使うと実現できるのではないかと思いました。ですが、その場合は動作が遅くなるデメリットがあるためできるだけ使用したくありません。
63
- JavaScriptが関係してのではと思いましたが、JavaScriptの知識が全く開発者ツール見てみてもソースコードがあまりにも多&複雑ぎて見当がつきません
63
+ 加えて、開発者ツールを除いてみると、擬人化の作品ページには下の写真のような黄色で示して部分がありました。ですその部分はrenposeで解析したhtmlにはかったため対処がきなという状態です。
64
+
65
+ ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-09-25/bbc019da-97d7-4e3e-87e9-27591c6fa6aa.png)
64
66
 
65
67
  ### 補足情報(FW/ツールのバージョンなど)
66
68
  Python==3.11.5

1

ごじていせい

2023/09/24 16:10

投稿

lilliveon
lilliveon

スコア9

test CHANGED
@@ -1 +1 @@
1
- BeautifulSoupを用いたスクレイピングの画像収集条件の設定
1
+ BeautifulSoupを用いたスクレイピングの画像収集条件の設定が上手くできない
test CHANGED
@@ -13,9 +13,8 @@
13
13
  https://danbooru.donmai.us/posts/6619855?q=jolteon
14
14
  そしてまたnextクラスにある次のページのURLをrequestして作品を収集するというのを繰り返してスクレイピングを行います。
15
15
 
16
- そして、danbooruの特徴として、擬人化(?)である一部の作品は「Disable all」を押さないと表示されないようになっています。2つ目のURLの次のページは下記のURLであり、表示されない作品ページに該当いたします。
16
+ そして、danbooruの特徴として、擬人化(?)である一部の作品は、左上にある「Disable all」を押さないと表示されないようになっています。2つ目のURLの次のページは下記のURLであり、表示されない作品ページに該当いたします。
17
17
  https://danbooru.donmai.us/posts/6619346?q=jolteon
18
- この作品ページは左上にある「Disable all」を押すことで作品を表示できるようになります。
19
18
 
20
19
  その上で私のやりたいことは、3つ目のURLにあるような、擬人化されているため表示を制限されており「Disable all」を押さないといけない作品は収集しないように設定することです。現状のソースコードでは、表示を制限されている作品であろうとなかろうと収集してしまいます。
21
20