teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

4

xz

2023/09/24 16:30

投稿

lilliveon
lilliveon

スコア9

title CHANGED
File without changes
body CHANGED
@@ -61,7 +61,7 @@
61
61
  ### 試したこと
62
62
  調べてみた結果、Seleniumを使うと実現できるのではないかと思いました。ですが、その場合は動作が遅くなるデメリットがあるためできるだけ使用したくありません。
63
63
 
64
- 加えて、開発者ツールを除いてみると、擬人化の作品ページには下の写真のような黄色で示してある部分がありました。ですがその部分はrenposeで解析したhtmlにはなかったため、対処ができないという状態です。
64
+ 加えて、開発者ツールを除いてみると、擬人化の作品ページには下の写真のような黄色で示してある部分がありました。ですがその部分はrenposeで解析したhtmlにはなかったため、find等で認識ができないという状態です。
65
65
 
66
66
  ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-09-25/bbc019da-97d7-4e3e-87e9-27591c6fa6aa.png)
67
67
 

3

ごじていせい

2023/09/24 16:28

投稿

lilliveon
lilliveon

スコア9

title CHANGED
File without changes
body CHANGED
@@ -60,6 +60,7 @@
60
60
 
61
61
  ### 試したこと
62
62
  調べてみた結果、Seleniumを使うと実現できるのではないかと思いました。ですが、その場合は動作が遅くなるデメリットがあるためできるだけ使用したくありません。
63
+
63
64
  加えて、開発者ツールを除いてみると、擬人化の作品ページには下の写真のような黄色で示してある部分がありました。ですがその部分はrenposeで解析したhtmlにはなかったため、対処ができないという状態です。
64
65
 
65
66
  ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-09-25/bbc019da-97d7-4e3e-87e9-27591c6fa6aa.png)

2

ついか

2023/09/24 16:27

投稿

lilliveon
lilliveon

スコア9

title CHANGED
File without changes
body CHANGED
@@ -60,8 +60,10 @@
60
60
 
61
61
  ### 試したこと
62
62
  調べてみた結果、Seleniumを使うと実現できるのではないかと思いました。ですが、その場合は動作が遅くなるデメリットがあるためできるだけ使用したくありません。
63
- JavaScriptの動作が関係しいるのではと思いましたがJavaScriptの知識が全くなく、開発者ツールで見てみてもソスコードがあにも多い&複雑ぎて見当ません
63
+ 加えて、開発者ツールを除いてみると、擬人化の作品ペジには下の写真のような黄色で示してある部分がありました。ですがその部分はrenposeで解析したhtmlにはなかったため、対処がでないという状態です
64
64
 
65
+ ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-09-25/bbc019da-97d7-4e3e-87e9-27591c6fa6aa.png)
66
+
65
67
  ### 補足情報(FW/ツールのバージョンなど)
66
68
  Python==3.11.5
67
69
  requests==2.31.0

1

ごじていせい

2023/09/24 16:10

投稿

lilliveon
lilliveon

スコア9

title CHANGED
@@ -1,1 +1,1 @@
1
- BeautifulSoupを用いたスクレイピングの画像収集条件の設定
1
+ BeautifulSoupを用いたスクレイピングの画像収集条件の設定が上手くできない
body CHANGED
@@ -13,9 +13,8 @@
13
13
  https://danbooru.donmai.us/posts/6619855?q=jolteon
14
14
  そしてまたnextクラスにある次のページのURLをrequestして作品を収集するというのを繰り返してスクレイピングを行います。
15
15
 
16
- そして、danbooruの特徴として、擬人化(?)である一部の作品は「Disable all」を押さないと表示されないようになっています。2つ目のURLの次のページは下記のURLであり、表示されない作品ページに該当いたします。
16
+ そして、danbooruの特徴として、擬人化(?)である一部の作品は、左上にある「Disable all」を押さないと表示されないようになっています。2つ目のURLの次のページは下記のURLであり、表示されない作品ページに該当いたします。
17
17
  https://danbooru.donmai.us/posts/6619346?q=jolteon
18
- この作品ページは左上にある「Disable all」を押すことで作品を表示できるようになります。
19
18
 
20
19
  その上で私のやりたいことは、3つ目のURLにあるような、擬人化されているため表示を制限されており「Disable all」を押さないといけない作品は収集しないように設定することです。現状のソースコードでは、表示を制限されている作品であろうとなかろうと収集してしまいます。
21
20