質問編集履歴

3

説明追加

2021/07/22 02:20

投稿

dub
dub

スコア24

test CHANGED
File without changes
test CHANGED
@@ -7,6 +7,8 @@
7
7
  唯一  styleでwidth 40 width60 とで 見出しと値が対になって判別できる為
8
8
 
9
9
  これを見出しと値を 対にして 辞書型にすれば解決できるのではと思いました。
10
+
11
+
10
12
 
11
13
  ```html
12
14
 
@@ -119,3 +121,9 @@
119
121
  ^
120
122
 
121
123
  SyntaxError: invalid syntax
124
+
125
+
126
+
127
+ ##この方法に拘っていませんが・・
128
+
129
+ ※参照元ページは各ページで <li>の数が異なるのでsoul.select でCSSセレクターで取得すると、各ページで変数に入る値が異なるので、見出しをキーにして値を取り出したいです

2

verを追加

2021/07/22 02:20

投稿

dub
dub

スコア24

test CHANGED
@@ -1 +1 @@
1
- python BS4 find_all で<li>をスタイル(width)で判別、見出しと値の辞書を作成するには
1
+ python3 BS4 find_all で<li>をスタイル(width)で判別、見出しと値の辞書を作成するには
test CHANGED
@@ -1,4 +1,4 @@
1
- Python beautiful soup4 で スクレイピングしているのですが
1
+ Python3 beautiful soup4 で スクレイピングしているのですが
2
2
 
3
3
  IDが元ソースに付与されておらず、取得したい部分が<li> </li>ばかりで、またページにより 項目数<li>の数が変わるので、決まった値を取得するのに難航しています。
4
4
 
@@ -6,7 +6,7 @@
6
6
 
7
7
  唯一  styleでwidth 40 width60 とで 見出しと値が対になって判別できる為
8
8
 
9
- これを見出しと値を 対にして 辞書にしたいです
9
+ これを見出しと値を 対にして 辞書すれば解決できるのではと思いました
10
10
 
11
11
  ```html
12
12
 

1

説明を詳しくしました

2021/07/22 01:28

投稿

dub
dub

スコア24

test CHANGED
File without changes
test CHANGED
@@ -4,7 +4,7 @@
4
4
 
5
5
 
6
6
 
7
- 唯一  styleでwidth 40 width60 とで 見出しと値が対になって判別できます
7
+ 唯一  styleでwidth 40 width60 とで 見出しと値が対になって判別できる為
8
8
 
9
9
  これを見出しと値を 対にして 辞書にしたいです
10
10
 
@@ -42,9 +42,9 @@
42
42
 
43
43
 
44
44
 
45
- これを テーブルタグ場合は 下記方法でできるのですが・・
45
+ <li><li>タグではなくテーブルタグ <th></th> <tr></tr>で見出しと値が対になっている場合は 下記方法でできるので、これを応用して<li>のスタイル width 40 width 60% で判別してできないかと考えたのですが・・
46
46
 
47
- ```HTML
47
+ ```HTML thとtdが見出しと値で対になっている場合はできる
48
48
 
49
49
  dict={}
50
50