python3 BS4 find_all で
をスタイル（width)で判別、見出しと値の辞書を作成するには

Question

Python3 beautiful soup4 で　スクレイピングしているのですが IDが元ソースに付与されておらず、取得したい部分が

ばかりで、またページにより　項目数

の数が変わるので、決まった値を取得するのに難航しています。唯一　　styleでwidth　40　width60　とで　見出しと値が対になって判別できる為これを見出しと値を　対にして　辞書型にすれば解決できるのではと思いました。 ```html

見出し1
値1
見出し2
値2
見出し3
値3
見出し4
値4
見出し5
値5

```

タグではなくテーブルタグ　で見出しと値が対になっている場合は　下記方法でできるので、これを応用して

のスタイル　width 40 width 60％　で判別してできないかと考えたのですが・・ ```HTML　thとtdが見出しと値で対になっている場合はできる dict={} for tag in soup.find_all(['th', 'td']): if tag.name == 'th': key = tag.get_text() elif tag.name == 'td': dict[key] = tag.get_text() ``` おなじようにliタグのスタイル　　width　40　or　width60　　で判別して見出し　と値で辞書にしたいですやってみたこと ```Python dict={} for tag in soup.find_all([('li',style="width: 40%;"), ('li',style="width: 60%;")]): if tag.name == ('li',style="width: 40%;"): key = tag.get_text() elif tag.name == ('li',style="width: 60%;"): dict[key] = tag.get_text() ``` if tag.name == ('li',style.value'width: 40%;'): ^ SyntaxError: invalid syntax ```python dict={} for tag in soup.find_all([soup.find_all('li' ,style=lambda value: value and 'width: 40%;' in value and 'width: 60%;' in value)]): if tag.name == ('li',style.value'width: 40%;'): key = tag.get_text() elif tag.name == ('li',style="width: 60%;"): dict[key] = tag.get_text() ``` エラー内容 File "", line 3 if tag.name == ('li',style.value'width: 40%;'): ^ SyntaxError: invalid syntax ##この方法に拘っていませんが・・ ※参照元ページは各ページで　

の数が異なるのでsoul.select でCSSセレクターで取得すると、各ページで変数に入る値が異なるので、見出しをキーにして値を取り出したいです

Accepted Answer

```python
	patternA = 'width: 40%;'
	patternB = 'width: 60%;'

	lst = soup.find_all('li')
	for element in lst:
		if element.get('style') == patternA:
			# patternAだった場合の処理
		elif element.get('style') == patternB:
			# patternBだった場合の処理
```

	`.find_all()`を使用する際にオプションでstyleを指定してあげても良いでしょうが
	上記の様にまずはli要素を取得してから、for文でstyle属性を検証していく手もあるでしょう。


	> ※参照元ページは各ページで　<li>の数が異なるのでsoul.select でCSSセレクターで取得すると、各ページで変数に入る値が異なるので、見出しをキーにして値を取り出したいです


	どの様なページなのかはわかりませんがコツとしては
	li要素から探すよりも、そもそもそれらul要素を包み込んでいる
	大元にある要素や属性を指定していくと余計なli要素を拾わず対象の要素だけを検証出来るでしょう。

Answer

- Syntax Errorの原因

('li',style="width: 40%;")

というtupleの後ろの要素のところに代入式を書いていることです。

理由
tupleと、関数などの呼び出しに与える引数リストは別物です。
引数リストの場合、name=argumentと書けますが、これはキーワード付引数です。

- 見出しをキーにして値を取り出したいです


htmlを使う場合、構造を意識した書き方もあれば、表現を意識した書き方もあります。
テーブルタグを使ったものは構造を意識したhtmlですのでBeautifulSoupで処理しやすいですが、今回の場合のように構造を意識しない書き方の場合にはBeautifulSoupで処理するのは難しいでしょう。

[Pythonで一次元配列を二次元配列に変換（numpy.ndarray、リスト）](https://note.nkmk.me/python-list-ndarray-1d-to-2d/) を参考にして考えてみてください。

python3 BS4 find_all で<li>をスタイル（width)で判別、見出しと値の辞書を作成するには

関連した質問