変数に入っているテーブルの情報をcsvに書き込みしたい

Question

変数に入っているテーブルの情報をcsvに書き込みしたいです。今data変数に ```ここに言語を入力

名前	年齢
John	33

``` というテーブルの情報が入っています。 ```ここに言語を入力 f = open("user.csv", 'a') writer = csv.writer(f, lineterminator=' ') item = data.th.string user_list.append(item) writer.writerow(user_list) f.close() ``` とコードを書くと、user.csvに名前とだけ記入されました。 ```ここに言語を入力名前,年齢 John,33 ``` とできれば見やすい形でcsvに出力したいのですが、まずなぜthの１つの項目のみがcsvに記入されるのでしょうか？thの項目は２つあるので、２つの要素が書き込みされることを想定していました。 ```ここに言語を入力 for i in item: user_item = i.th.string user_list.append(user_item) ``` とコードを書いてもうまくいかず、何も書き込まれませんでした。どのようにコードを修正すればいいでしょうか？

Accepted Answer

BeautifulSoup4を使われているものとして回答します（コードは全文掲載していただけると助かります）。

まず

python
1item = data.th.string

についてですが
.thで指定すると一番先頭のものがひとつだけヒットします。

つまり、質問にあげられているhtmlファイルをもとに説明すると、

python
1soup = BeautifulSoup(html, "html.parser")
2
3print(soup.th) # 結果：<th>名前</th>
4print(soup.th.string) # 結果：名前

となります。

thタグの要素をすべて取得するにはfind_all()を利用します。

python
1soup = BeautifulSoup(html, "html.parser")
2
3th_elements = soup.find_all("th")

find_all()で返される値は <class 'bs4.element.ResultSet'> というオブジェクトでリストのように扱うことが出来ます（言い換えるとsoup.th.stringのように直接.stringを使うことは出来ません。）
よって、取得した各要素へアクセスするには

python
1for th_element in th_elements:
2    print(th_element)

とします。

tdタグの要素も同様に取得します。

csvファイルへの書き込みはthとtdの要素を2次元配列にして書き込めばよいです。

以下、サンプルのコードです。

python
1import csv
2
3from bs4 import BeautifulSoup
4
5target = """
6<table class="">
7<tr>
8<th>名前</th>
9<th>年齢</th>
10</tr>
11<tr>
12<td>John</td>
13<td>33</td>
14</tr>
15</table>
16"""
17
18soup = BeautifulSoup(target, "html.parser")
19
20header = [tag.string for tag in soup.find_all("th")]
21content = [tag.string for tag in soup.find_all("td")]
22
23output = [header, content]
24
25with open(file="tmp.csv", mode="w", encoding="utf-8") as f:
26    writer = csv.writer(f, lineterminator='\n')
27    writer.writerows(output)
28

名前	年齢
John	33

""" soup = BeautifulSoup(target, "html.parser") header = [tag.string for tag in soup.find_all("th")] content = [tag.string for tag in soup.find_all("td")] output = [header, content] with open(file="tmp.csv", mode="w", encoding="utf-8") as f: writer = csv.writer(f, lineterminator=' ') writer.writerows(output) ```