質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

254閲覧

変数に入っているテーブルの情報をcsvに書き込みしたい

k0908

総合スコア102

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2018/07/25 05:28

変数に入っているテーブルの情報をcsvに書き込みしたいです。
今data変数に

<table class=""> <tr> <th>名前</th> <th>年齢</th> </tr> <tr> <td>John</td> <td>33</td> </tr> </table>

というテーブルの情報が入っています。

f = open("user.csv", 'a') writer = csv.writer(f, lineterminator='\n') item = data.th.string user_list.append(item) writer.writerow(user_list) f.close()

とコードを書くと、user.csvに名前とだけ記入されました。

名前,年齢 John,33

とできれば見やすい形でcsvに出力したいのですが、
まずなぜthの1つの項目のみがcsvに記入されるのでしょうか?thの項目は2つあるので、2つの要素が書き込みされることを想定していました。

for i in item: user_item = i.th.string user_list.append(user_item)

とコードを書いてもうまくいかず、何も書き込まれませんでした。

どのようにコードを修正すればいいでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

BeautifulSoup4を使われているものとして回答します(コードは全文掲載していただけると助かります)。

まず

python

1item = data.th.string

についてですが
.thで指定すると一番先頭のものがひとつだけヒットします。

つまり、質問にあげられているhtmlファイルをもとに説明すると、

python

1soup = BeautifulSoup(html, "html.parser") 2 3print(soup.th) # 結果:<th>名前</th> 4print(soup.th.string) # 結果:名前

となります。

thタグの要素をすべて取得するにはfind_all()を利用します。

python

1soup = BeautifulSoup(html, "html.parser") 2 3th_elements = soup.find_all("th")

find_all()で返される値は <class 'bs4.element.ResultSet'> というオブジェクトでリストのように扱うことが出来ます(言い換えるとsoup.th.stringのように直接.stringを使うことは出来ません。)
よって、取得した各要素へアクセスするには

python

1for th_element in th_elements: 2 print(th_element)

とします。

tdタグの要素も同様に取得します。

csvファイルへの書き込みはthとtdの要素を2次元配列にして書き込めばよいです。

以下、サンプルのコードです。

python

1import csv 2 3from bs4 import BeautifulSoup 4 5target = """ 6<table class=""> 7<tr> 8<th>名前</th> 9<th>年齢</th> 10</tr> 11<tr> 12<td>John</td> 13<td>33</td> 14</tr> 15</table> 16""" 17 18soup = BeautifulSoup(target, "html.parser") 19 20header = [tag.string for tag in soup.find_all("th")] 21content = [tag.string for tag in soup.find_all("td")] 22 23output = [header, content] 24 25with open(file="tmp.csv", mode="w", encoding="utf-8") as f: 26 writer = csv.writer(f, lineterminator='\n') 27 writer.writerows(output) 28

投稿2018/07/25 06:55

crimnut

総合スコア380

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問