前提・実現したいこと
【WEBページからテーブルデータを取得したい】
当方ドットインストールpythonコース受講中のプログラミング素人です。
https://www.chatzone.jp/
↑このサイトのテーブルデータを取得する為に
https://note.mu/daikawai/n/nc73889d6d835
↑このサイトを参考にコピペしながら書きました。
CSV出力までは出来ましたが、出力されたデータに問題がありました。
~~~~
02/24/2019ï¼æ¥ï¼
32ä½
5:52
0:00
5:51
99.7%
~~~~
↑6種類ずつのデータが並んであるのですが、
これが全て一つのセルにまとめられております。
出力する際に、分けて出力したいのですが、出来ません。
該当のソースコード
from bs4 import BeautifulSoup
import requests
import pandas as pd
from google.colab import files
html_doc = requests.get('https://www.chatzone.jp/pc/performer/dmm-acha/806438.html').text
soup = BeautifulSoup(html_doc, 'html.parser')
tags = soup.find_all('tr',{'class':'history_row_time 2019_02'})
for tag in tags:
print(tag.getText())
columns = ["a"]
df2 = pd.DataFrame(columns=columns)
for tag in tags:
a = tag.getText()
se = pd.Series([a], columns)
print(se)
df2 = df2.append(se, columns)
filename = "result.csv"
df2.to_csv(filename, encoding = 'utf-8-sig')
files.download(filename)
試したこと
a = tag.getText()
↑ここを
a = tag.getText()
b = tag.getText()
c = tag.getText()
d = tag.getText()
e = tag.getText()
↑こんな風に書いてみましたが、当然出力される列が複製されるだけでした。
同じ<td>タグで囲まれたデータをどのように分類すればいいのかがわかりません。
回答1件
あなたの回答
tips
プレビュー