前提・実現したいこと
Webページからテーブルの内容を取得し、行ごとにリストにした後、データフレームへ追加し、以下のようなデータフレームを作りたいと思っています。
しかし、今のコードですと、以下のようにリストの内容が同じ列にすべて含まれており、かつ、行と行の間に空白行が挿入されてしまいます。
コードをどのように修正すればやりたいことが実現できるか、ご教示いただけないでしょうか。
該当のソースコード
Python
1from selenium import webdriver 2import pandas as pd 3 4new = browser.find_element_by_id("newOpportunities").find_elements_by_tag_name("tr") 5 6# ヘッダ行は除いて取得 7df_new = pd.DataFrame() 8for i in range(1,len(new)): 9 tds = new[i].find_elements_by_tag_name("td") 10 line = "" 11 for j in range(0,len(tds)): 12 if j < len(tds)-1: 13 line += "%s\t" % (tds[j].text) 14 else: 15 line += "%s" % (tds[j].text) 16 17 print(line)#+"\r\n") 18 df_elem = pd.Series(line, index=None) 19 df_new = df_new.append(df_elem, ignore_index=True)
補足情報(FW/ツールのバージョンなど)
参考にしたコードはこちらです。
回答1件
あなたの回答
tips
プレビュー