質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

解決済

1回答

1189閲覧

Python for文でリストを順番にデータフレームに追加したい

SuzuAya

総合スコア71

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2021/04/17 07:19

編集2021/04/17 07:20

前提・実現したいこと

Webページからテーブルの内容を取得し、行ごとにリストにした後、データフレームへ追加し、以下のようなデータフレームを作りたいと思っています。
イメージ説明

しかし、今のコードですと、以下のようにリストの内容が同じ列にすべて含まれており、かつ、行と行の間に空白行が挿入されてしまいます。
イメージ説明

コードをどのように修正すればやりたいことが実現できるか、ご教示いただけないでしょうか。

該当のソースコード

Python

1from selenium import webdriver 2import pandas as pd 3 4new = browser.find_element_by_id("newOpportunities").find_elements_by_tag_name("tr") 5 6# ヘッダ行は除いて取得 7df_new = pd.DataFrame() 8for i in range(1,len(new)): 9 tds = new[i].find_elements_by_tag_name("td") 10 line = "" 11 for j in range(0,len(tds)): 12 if j < len(tds)-1: 13 line += "%s\t" % (tds[j].text) 14 else: 15 line += "%s" % (tds[j].text) 16 17 print(line)#+"\r\n") 18 df_elem = pd.Series(line, index=None) 19 df_new = df_new.append(df_elem, ignore_index=True)

補足情報(FW/ツールのバージョンなど)

参考にしたコードはこちらです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

SuzuAya

2021/04/19 00:16

>etherbeg様 情報共有ありがとうございます!試したところ、No Tables foundとエラーが出てしまいましたが、別のWebページから表を取得したい時に改めて試してみたいと思います!
guest

回答1

0

ベストアンサー

こういうのはいかがでしょうか。
split()で文字列のリスト化をしました。

python

1// newに値が取得された以降のみ 2 3a = [] 4for i in new: 5 a.append(i.text.split()) 6 7df_new = pd.DataFrame(data=a[1:], columns=a[0])

ヘッダ行が不要なら、columns=a[0]は削除して下さい。

投稿2021/04/17 09:23

Akihiro_py

総合スコア55

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

SuzuAya

2021/04/17 10:28

>Akihiro_tr様 ご回答ありがとうございます!!試してみたのですが、1つの要素の中に空白で区切られている 文字列(ABC coporationのように)も多々あり、それらが別の行とみなされてしまいました…。もう少し自分でも試行錯誤してみます!!
Akihiro_py

2021/04/17 14:28 編集

確かにそれは困りますね、、、 ではこんな感じに、tdタグで切ってみるのは如何でしょうか? //うまくインデントができないので、__がインデントがわりです // newに値が取得された以降のみ a = [] for i in new[1:]: __temp = [] __for j in i.find_elements_by_tag_name("td"): ____temp.append(j.text) __a.append(temp) df_new = pd.DataFrame(data=a) 自分の勉強がてらの回答なので、もし不備不明点あればどしどしお願いします。
SuzuAya

2021/04/19 00:03 編集

>Akihiro_tr様 再度ご回答いただき、ありがとうございます!ご提案いただいた通りtdタグで区切ってみたところうまくいきました!!大変助かりました。ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問