データフレームをリストにする際のエラー

前提・実現したいこと

Jupyter notebookでcsvファイルを読み込み、データフレームにした後、
リストにしようとしています。

発生している問題・エラーメッセージ

現在のコードだと、dfの一覧でcsvファイルの最初から100件は出力されるのですが、
リスト（word_list）には1件目のみ格納されおり、リストに100件は格納されていません。
どのようにコードを修正すべきでしょうか。

出力

['apple']

該当のソースコード

python
1import pandas as pd
2df = pd.read_csv('sample.csv', nrows=100)
3df
4
5for word in df:
6    word_list = list(df)
7word_list

試したこと

len(df)とした場合、以下のエラーが出てしまいました。

python
1for word in　len(df):
2    word_list = list(df)
3word_list

エラー文

  File "<ipython-input-9-329d22c0d470>", line 1
    for word in　len(f):
               　  ^
SyntaxError: invalid character in identifier

ご回答を受けてお聞きしたいこと

python
1import csv
2word_list = [line.strip() for line in open('sample.csv', 'r').readlines()]
3word_list[0] = word_list[0].lstrip('\ufeff')
4word_list

csvモジュールを使うと上記の方法もあるとは思いますが、
最初から100件のデータのみ取得したい場合にモジュールを使って
どのように書けばいいか分からないです。

また、

['apple', 'cherry', 'orange']

のようなリストにしたいのですが、

lst = df.values.tolist()
lst.insert(0, df.columns.values.tolist())

ですと、

[['apple'], ['cherry'], ['orange']]

という二重リストで出力される状況で、どうすればいいかわからないです。

補足情報（FW/ツールのバージョンなど）

python 3.6

KojiDoi

2018/07/13 02:45

ｆがどこにも定義されていないようですが、本当に正しくコードを提示できていますか？

退会済みユーザー

2018/07/13 04:38

確認不足でした。申し訳ございません。

行動規範の内容に同意します

回答1件

ベストアンサー

list(df)はキーのリストになります。

python
1lst = df.values.tolist()

で値のリストが得られます。indexは要らないのだと思いますが、columnsはほしいかもしれないので

python
1lst = df.values.tolist()
2lst.insert(0, df.columns.values.tolist())

なんか無理矢理っぽいけど、入れることはできます。

参考：
pandas.DataFrame, SeriesとPython標準のリストを相互に変換 | note.nkmk.me

SyntaxError: invalid character in identifierについて

inとlenの間に全角スペースが入っているせい。

pandasのデータフレームがいらないのなら、標準ライブラリのcsvモジュールという手もあります。

14.1. csv --- CSV ファイルの読み書き — Python 3.6.6 ドキュメント

投稿2018/07/13 02:42

hayataka2049

総合スコア30933

退会済みユーザー

2018/07/13 04:45

ご回答ありがとうございます。ご回答を受けてお聞きしたいこととして、質問に標準ライブラリのcsvモジュールを使った方法について追記致しました。お手数ですが、こちらに関しても伺えますと幸いです。

hayataka2049

2018/07/13 04:51

結果のリストをスライスすれば良いのではないでしょうか。本当に計算機資源がシビアなら、for＋readlineで回して途中でbreakするのも手です

退会済みユーザー

2018/07/13 09:45

ありがとうございました。解決いたしました。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！