以下の様なPandas.DataFrameを持っていたとします。
lang
1import pandas as pd 2example = [ 3 {"ID":0, "text":["May", "the", "force", "be", "with", "you"]}, 4 {"ID":1, "text":["Do", "or", "Do", "not", "there", "is", "no", "try"]}, 5 {"ID":2, "text":["Star", "wars", "episode", "7"]} 6] 7dataframe = pd.DataFrame(example) 8>>Out: 9 ID text 100 0 [May, the, force, be, with, you] 111 1 [Do, or, Do, not, there, is, no, try] 122 2 [Star, wars, episode, 7]
このデータフレームから各カラムを抽出してnumpy.arrayに型変換するのは、以下の手順で行なうことが可能です。
lang
1import numpy as np 2np.array(dataframe["ID"]) 3>>Out: array([0, 1, 2]) 4np.array(dataframe["text"][0]) 5>>Out: ['May', 'the', 'force', 'be', 'with', 'you']
しかし、このデータフレームを一旦保存してから取得しようとすると上手く行きません。
lang
1dataframe.to_csv("dataframe.tsv", sep="\t", index=None) 2dataframe_load = pd.readc_csv("data_frame.tsv", sep="\t") 3np.array(dataframe_load["text"][0]) 4>>Out: "['May', 'the', 'force', 'be', 'with', 'you']"
一旦保存することで、DataFrameのうち、Nestされた部分は配列ではなく、文字列として扱われてしまうようです。これには何か解決策はあるでしょうか?
宜しくお願い致します。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2015/12/24 15:22