###前提・実現したいこと
お世話になります。
jsonファイルを読み込んでデータフレームに代入して、重複削除をしたいと思っています。
ディレクトリの中には、次のようなjsonファイルが沢山あります。
// 0001.json {"machine":"A3","times":1494824607024}
"machine"は稼働した機械の名称。"times"にはその時の時間がUNIX時間で入っています。
システムの都合上(謎の仕様上)、ファイル名が違うのに、同じ機械名称と同じ時間が混じってしまいます。なのでファイルを連結した際に重複データを削除したいと思っています。
###試したこと・該当のソースコード・エラーメッセージ
以下のように書いてみました。
Python
1import pandas as pd 2import glob 3 4files = glob.glob('2A/*.json') 5df_dic = pd.concat( 6(pd.read_json(f) 7for f in files)).sort_values(by=["time"], ascending=True) 8 9# 無理やりデータフレームに変換してみた 10df= pd.DataFrame.from_dict(df_dic) 11 12print(df.drop_duplicates())
これを動かすと次のようなメッセージが出てきます。
File "pandas\src\hashtable_class_helper.pxi", line 843, in pandas.hashtable.PyObjectHashTable.get_labels (pandas\hashtable.c:15447) TypeError: unhashable type: 'dict'
jsonファイルを読み込んで重複削除を行うにはどうしたら良いのでしょうか?ネットを調べてもそれらしい情報を見つけられなかったので質問させていただきました。
お手数ですがご教示願います。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/05/26 01:41
2017/05/26 02:29
2017/05/26 04:12
2017/05/26 04:52
2017/05/26 05:27