質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.49%
NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

7385閲覧

連続したjsonをpandasのDataFrameに変換したい

kaitotokai

総合スコア59

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2018/07/04 09:29

編集2018/07/04 09:44

連続したjsonをpandasのDataFrameに変換したい

{"name":"Tom","age":"29","Type":"A","ADRESS":["W","E"], "MAJOR": ["A", "B", "C", "D", "E"]}} {"name":"Juddy","age":"25","Type":"B","ADRESS":"Q", "MAJOR": ["A", "B", "C", "D", "E"]}} {"name":"John","age":"9","Type":"O","ADRESS":["M","P","C"], "MAJOR": ["A", "B", "C", "D", "E"]}}

というjsonがあります。この連続したjsonをpandasのDataFrameに変換したいです。

import pandas as pd import numpy as np import json decoder = json.JSONDecoder() f = open('data.json', 'r') for line in f.readlines(): data = decoder.decode(line)   df = pd.DataFrame(data)

とコードを書いて実行すると、
ValueError: arrays must all be same length
とエラーが出ました。Tracebackには

--------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-8-bfb39aca863a> in <module>() 3 for line in f.readlines(): 4 data = decoder.decode(line) ----> 5 df = pd.DataFrame(data) ~/anaconda3/lib/python3.6/site-packages/pandas/core/frame.py in __init__(self, data, index, columns, dtype, copy) 328 dtype=dtype, copy=copy) 329 elif isinstance(data, dict): --> 330 mgr = self._init_dict(data, index, columns, dtype=dtype) 331 elif isinstance(data, ma.MaskedArray): 332 import numpy.ma.mrecords as mrecords ~/anaconda3/lib/python3.6/site-packages/pandas/core/frame.py in _init_dict(self, data, index, columns, dtype) 459 arrays = [data[k] for k in keys] 460 --> 461 return _arrays_to_mgr(arrays, data_names, index, columns, dtype=dtype) 462 463 def _init_ndarray(self, values, index, columns, dtype=None, copy=False): ~/anaconda3/lib/python3.6/site-packages/pandas/core/frame.py in _arrays_to_mgr(arrays, arr_names, index, columns, dtype) 6161 # figure out the index, if necessary 6162 if index is None: -> 6163 index = extract_index(arrays) 6164 else: 6165 index = _ensure_index(index) ~/anaconda3/lib/python3.6/site-packages/pandas/core/frame.py in extract_index(data) 6209 lengths = list(set(raw_lengths)) 6210 if len(lengths) > 1: -> 6211 raise ValueError('arrays must all be same length') 6212 6213 if have_dicts:

と出ました。

  name age Type 0 Tom 29 A 1 Juddy 25 B 2 John 9 O

という形のDataFrameを作りたいです。何が問題でどうコードを修正すればいいでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

以下のようにpandas.read_jsonにうまく適合させたjson文字列を作りこんでやれば一発でできます。

Python

1with open('data.json','r') as f: 2 js = '[' + ','.join(f) + ']' 3 print(js) 4 5import pandas as pd 6df = pd.read_json(js,orient='records') 7print(df)

なお、data.json

PlainText

1{"name":"Tom","age":"29","Type":"A","ADRESS":["W","E"]} 2{"name":"Juddy","age":"25","Type":"B","ADRESS":"Q"} 3{"name":"John","age":"9","Type":"O","ADRESS":["M","P","C"]}

PlainText

1{"name":"Tom", "age":"29","Type":"A","ADRESS":["W","E"], "MAJOR": ["A", "B", "C", "D", "E"]} 2{"name":"Juddy","age":"25","Type":"B","ADRESS":["Q"], "MAJOR": ["A", "B", "C", "D", "E"]} 3{"name":"John", "age":"9","Type":"O","ADRESS":["M","P","C"], "MAJOR": ["A", "B", "C", "D", "E"]}

のような内容を想定しています。

投稿2018/07/04 09:47

編集2018/07/04 09:54
can110

総合スコア38256

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kaitotokai

2018/07/04 09:58

ありがとうございます。print(df)で出力された結果は、テーブル形式ではないのですが、これでpandasのDataFrameに変換できるという認識で合っていますか?
can110

2018/07/04 10:00

df がどんなものであるかは、print(type(df)) や print(df.info()) で確認できます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.49%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問