連続したjsonの値を取り出したい

Question

```ここに言語を入力
{"name":"Tom","age":"29","Type":"A"}
{"name":"Juddy","age":"25","Type":"B"}
{"name":"John","age":"9","Type":"O"}
```
とtest.jsonに書いてあります。

これらのnameの値（Tom・Juddy・John）やageの値（29・25・39）を配列に入れたいです。
```ここに言語を入力
import json

decoder = json.JSONDecoder()
f = open('test.json', 'r')
for line in f.readlines():
       data = decoder.decode(line)

for i in range(len(data)):
    print(data[i])
```

とコードを書いて実行すると、
```ここに言語を入力
builtins.KeyError
KeyError: 0
```
とエラーが出ました。
```ここに言語を入力
print(data[i])　
```で“name”:”Tom”や“name”:”Juddy”などの要素が取れて欲しかったです。

[”Tom”,”Juddy”,”John”]や[”29”,”25”,”39”]という配列を作りたいのですが、どのようにコードを修正すればいいのでしょうか？

Accepted Answer

> [”Tom”,”Juddy”,”John”]や[”29”,”25”,”39”]という配列を作りたいのですが

読込ループの中でリストに追加(.append())すればよいです。

```Python
# 略
names,ages = [],[]
for line in f.readlines():
    data = decoder.decode(line)
    print(data['name']) # Tomなど
    print(data['age'])  # 29など
    #namesに追加
    #agesに追加
```

Answer

dataはdictだからインデックスでアクセスすることはできない、という指摘はもう上がっていますが、そもそもJSONの連想配列もpythonのdictも、「n番目の要素」という形でアクセスしようとしても、順序不定でまともな結果は得られないのが普通です（処理系によっては順番を保持する実装もあるが）。

おまけですが、とりあえず簡単にdefaultdictに入れてみたコード。

```python
import json
from collections import defaultdict

txt = """{"name":"Tom","age":"29","Type":"A"}
{"name":"Juddy","age":"25","Type":"B"}
{"name":"John","age":"9","Type":"O"}"""

decoder = json.JSONDecoder()
result = defaultdict(list)
for line in txt.split("
"):
    for k,v in decoder.decode(line).items():
        result[k].append(v)

print(result)
print(result["name"])
print(result["age"])
print(result["Type"])

""" =>
defaultdict(<class 'list'>, {'name': ['Tom', 'Juddy', 'John'], 'Type': ['A', 'B', 'O'], 'age': ['29', '25', '9']})
['Tom', 'Juddy', 'John']
['29', '25', '9']
['A', 'B', 'O']
"""
```

Answer

もしかしたら、やりたい事はこういう事なのでしょうか？

```Python
import json

decoder = json.JSONDecoder()
data = []
with open('test.json', 'r') as f:
    for line in f.readlines():
        data.append(decoder.decode(line))

for d in data:
    print(d)
```

Answer

```
for line in f.readlines():
       data = decoder.decode(line)
```
↑これだと、「data」は最後の1行分しか残らないのでは？
それはそれとして、

```
for line in f.readlines():
       data = decoder.decode(line)
       print(data["name"])
```
↑これでJSONオブジェクトの「name」の値が取得可能。

仮に、「data」がうまく配列になっていたとしたら、
```
for i in range(len(data)):
    print(data[i]["name"])
```

↑これでいけるはず。

Answer

dataは辞書ですので、インデックスでアクセスできません。
```Python
for key in data:
    print(data[key])
```

このように書く分にはエラーは出ません。
読み込み時にdataを毎度上書きしてしまっているという別の問題がありますが。

---
目的を考えれば、データファイルの構造を変えてpandasで読み取るのが最終的には簡単かと。
```csv
name,age,type
Tom,29,A
Juddy,25,B
John,9,O
```

```Python
import pandas as pd

df = pd.read_csv('data.csv')
print(df)

names = df['name'].tolist()
print(names, type(names))
```

**実行結果**
```plain
    name   age  type
0    Tom    29     A
1  Juddy    25     B
2   John     9     O
['Tom', 'Juddy', 'John'] <class 'list'>
```

関連した質問