質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.77%

jsonファイルをDataFrame型で出力できない

受付中

回答 0

投稿

  • 評価
  • クリップ 0
  • VIEW 420

masaking

score 30

Personly Insights
で取得したjsonファイルを、DataFrame型で出力しようとしたところエラーが出ます。

import pandas as pd
import json
from pandas import Series, DataFrame, read_csv, read_json

Big5=open('Big5.json')
df=pd.read_json(Big5)

と入力したところ、

のようにエラーメッセージが出ました。
(JupyterLab上でエラ〜メッセージをコピーしようとしたのですが、なぜかcopy cellsとしか選択肢が出ずに、コピーできなかったため、画像ファイルで提示しました。ご面倒おかけします。)

おそらく列数がデータによって違うのが原因ということはわかりました。

pandasの説明

を見ているのですが、どうすれば読み込めるのかわからないです。

お知恵を拝借願えますでしょうか。

ファイルの置き場所は、Big5 と打ち込むと、

<_io.TextIOWrapper name='Big5.json' mode='r' encoding='UTF-8'>

と出ることから、間違いないと思います。
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正の依頼

  • NCC1701

    2019/11/15 10:50 編集

    "personality"キーの値が配列[]になっていて、さらにその中には"children"キーの値が配列になっていますね。つまりデータ構造が3次元以上になってしまっています。DataFrameは2次元のいわゆるテーブル型なので変換できずエラーになるのです。
    DataFrameへ変換する前に、Big5を1キーの値が1カラムに対応するように処理をしなければなりません。しかも自力で。(もしかしたら探せばライブラリ・モジュールがあるかもしれません)
    最初の例だとjson={"children":["Ann","Bob","Carol"]}をjson2={"children1":"Ann","children2":"Bob","children3":"Carol"}のように構造をテーブル型にするイメージです。
    変換後の最終的なdfがどのようなカラム名とインデックス名でのテーブルになるのかのイメージに合わせてjsonを変形してみてください

    キャンセル

  • masaking

    2020/01/20 23:22 編集

    お返事ありがとうございます。
    あれから勉強して、多少は何が原因なのか分かるようになりました。
    jsonファイルに対して、
    df = json_normalize(data=Big5data, record_path='personality')
    することで、personalityキーの入れ子を解除することはできたのですが、同じようにchidrenを解除しようとするとエラーが出ます。

    TypeError: string indices must be integers

    と出るのですが、stringに変えた覚えはないし、何をintegerにすれば良いのかよくわかりません。
    あともう一歩なので、お知恵を拝借できないでしょうか。
    なお、jsonファイルについては、personalityの部分以外は、変形というか、カットしています。

    キャンセル

  • NCC1701

    2020/01/26 21:12

    `TypeError: string indices must be integers`
    エラーの内容が変化したので、別立てにして改めて質問し直した方が良いです。

    キャンセル

まだ回答がついていません

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.77%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る