質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
JSON

JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

データ構造

データ構造とは、データの集まりをコンピュータの中で効果的に扱うために、一定の形式に系統立てて格納する形式を指します。(配列/連想配列/木構造など)

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

2782閲覧

JSONファイルをPythonで分析

justyum

総合スコア7

JSON

JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

データ構造

データ構造とは、データの集まりをコンピュータの中で効果的に扱うために、一定の形式に系統立てて格納する形式を指します。(配列/連想配列/木構造など)

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/04/01 10:01

json形式のファイルをPythonに取り込んで分析の練習をしています。

データは約400行あり、製造年ごとの("car_year") 出荷台数("total_sales")を合計しようと思っています。

各行の製造年は重複するものが多々あり、例えば2006年なら、それぞれの出荷台数を合計し("total_shipped")

他の年と比較、最も合計出荷台数の多かった年を知る("max_year")コードを書きたいです。

上記に書いた変数にこだわりはありません。どのように計算すれば良いかご教授下さいます様、お願い申し上げます。

json

1[{"id":1,"car":{"car_make":"GMC","car_model":"Savana 2500","car_year":2006},"price":"$8002.17","total_sales":512}, 2 3{"id":2,"car":{"car_make":"Audi","car_model":"5000CS Quattro","car_year":1986},"price":"$11245.20","total_sales":312}, 4. 5. 6. 7. 8{"id":399,"car":{"car_make":"Dodge","car_model":"Ramcharger","car_year":1998},"price":"$13158.17","total_sales":852}]

★以下の形式で出力したい。

python

1output = ["最も車販売台数が多かったのは、{}年で合計 {}台でした。".format("max_year", "total_shipped")]

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

fiveHundred

2020/04/01 10:15 編集

まずは自分で調べてみましょう。 JSONの内容を取得する方法は、普通に検索すれば出てくるような内容ですし、それで取得した内容を数値に変換して計算すればいいだけの話です。 もし、調べた上で分からないのであれば、以下を参考に、どこが分からないのかを明確にして質問文に追記してください。 https://teratail.com/help/question-tips
tiitoi

2020/04/01 10:14 編集

car_year ごとに total_sales を合計し、その値が一番多い car_year を見つけるということでよろしかったですか?(メーカーや車種は今回は関係ない?)
justyum

2020/04/01 10:23

@tiitoi さん その通りでございます。メーカーや車種も違った分析をしているのですが、今回ここで質問しているのはtotal_salesの合計 total_shipped と、car_year との求め方です。
guest

回答1

0

ベストアンサー

データ分析する際に json のままだと扱いづらいので、DataFrame で表データにするといいと思います。
DataFrame にしたら、年ごとに集計し、出荷数が最大の年を取得します。

python

1import json 2import pandas as pd 3 4text = """[ 5 { 6 "id": 1, 7 "car": {"car_make": "GMC", "car_model": "Savana 2500", "car_year": 2006}, 8 "price": "$8002.17", 9 "total_sales": 512 10 }, 11 { 12 "id": 2, 13 "car": {"car_make": "Audi", "car_model": "5000CS Quattro", "car_year": 1986}, 14 "price": "$11245.20", 15 "total_sales": 312 16 } 17]""" 18 19# json を読み込む。 20j = json.loads(text) 21 22# DataFrame に変換する。 23data = [] 24for row in j: 25 data.append( 26 ( 27 row["id"], 28 row["car"]["car_make"], 29 row["car"]["car_model"], 30 row["car"]["car_year"], 31 row["price"], 32 row["total_sales"], 33 ) 34 ) 35 36data = pd.DataFrame(data, columns=["Id", "Maker", "Model", "Year", "Price", "Sales"]) 37 38# 年ごとにグループ化し、合計を計算する。 39sales = data.groupby("Year").sum() 40 41# 出荷数が最大の年を取得する。 42max_year = sales["Sales"].idxmax() 43# その年の出荷数を取得する。 44total_shipped = sales.loc[max_year, "Sales"] 45 46print(f"最も車販売台数が多かったのは、{max_year}年で合計{total_shipped}台でした。") 47# 最も車販売台数が多かったのは、2006年で合計 512台でした。

投稿2020/04/01 10:45

tiitoi

総合スコア21956

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

justyum

2020/04/01 11:11

Pandas については殆ど未だ知識がないのですが、期待していた値を抽出することができました。 物凄く短時間で、簡潔かつ寧帝なコードをご教授くださいましてありがとうございました。 jsonのまま色々と試して悪戯に数日も過ぎてしまって・・・。 自分もこういう風なコードを、いつか書けるように頑張ります。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問