質問編集履歴

1

コードの追加、ファイルの説明

2019/03/31 12:20

投稿

1mzmk
1mzmk

スコア42

test CHANGED
File without changes
test CHANGED
@@ -1,12 +1,62 @@
1
+ 私は、あるjsonファイルを使用しています。
2
+
3
+ 私のjsonファイルは、下のURLのjsonファイルでワインについてのレビューについてのデータで、多くの種類のワインのレビューについてリストとして記載されています。
4
+
5
+ 行には”country”,"variety", "price", "point", "description"などの項目があります。
6
+
7
+ また、ワインの種類に関しては”variety”の列に記載されております。
8
+
9
+
10
+
11
+ 'https://github.com/tulip-lab/sit742/raw/master/Assessment/2019/data/wine.json'
12
+
13
+
14
+
15
+ このjsonファイルの”country”ごとに最もレビューされたワインの種類、”price”の平均、"points"の平均の表を以下の手順でdf4として作成しました。
16
+
17
+ ```python
18
+
19
+ df = pd.read_json("wine.json")
20
+
21
+ ```
22
+
23
+ ```python
24
+
25
+ df2 = df.dropna(subset=['points','price'])
26
+
27
+ ```
28
+
29
+ ```python
30
+
31
+ tmp = df2.groupby(['country','variety']).agg({'price':['mean'], 'points':['mean'], 'variety':'count'}).reset_index()
32
+
33
+ ```
34
+
35
+ ```python
36
+
37
+ df3 = tmp.groupby('country').apply(lambda d: d.loc[d[('variety','count')].idxmax()])
38
+
39
+ ```
40
+
41
+ ```python
42
+
43
+ df4 = df3.drop(columns=['country'])
44
+
45
+ ```
46
+
47
+
48
+
1
49
  ```python
2
50
 
3
51
  df4
4
52
 
5
53
  ```
6
54
 
55
+ 上のdf4を実行すると下の写真のような表が作成されました。
56
+
7
57
  ![イメージ説明](73bcb833c317cf409975803cd46d83ca.png)
8
58
 
9
- df4と定義した上の表の”price” と ”points” の列の数値の小数点第二位を四捨五入したく、
59
+ そして、df4と定義した上の表の”price” と ”points” の列の数値の小数点第二位を四捨五入したく、
10
60
 
11
61
  下のコードを入力し実行しましたが
12
62