質問編集履歴
1
コードの追加、ファイルの説明
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,12 +1,62 @@
|
|
1
|
+
私は、あるjsonファイルを使用しています。
|
2
|
+
|
3
|
+
私のjsonファイルは、下のURLのjsonファイルでワインについてのレビューについてのデータで、多くの種類のワインのレビューについてリストとして記載されています。
|
4
|
+
|
5
|
+
行には”country”,"variety", "price", "point", "description"などの項目があります。
|
6
|
+
|
7
|
+
また、ワインの種類に関しては”variety”の列に記載されております。
|
8
|
+
|
9
|
+
|
10
|
+
|
11
|
+
'https://github.com/tulip-lab/sit742/raw/master/Assessment/2019/data/wine.json'
|
12
|
+
|
13
|
+
|
14
|
+
|
15
|
+
このjsonファイルの”country”ごとに最もレビューされたワインの種類、”price”の平均、"points"の平均の表を以下の手順でdf4として作成しました。
|
16
|
+
|
17
|
+
```python
|
18
|
+
|
19
|
+
df = pd.read_json("wine.json")
|
20
|
+
|
21
|
+
```
|
22
|
+
|
23
|
+
```python
|
24
|
+
|
25
|
+
df2 = df.dropna(subset=['points','price'])
|
26
|
+
|
27
|
+
```
|
28
|
+
|
29
|
+
```python
|
30
|
+
|
31
|
+
tmp = df2.groupby(['country','variety']).agg({'price':['mean'], 'points':['mean'], 'variety':'count'}).reset_index()
|
32
|
+
|
33
|
+
```
|
34
|
+
|
35
|
+
```python
|
36
|
+
|
37
|
+
df3 = tmp.groupby('country').apply(lambda d: d.loc[d[('variety','count')].idxmax()])
|
38
|
+
|
39
|
+
```
|
40
|
+
|
41
|
+
```python
|
42
|
+
|
43
|
+
df4 = df3.drop(columns=['country'])
|
44
|
+
|
45
|
+
```
|
46
|
+
|
47
|
+
|
48
|
+
|
1
49
|
```python
|
2
50
|
|
3
51
|
df4
|
4
52
|
|
5
53
|
```
|
6
54
|
|
55
|
+
上のdf4を実行すると下の写真のような表が作成されました。
|
56
|
+
|
7
57
|
![イメージ説明](73bcb833c317cf409975803cd46d83ca.png)
|
8
58
|
|
9
|
-
df4と定義した上の表の”price” と ”points” の列の数値の小数点第二位を四捨五入したく、
|
59
|
+
そして、df4と定義した上の表の”price” と ”points” の列の数値の小数点第二位を四捨五入したく、
|
10
60
|
|
11
61
|
下のコードを入力し実行しましたが
|
12
62
|
|