Pythonの辞書型への変形について

以下のCSVデータをpythonのネストされた辞書型へ変形したいと思っています．
pythonの初心者でどのようなコードがよいかわからず，質問させていただきました．

変形前（元のCSVデータ）

変形後（ネストされた辞書型）

以下カンマ区切りの文字列になります．

csv
1名前,料理,点数
2山田,カレー,2.5 
3田中,カレー,3.0 
4佐藤,カレー,2.5 
5山田,ラーメン,3.5 
6田中,ラーメン,3.5 
7佐藤,ラーメン,3.0 
8山田,チャーハン,3.0 
9田中,チャーハン,1.5 
10山田,寿司,3.5 
11田中,寿司,5.0 
12佐藤,寿司,3.5 
13山田,牛丼,2.5 
14田中,うどん,3.0 
15佐藤,うどん,4.0 
16山田,うどん,3.0 
17田中,牛丼,3.5

現段階ではcsvで読み込みappendをつかって一つの辞書型に読み込みができています．

しかし，やりたいことは「名前」項目でまとめて（山田は山田），上記の変形後（ネストされた辞書型？）にしたいと考えていますが，どのようにappendすれば，よろしいかお教えいただければ幸甚です．
よろしくお願いします．

miyahan

2017/05/02 23:26

何を試して、どこで行き詰ってしまったか（何が困っているのか）明記してください。

utoka

2017/05/03 01:09

現状を追加させていただきました．よろしくお願いいたします．

行動規範の内容に同意します

回答2件

ベストアンサー

itertools に groupby という関数があるのでそれを使うとちょっと楽できます

python
1# python3 
2from itertools import groupby
3
4lines = [
5    ['山田', 'カレー', 2.5],
6    ['鈴木', 'うどん', 1.5],
7    ['山田', 'うどん', 3.5],
8    ['鈴木', 'カレー', 4.0],
9]
10
11ret = {}
12for k, v in groupby(sorted(lines, key=lambda x: x[0]) , key=lambda x: x[0]):
13    ret[k] = {v2[1]: v2[2] for v2 in v}
14
15print(ret)
16

投稿2017/05/03 01:54

tell_k

総合スコア2120

utoka

2017/05/03 02:02

便利な関数をお教えいただき，ありがとうございます！

行動規範の内容に同意します

この手の処理は pandas を使うのが簡単かと。

Python
1import pandas as pd
2df = pd.read_csv("dataset8.csv")
3d = {n:dict(zip(d['料理'],d['点数'])) for n,d in df.groupby('名前')}
4
5print(d)
6# => {'田中': {'チャーハン': 1.5, '寿司': 5.0, 'ラーメン': 3.5, 'カレー': 3.0, '牛丼': 3
7.5, 'うどん': 3.0}, '山田': {'チャーハン': 3.0, '寿司': 3.5, 'ラーメン': 3.5, 'カ
8レー': 2.5, '牛丼': 2.5, 'うどん': 3.0}, '佐藤': {'カレー': 2.5, '寿司': 3.5, 'ラー
9メン': 3.0, 'うどん': 4.0}}

投稿2017/05/03 02:34

magichan

総合スコア15898

utoka

2017/05/03 02:45

ありがとうございます！pandasのやり方も知りたかったので，とても嬉しいです．

utoka

2017/05/03 10:46 編集

MovieLens(以下URL)のratings.csvを使用して以下の出力結果を得たいと思っています． https://grouplens.org/datasets/movielens/ 希望の出力結果 [‘userId’:{‘movieId’:{‘rating’, ‘timestanp’}}] ※ userId，movieId，rating，timestanpはカラム名で実際は値が入ります．そこで教えていただいたコードを改変して以下を試すとmovieIdのネストされている値がタプルになってしまいます． d = {n:dict(zip(d['movieId'],zip(d['rating'],d['timestamp']))) for n,d in ratings_df.groupby('userId')} 上記の結果 (‘userId’, {‘movieId’: (‘rating’, ‘timestanp’)} 度々申し訳ございませんが，アドバイスいただければ幸甚です．

utoka

2017/05/03 23:27

以下で新規の質問をさせていただきましたので，ご教授いただければ幸甚です． https://teratail.com/questions/74811?modal=q-comp

行動規範の内容に同意します

あなたの回答