pandas の機能のみで最初の column が index になるような dict を生成したい。

下記コードと同じことを pandas のみでやりたいです。なにか方法はないでしょうか？
データ量が多くループを廃止したいです。lambda も内包記法もなしで書けないでしょうか？

環境

$ apt-cache show python3
Package: python3
Source: python3-defaults
Version: 3.7.3-1

コード

import pandas as pd

if __name__ == "__main__":
    df : pd.DataFrame = pd.DataFrame({0:["E0001", "E0002", "E0003"],\
                        1:["大阪", "東京", "名古屋"],\
                        2:["通天閣", "スカイツリー", "名古屋城"]})
    
    hashmap : dict = {}
    for d in df.iterrows():
        hashmap[d[1][0]] = {d[1][1], d[1][2]}

    print(hashmap) 
    #{'E0001': {'通天閣', '大阪'}, 'E0002': {'スカイツリー', '東京'}, 'E0003': {'名古屋', '名古屋城'}}

行動規範の内容に同意します

回答1件

ベストアンサー

lambdaを使いたくない理由が不明ですが、以下のように書けます。

Python
1
2def f(r):
3	return set(r)
4
5sr = df.set_index(0).apply(f, axis=1)
6print(sr.to_dict())
7# {'E0001': {'大阪', '通天閣'}, 'E0002': {'東京', 'スカイツリー'}, 'E0003': {'名古屋城', '名古屋'}}

投稿2021/10/28 05:37

8524ba23

総合スコア38341

yosukesan

2021/10/28 05:56 編集

ありがとうございました。説明不足で申しわけありません。lambda で loop 展開は NG にしたいだけです。最終の解決案はこうしました。 ``` import pandas as pd if __name__ == "__main__": import json df : pd.DataFrame = pd.DataFrame({0:["E0001", "E0002", "E0003"],\ 1:["大阪", "東京", "名古屋"],\ 2:["通天閣", "スカイツリー", "名古屋城"]}) s = df.set_index(0).apply(lambda x: set(x),axis=1) print(s.to_dict()) ```