構造の異なる辞書をソートしたい

構造の異なる辞書をソートしたい。
辞書dfには

df = [{"A":{"A1":{"a1":100,"b1":200,"c1":300}}},{"B":{"B1":{"a2":150,"b2":250,"c2":350}}},{"C":{"test1":10,"test2":190,"test3":120}},{"D":{"test01":170,"test02":150,"test03":180}}]

という風に

{‘A’:{‘A1’:{‘a1’:100,’b1’:200,’c1’:300}}}

という形の辞書と

{’C’:{‘test1’:10,’test2’:80,’test3’:120}}

という形の辞書が含まれている。

これらのdfの子辞書のvalue（１００・２００・１０など）を小さいもの順に並べたい。
理想のアプトプットは、

C→
test1:10
A⇨A1→
a1:100
B⇨B1→
a2:150

のように並び変える事である。
もしdfの子辞書のvalueでタイがあれば、AとかBとかのkeyが小さいもの順に並び替えたい。

df = [{"A":{"A1":{"a1":100,"b1":200,"c1":300}}},{"B":{"B1":{"a2":150,"b2":250,"c2":350}}},{"C":{"test1":10,"test2":190,"test3":120}},{"D":{"test01":170,"test02":150,"test03":180}}]

for i in range(len(df)):
        for key,value in sorted(df[i].items(), key=lambda x:x[0]):
                print(str(key)+ "⇨")
                x = str(key)+ "→"
                for ky,vl in value.items():
                    print(str(ky)+ "→")
                    y = str(ky)+ "→"
                    for k, v in sorted([(k, v) for k,v in vl.items() if type(v) is not list], key=lambda x: x[1]):
                        print(str(k) + ": " + str(v))

とコードを書くと、AttributeError: 'numpy.float64' object has no attribute 'items’とネストが深くない要素のようでエラーが出た。
（もしかしたら、AttributeError: 'int' object has no attribute 'items'　と出るかも）
エラーの原因はわかるが、僕がやりたいことをどうコードを書けばできるのかがわからない。そもそもプログラムでできるのかもわからない。

どのようにコードを書いて修正すればいいか？

hayataka2049

2018/05/10 07:34

一番上はsetになってますけど、それで良いんですか？　あと、これをやらないで済ます手立てはないの・・・（前の質問でも同じことをLouiS0616さんに言われてたみたいですけど）

k0908

2018/05/10 07:42

setになっているというのはどういうことでしょうか？はい、今回はこの２つの辞書を変更できません。。。

hayataka2049

2018/05/10 07:49

setになっているっていうのは、そのままの意味です。{key:value,...}は辞書、{value, ...}はsetです。もっというと、辞書はsetの中には入れられないので、質問の最初に出てるものをそのまま打ち込むと「TypeError: unhashable type: 'dict'」とか出てきます

k0908

2018/05/10 07:56

すみません、変更以前の前のコードを載せていました。辞書dfはリストの中に入っており、今for文を使いそれぞれの要素を取り出して使っています。

hayataka2049

2018/05/10 08:01

その修正されたコードも同じエラーが出るんですが・・・手元で確認してないんですか？

8524ba23

2018/05/10 08:07

提示エラーが再現できません。コードの一部ではなく、現象が再現する最低限で完全なコードを提示ください。

k0908

2018/05/10 08:11

本当にすみません！！dfが間違っていました。修正したものでは動く（確認済み）ので、もしお分かりでしたらお願いいたします。

8524ba23

2018/05/10 08:16

「for i in range(len(df)):」行にて「IndentationError: unexpected indent」が発生します。

k0908

2018/05/10 08:20

おや、何故でしょう・・・。手元のコードをそっくりそのままコピーしたものを質問文に載せました。よろしければこちらをお使いください。

行動規範の内容に同意します

回答2件

私ならデータ構造を作り直してソートします。
以下適当ですが、それなりに動作します。

Python
1# 階層構造の辞書から要素のリストを作成
2# 要素は 値(val), 階層構造(tree)を持つ。
3def remake_data( dic, tree):
4    dest = []
5    for key, val in dic.items():
6        if isinstance( val, dict):
7            dest.extend( remake_data( val, tree + [key]))
8        else:
9            dest.append( {'val':val, 'tree':tree + [key]})
10    return dest
11
12# 要素のソート
13def cmp_data( v1, v2):
14    # 値が最優先
15    cmp = v1['val'] - v2['val']
16    if cmp != 0:
17        return cmp
18
19    # 次に階層名
20    for t1,t2 in zip(v1['tree'],v2['tree']):
21        if t1 != t2:
22            return t1 < t2
23    return 0
24
25# 要素を文字列化(適当)
26def to_str( data):
27    return '{}:{}'.format( data['tree'], data['val'])
28
29
30# 元データ
31df = [{"A":{"A1":{"a1":100,"b1":200,"c1":300}}},{"B":{"B1":{"a2":150,"b2":250,"c2":350}}},{"C":{"test1":10,"test2":190,"test3":120}},{"D":{"test01":170,"test02":150,"test03":180}}]
32print(df)
33
34# 扱いやすいデータ構造に作りかえ
35datas = []
36for dic in df:
37    datas.extend( remake_data( dic, []))
38[print(to_str(d)) for d in datas]
39
40print('ソート後')
41import functools
42datas = sorted( datas, key=functools.cmp_to_key(cmp_data))
43[print(to_str(d)) for d in datas]

投稿2018/05/10 09:05

8524ba23

総合スコア38352

ベストアンサー

こんなの考えたくもない（手に負えない）ので、再帰でflattenするコード書きました。あんまりうまくない部分もありますが。

python
1from pprint import pprint
2
3df = [{"A":{"A1":{"a1":100,"b1":200,"c1":300}}},{"B":{"B1":{"a2":150,"b2":250,"c2":350}}},{"C":{"test1":10,"test2":190,"test3":120}},{"D":{"test01":170,"test02":150,"test03":180}}]
4
5def parse(d):
6    if len(d.keys()) != 1:
7        return {(k,):v for k,v in d.items()}
8    else:
9        key = list(d.keys())[0]
10        val = list(d.values())[0]
11        
12        child = parse(val)
13        
14        ret_d = {}
15        for k,v in child.items():
16            k_lst = list(k)
17            k_lst.insert(0, key)
18            ret_d[tuple(k_lst)] = v
19        return ret_d
20
21d_flatten = {}
22for d in df:
23    d_flatten.update(parse(d))
24
25pprint(d_flatten)
26"""
27{('A', 'A1', 'a1'): 100,
28 ('A', 'A1', 'b1'): 200,
29 ('A', 'A1', 'c1'): 300,
30 ('B', 'B1', 'a2'): 150,
31 ('B', 'B1', 'b2'): 250,
32 ('B', 'B1', 'c2'): 350,
33 ('C', 'test1'): 10,
34 ('C', 'test2'): 190,
35 ('C', 'test3'): 120,
36 ('D', 'test01'): 170,
37 ('D', 'test02'): 150,
38 ('D', 'test03'): 180}
39"""