質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.61%

  • Python

    7468questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

辞書の配列の辞書型の要素の重複を取り除きたい

解決済

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 237

k0908

score 68

辞書の配列の辞書型の要素の重複を取り除きたい。

{'A':[{'a1':10,'a2':20},{'a1':10,'a2':20},{'a1':30,'a2':25}],'B':[{'a1':40,'a2':50},{'a1':30,'a2':25},{'a1':30,'a2':25},{'a1':30,'a2':25},{'a1':22,'a2':27},{'a1':22,'a2':27}],'C':[{'a1':10,'a2':20}]} 


という辞書dfがある。

この辞書の配列の辞書型の要素の重複を取り除きたい。
例えば、{‘a1’:10,‘a2’:20},{‘a1’:10,‘a2’:20}は重複しているため1つにする、
{‘a1’:30,‘a2’:25},{‘a1’:30,‘a2’:25},{‘a1’:30,‘a2’:25}も重複しているため1つにするなど。
理想のアウトプットは、

{‘A’:[{‘a1’:10,‘a2’:20},{‘a1’:30,‘a2’:25}],’B’:[{‘a1’:40,‘a2’:50},{‘a1’:30,‘a2’:25},{‘a1’:22,‘a2’:27}],’C’:[{‘a1’:10,‘a2’:20}]} 


のような形にすることである。

x=set(df)
print(x)

とコードを書くと、
[‘A’,’B’,’C’] のようにキーだけの重複が取り除かれた。

要素は配列であるため、setメソッドでset(list)のようにして1行で書けるのか?
どのように書けば理想のアウトプットの辞書を出力できるか?

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • hayataka2049

    2018/05/16 19:23

    外側の辞書のAキーに属する辞書とCキーに属する辞書が重複する、といった場合は無視して構いませんか?

    キャンセル

  • k0908

    2018/05/16 19:24

    はい、それは無視して大丈夫です

    キャンセル

回答 2

checkベストアンサー

+3

効率を考えると微妙なアルゴリズムですが、とりあえず用は達します。

from pprint import pprint

dct = {'A':[{'a1':10,'a2':20},{'a1':10,'a2':20},{'a1':30,'a2':25}],
       'B':[{'a1':40,'a2':50},{'a1':30,'a2':25},{'a1':30,'a2':25},{'a1':30,'a2':25},{'a1':22,'a2':27},{'a1':22,'a2':27}],
       'C':[{'a1':10,'a2':20}]} 

def remove_duplicate(lst):
    ret_lst = []
    for d in lst:
        if d not in ret_lst:
            ret_lst.append(d)
    return ret_lst

dct = {k:remove_duplicate(v) for k,v in dct.items()}
pprint(dct)
""" => 
{'A': [{'a1': 10, 'a2': 20}, {'a1': 30, 'a2': 25}],
 'B': [{'a1': 40, 'a2': 50}, {'a1': 30, 'a2': 25}, {'a1': 22, 'a2': 27}],
 'C': [{'a1': 10, 'a2': 20}]}
"""

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

+2

json.dumps()で文字列化(hashable)にしてsetに突っ込み、リスト時にjson.loads()で辞書に戻します。

d = {'A':[{'a1':10,'a2':20},{'a1':10,'a2':20},{'a1':30,'a2':25}],'B':[{'a1':40,'a2':50},{'a1':30,'a2':25},{'a1':30,'a2':25},{'a1':30,'a2':25},{'a1':22,'a2':27},{'a1':22,'a2':27}],'C':[{'a1':10,'a2':20}]} 
print(d)

import json
for k,v in d.items():
import json
for k,v in d.items():
    s = {json.dumps(i,sort_keys=True) for i in v} # set hayataka2049さんの指摘を受けsort_keysを追加
    d[k] = [json.loads(i) for i in s]

print(d)

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/05/16 20:24 編集

    sort_keys=Trueしておかないと怖い気がします

    ・・・dict.items()でtuple化して・・・とかも考えましたけど、どうやるのが速いんでしょうかこれ

    キャンセル

  • 2018/05/16 20:35

    あ~盲点でした。たしかに。ご指摘ありがとうございます。
    jsonで文字列化は乱暴だし速度も?だけど、楽ちんなので(^^;

    キャンセル

  • 2018/05/16 20:39

    確かに「もしネストされたときは再帰的に・・・」とか考え始めると、強引に文字列にしてしまうjsonは良さげです

    キャンセル

  • 2018/05/16 23:32

    こちらで実行しましたところ、↓のように出力され、list 内で順番が維持されていないです。
    {'A': [{'a1': 10, 'a2': 20}, {'a1': 30, 'a2': 25}], 'B': [{'a1': 22, 'a2': 27}, {'a1': 40, 'a2': 50}, {'a1': 30, 'a2': 25}], 'C': [{'a1': 10, 'a2': 20}]}

    質問者さんが順番を維持することを要求しているかはわからないですが、維持するには set ではなく OrderedDict を用いればできると思います。

    キャンセル

  • 2018/05/17 18:17

    > list 内で順番が維持されていない
    ですね~
    要求レベルによりますが、set→OrderdDictのほうが親切かもですね

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.61%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

  • 解決済

    map,reduce,filterで集計処理を簡潔に書きたい

    前提・実現したいこと JavaScriptで以下のようなmap,reduce,filterを使って集計するコードを書いています。 name単位でvalueを合算するものです。

  • 解決済

    【C#】xml要素が繰り返し記述されているファイルの処理について

    下記のようなルート要素が繰り返し現れるようなファイルをうまくパースしたいのですが、 何か良い方法はないでしょうか。 xsd.exeでEmployeeのモデルクラスは作成しており

  • 解決済

    touchesBeganが動作しない

    Swift Playgroundで以下のようなプログラムを作成しています(前に質問させていただいたものと同じです) import UIKit import SpriteKit

  • 解決済

    update分の一部置換

    お世話になります。 データベースの、名前が入っている列(すべて2文字を想定) を一括で置き換えたいのですがなにがいけないのでしょうか。 個人情報テーブル NAME

  • 解決済

    VBAでのタグ取得(Children)の方法に関する質問について

    VBAでタグの中身を取得したいと思ってVBAを組んでいます。 HTMLの構造を見ると、下記の構造が複数並んでいました。 <div class="Name"><a class="

  • 解決済

    ansibleのroute53のcname設定で失敗する。

    以下ec2モジュールでインスタンスを作成後、route53への登録の処理で失敗します。 インスタンスの作成までは問題はなく、デバック用の処理でも値でも、'{{ item.pub

  • 解決済

    [PHP]POSTに失敗してしまいます

    PHP勉強中の者です。現在自動販売機作成ツールの管理画面を作成しているのですが、POSTの処理につまずいてしまっています。 ご教授頂ければ幸いです。 現在作成しているコードは以下の

  • 解決済

    Bootstraptableにデータが表示されない。

    各地域のデータをwebサイトで表示ですが思ってるように表示できません。 どこが間違える(足りてない)ところをご指摘いただけると助かります。 よろしくお願いします

同じタグがついた質問を見る

  • Python

    7468questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。