重複したデータを抽出させないSQL

同一テーブル、または別テーブルに重複したデータが存在していれば、
それを抽出するCSVリストを作成したいと考えております。

ID  SEI  MEI 
010 山田 太郎
020 鈴木 敏夫
030 田中 哲男
040 山本 雅人
050 島田 次郎
060 斉藤 剛史
070 山田 太郎
080 大島 大輔
090 田中 哲男
100 斉藤 剛史
110 山田 太郎

例えば上記のようなテーブルがあった場合、
SEIとMEIが重複するIDを抽出して、どのIDとどのIDが重複しているかがわかるCSVにしたいので、
下記のような結果になるSQLを模索中です。

ID  SEI  MEI  重複ID
010 山田 太郎 070
010 山田 太郎 110
030 田中 哲男 090

070と090、110のIDも抽出するSQLであれば容易に考えられるのですが、
それらは重複IDの方に表示するの抽出したくないのです。

尚、070と090、110のIDを抽出するSQLは下記になります。

SELECT a.ID, a.SEI, a.MEI, b.ID AS 重複ID
  FROM TABLE_A a
  INNER JOIN TABLE_A b ON a.SEI = b.SEI AND a.MEI = b.MEI

これを実行すると、抽出結果は下記のようになります。

ID  SEI  MEI  重複ID
010 山田 太郎 070
010 山田 太郎 110
030 田中 哲男 090
070 山田 太郎 010
070 山田 太郎 110
090 田中 哲男 030
110 山田 太郎 010
110 山田 太郎 070

例えば、IDが070のところで重複IDが010として表示されていますが、
010と070が重複していることは、
IDが010のところで重複IDが070と表示されているので既に判明しています。
なので、抽出したくないのです。

いいSQL文はないでしょうか？

追記
説明が不足していましたが、実際にはIDに付随する住所や電話番号等も抽出項目になります。

nullpon

2018/01/13 01:54

重複IDが2個以上ある場合はどうしますか？

sousuke

2018/01/13 02:13

070と090がなぜ重複IDに表示されないのかを理論的に説明してください。固定文字列なら「070と090のIDも抽出するSQLであれば容易に考えられる」のであればそこからwhere句で抜くしか無いです。

行動規範の内容に同意します

回答2件

ベストアンサー

下記でどうでしょう。

SQL
1SELECT a.*, b.ID AS 重複ID
2 FROM
3  (SELECT min(ID) AS ID, SEI, MEI FROM TABLE_A GROUP BY SEI, MEI HAVING COUNT(*) > 1) a
4  INNER JOIN TABLE_A b
5  ON a.SEI = b.SEI AND a.MEI = b.MEI
6WHERE a.ID <> b.ID
7ORDER BY a.ID;

重複のある最小IDをとりだすサブクエリと結合して、IDが同じものは除外する。

結果

ID	SEI	MEI	重複ID
010	山田	太郎	070
010	山田	太郎	110
030	田中	哲男	090
060	斉藤	剛史	100

動作サンプル
SQL Fiddle

投稿2018/01/13 02:56

hatena19

総合スコア33715

yoshi7

2018/01/13 05:06

ありがとうございました。助かりました。

行動規範の内容に同意します

重複が3つ以上ある可能性もあるため以下のような形にしてみました

sql
1SELECT SEI, MEI, GROUP_CONCAT(ID) AS 重複ID FROM table GROUP BY SEI, MEI HAVING COUNT(*) > 1;

こうなります

SEI	MEI	重複ID
山田	太郎	010,070
田中	哲男	090,070

投稿2018/01/13 02:07

teng

総合スコア127

yoshi7

2018/01/13 02:38

SQLありがとうございます。追記させてもらったんですが、実際にはSEIとMEI以外にも住所や電話番号も取得したいと考えています。その場合は先頭IDに紐づくデータにしたいので、ご提示いただいたSQLだと、難しいのかなと思いました。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

重複したデータを抽出させないSQL

関連した質問