質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
MySQL

MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。

Q&A

解決済

3回答

472閲覧

MySQLにおいて重複したカラムを削除する場合(idなし)

gymgym

総合スコア97

MySQL

MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。

0グッド

0クリップ

投稿2019/04/19 05:27

テーブル名 text_1 +---------------------+----------+------------------------------------------+ | date | week | text | +---------------------+----------+------------------------------------------+ | 2018-07-21 15:28:48 | Saturday | 海賊王になるのは誰だ。。。 | | 2018-07-21 15:28:48 | Saturday | 海賊王になるのは誰だ。。。 | | 2018-05-24 11:39:19 | Sunday | 海 | | 2018-05-24 11:39:19 | Sunday | 海 | | 2018-03-11 13:45:38 | Monday | 海賊王。 | | 2018-08-24 15:28:48 | Tuesday | ごめん | | 2018-01-11 15:28:48 | Saturday | 海賊王になるのは誰だ。。。 | +---------------------+----------+------------------------------------------+

実現したいこと

テーブル名 text_1 +---------------------+----------+------------------------------------------+ | date | week | text | +---------------------+----------+------------------------------------------+ | 2018-07-21 15:28:48 | Saturday | 海賊王になるのは誰だ。。。 | | 2018-05-24 11:39:19 | Sunday | 海 | | 2018-03-11 13:45:38 | Monday | 海賊王。 | | 2018-08-24 15:28:48 | Tuesday | ごめん | +---------------------+----------+------------------------------------------+

現在、約200万のレコードが格納されているデータベースを扱おうとしています。

3つとものカラムの要素が重複しているレコードに対して1つだけ残し、それ以外を削除したいです。

このような場合、どのように処理したらよいでしょうか。
また、idのカラムはやはり必要なのでしょうか。

よろしくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

また、idのカラムはやはり必要なのでしょうか。

データベースを運用する上で、主キーがないと、今回のように扱いがめちゃくちゃ面倒になります。ただ、主キーの決め方としては

  • 連番などで、機械的にIDを振る
  • 郵便番号と住所の対応テーブルでの郵便番号のように、既成のコードを利用する
  • 多対多の中間テーブルで、複合主キーを使う

など、いくつか方法はあります。

今回のように、「すべての列が一致してしまった」行が複数ある場合、どんなWHEREでも2つついてきてしまいます。2つあるものを1つだけ消したいなら、DELETE LIMIT 1のような手段を使うしかないかもしれません(まとめて処理する方法は…idなしでは難しいかもしれません)。

投稿2019/04/19 05:44

maisumakun

総合スコア145121

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

重複を除外したテーブルを作って、差し替える。

SQL

1create table text_1_temp 2select date,week,text 3from text_1 4group by date,week,text 5; 6drop table text_1; 7rename table text_1_temp TO text_1;

今後そういった事が無いように、差し替えた後はユニーク制約付けた方が良いですね。
※バックアップは必ず取ってから。

投稿2019/04/19 06:29

編集2019/04/19 06:31
sazi

総合スコア25138

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

完全一致のレコードをつくった時点で対応はキビシイです
一回
select distinct * from tbl
で、別のテーブルに退避しして
(date,week,text)にunique属性をつけて
戻すのが一番ラクで早いと思います

procedureでできないことはないですが、むしろ書き方としては
めんどくさくなります。
どうしても重複を許す必要があり、定期的にデータをユニークに
する必要があるならご提示することは可能ですが
そんな運用をすること自体が問題です

sample

  • 重複レコードのあるテーブル作成

SQL

1create table tbl(a int,b int,c int); 2insert into tbl values 3(1,1,1), 4(1,1,1), 5(1,2,1), 6(1,2,1), 7(2,1,1), 8(1,1,1), 9(2,1,2);
  • 同じ構造で、unique属性をもったテーブルを作成し、流し込む

SQL

1create table tmp(a int,b int,c int,unique(a,b,c)); 2insert ignore into tmp select * from tbl;
  • テーブルを置き換える

SQL

1rename table tbl to tbl_old,tmp to tbl;
  • 中身を確認して問題なければ元テーブルを削除

SQL

1drop table tbl_old;

投稿2019/04/19 05:51

編集2019/04/19 06:19
yambejp

総合スコア114572

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yambejp

2019/04/19 06:20

手順書いておいたので参考にしてください
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問