【PHP + MySQL】UNIQUE制約の付いているカラムへの重複するデータのINSERTの正しいやり方を教えてください。
- 評価
- クリップ 0
- VIEW 3,196

退会済みユーザー
プログラミングをやり始めて少しの初心者です。質問に至らぬところがございましたら申し訳ございません。
現在 PHPとMySQLを使用してプログラミングの勉強をしています。
そして先程データベースをどのようにするのかを考えながら試していた所、重複するデータを多くINSERTしていることが分かりました。
重複するデータを挿入することが多くなってしまう場合、それは、データベースで重複を阻止するのか、PHPで重複を阻止するのかどちらでやるべきなのか。どのようにしたら良いのでしょうか。
現在MySQLを使用しており、その列をUNIQUEにすることで、重複するデータが入ることはなくなりましたが、このPHPのプログラムではDuplicatedな値を多くINSERTしてしまっています。
プログラムを1度動かすと 1割程が新規にINSERTされて残りの、9割程がDuplicatedな値をINSERTしてしまっています。この場合、Duplicatedな値をMySQLへINSERTするのではなくて、PHPで一度処理をしてからMySQLへINSERTするのが良いのでしょうか?
※追記です
自分で読み直したらわかりにくかったため追記をさせていただきます。
PHP(9割重複したデータ) → MySQL(UNIQUE)
・UNIQUEなので重複したデータはテーブルには入っていないが、入らないデータが多くINSERTされていることが不安
PHP(ここで重複を取り除く) → MySQL(UNIQUE)
・MySQLの方に重複処理を任せたほうがいいのかのかどうなのか。(Uniqueに任せる)
この2つのやり方どちらでやるのか正解なのかを知りたいです。
-
気になる質問をクリップする
クリップした質問は、後からいつでもマイページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
クリップを取り消します
-
良い質問の評価を上げる
以下のような質問は評価を上げましょう
- 質問内容が明確
- 自分も答えを知りたい
- 質問者以外のユーザにも役立つ
評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。
質問の評価を上げたことを取り消します
-
評価を下げられる数の上限に達しました
評価を下げることができません
- 1日5回まで評価を下げられます
- 1日に1ユーザに対して2回まで評価を下げられます
質問の評価を下げる
teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。
- プログラミングに関係のない質問
- やってほしいことだけを記載した丸投げの質問
- 問題・課題が含まれていない質問
- 意図的に内容が抹消された質問
- 過去に投稿した質問と同じ内容の質問
- 広告と受け取られるような投稿
評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。
質問の評価を下げたことを取り消します
この機能は開放されていません
評価を下げる条件を満たしてません
質問の評価を下げる機能の利用条件
この機能を利用するためには、以下の事項を行う必要があります。
- 質問回答など一定の行動
-
メールアドレスの認証
メールアドレスの認証
-
質問評価に関するヘルプページの閲覧
質問評価に関するヘルプページの閲覧
checkベストアンサー
+4
PostgreSQLのように任意の式による制約を設けられるRDBMSの場合は「データベース側にバリデーションを集中させる」という運用は一つの選択肢にはなると思います。
MySQLの場合は外部キー制約とユニークキー制約程度しか付けられないので、「アプリケーション側でバリデーションし、データベース側の制約は万が一のための保険にする」という運用にせざるを得ないです。
ただし、アプリケーション側でバリデーションする場合は「ほぼ同時にリクエストが飛んできた場合」を考慮する必要があります。以下のように入り交じるケースがあるからです。
ユーザAによる存在確認
↓
ユーザBによる存在確認
↓
ユーザAによる挿入処理(成功)
↓
ユーザBによる挿入処理(重複orユニーク制約により失敗)
SELECT ... FOR UPDATE でロックをかけながら行選択すると、存在しなかった場合には他のリクエストによるテーブルへの挿入処理およびその未存在のレコードに対する選択処理がブロックされるので、このやり方でも安全性を担保することはできます。ただしパフォーマンスは低下する可能性があるので、ロックせずにSELECTし、「万が一競合したらユニーク制約のエラーに拾ってもらう」というやり方でもいいです。
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
+3
がると申します。
少しまとめますと。
・データが複数ある
・「複数ある」データの何割かは「重複するデータ」である
・「重複するデータ」は、INSERTさせたくない
という前提があって。
上述に対して
・PHP側でチェックして取り除くか
・DB側でUNIQUE制約ではじくか
のどちらがよいか? という疑問だと思われますが、上述で認識はあってますでしょうか?
個人的には、という前置きを置きまして。
「滅多に重複しないんだけど、ごくまれに重複することがあり得る」くらいですと「INSERT前のチェックは特にせず、INSERT時に失敗したら(一応エラー内容を確認しつつ)適宜対応」というロジックを書く事が多いのですが。
「9割程がDuplicatedな値をINSERTしてしまっています」という状態で、かつ「Duplicatedな値はINSERTしたくない」のであれば
・まずINSERTする前にPHP側でチェックをして「明らかに重複しているデータは、INSERT対象外にする」
・かつ「UNIQUE制約」は行い、瀬戸際もしっかりとガードする
というロジックを、私なら書くかなぁ、と思いました。
「正解」というのも色々あろうかと思うので、個人的な見解を書かせていただきました。
以上、何かの参考になれば幸いです。
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
0
重複とはなにをもって重複と判断していますか?
テーブルにユニークなカラム(主キーまたはユニークキー属性のあるカラム)が
あれば重複は起こりません
逆にユニークなカラムがなければSQL側で制限するのには工夫が必要です。
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
15分調べてもわからないことは、teratailで質問しよう!
- ただいまの回答率 88.20%
- 質問をまとめることで、思考を整理して素早く解決
- テンプレート機能で、簡単に質問をまとめられる
質問への追記・修正、ベストアンサー選択の依頼
mpyw
2017/06/01 22:02
Duplicatedですね
退会済みユーザー
2017/06/01 22:13
ありがとうございます。修正させていただきました。
mpyw
2017/06/02 05:30 編集
なぜいい質問だったのに抹消するのか…
(消しても https://teratail.com/questions/history-questions/78646 に残るし…)
2017/06/02 09:49
複数のユーザーから「意図的に内容が抹消された質問」という意見がありました
解決後に編集機能を用いて質問内容を改変し関係のない内容にしたり、内容を削除する行為は禁止しています。
投稿していただいた質問は、後に他の誰かが困ったときに助けになる情報資産になると考えるからです。
「質問を編集する」ボタンから編集を行い、他のユーザにも質問内容が見えるように修正してください。