質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
MySQL

MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

Q&A

解決済

2回答

2781閲覧

IN句に重複したデータを入れるとコストは変わるのか

退会済みユーザー

退会済みユーザー

総合スコア0

MySQL

MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

0グッド

0クリップ

投稿2018/10/12 10:15

MySQLのクエリのスロークエリの調査をしている中でIN句の中に重複したデータを突っ込んでいるクエリを発見しました。

クエリは以下のような感じです

SQL

1SELECT id, age, status 2FROM user 3WHERE name IN ("a", "b", "a", "c", "b", "a", "d", "e", "d",...);

重複の度合いとしては、IN句の中には約11万件入っており、重複を省くと1.6万件くらいになります。(およそ85%が重複)

ここできになるのが、重複を除いた状態でIN句に入れてあげることによってクエリの速度は改善するのかというところです。
MySQLがよしなに検索前に重複を省いていて、その重複を省くコストがそんなに大したことがないって落ちだとトータルの時間はそんなに変わらないなんてオチだと嫌だなと思い相談させていただきました。

現状、50秒というとんでもない時間がかかっているのですが、この重複を無くしてやることで早くなりますか??

MySqlは5.7を使っています。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

inの効率の悪さはよく論じられていますからねぇ多分効率化できるでしょう。
テンポラリテーブルにユニークデータとして流し込んで
joinなり、existsなりで処理すると圧倒的に速くなると思います

投稿2018/10/12 10:25

yambejp

総合スコア114843

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2018/10/12 10:35

なるほど! IN句ではなく、tmpテーブルにIN句のデータ突っ込んでJOINさせるってやり方はなんとなく早そうですね。
退会済みユーザー

退会済みユーザー

2018/10/12 10:38

すみません!お気づきになったら教えて欲しいのですが、テンポラリテーブルってもしクラスターを組んでいる場合、レプリケーションってされるのでしょうか?
yambejp

2018/10/12 10:44

テンポラリをレプリケーションする?ってどういう状況でしょう? テンポラリはセッションが終了すると自動で削除されると思いますが・・・
guest

0

直接の回答にはなりませんが、SQL の性能向上を目指すのであれば、まずは EXPLAIN を使ってみてください。
IN の重複も関係あるかもしれませんが、インデックスをはってみて試す方が期待できそうな気がします。

投稿2018/10/12 10:23

ssasaki

総合スコア1167

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2018/10/12 10:26

実行計画は確認したのですが、インデックスは使われており、typeもrangeなのでインデックスフルスキャンは走ってないです。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問