質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
MySQL

MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

MariaDB

MariaDBは、MySQL派生のオープンソースなリレーショナルデータベースシステムです。 また、MySQLとほぼ同じデータベースエンジンに対応しています。

Q&A

解決済

3回答

600閲覧

10.3.17-MariaDBでRAND()を使ったSQLの結果が1レコードに定まらない理由を知りたいです。

Touhoku

総合スコア31

MySQL

MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

MariaDB

MariaDBは、MySQL派生のオープンソースなリレーショナルデータベースシステムです。 また、MySQLとほぼ同じデータベースエンジンに対応しています。

0グッド

2クリップ

投稿2020/09/16 07:26

編集2020/09/16 21:11
CREATE TABLE data( id bigint NOT NULL AUTO_INCREMENT PRIMARY KEY ,datum TEXT ,created_at datetime default current_timestamp ,updated_at timestamp default current_timestamp on update current_timestamp );

laravel

1 $limit = 1000000; 2 for($i=0;$i<$limit;$i++){ 3 $unique_id = uniqidReal(128); 4 5 6 DB::insert('insert into `data` (datum) values (?)', [ 7 $unique_id 8 ]); 9 } 10 11
SELECT * From data where id = CEIL(RAND() * (select count(*) from data));

上記のSQLでSQLの結果が1レコードに定まりません。結果が0レコードは納得いくのですが、結果が2レコードや3レコードの場合があります。納得いきません。
よろしくお願いいたします。

イメージ説明
イメージ説明2
一意の値を返す画像

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

m.ts10806

2020/09/16 07:29

DB設計とサンプルデータなしにはアドバイス不可能です。 CREATE TABLE文とINSERT文をご提示ください。
Touhoku

2020/09/16 07:31

承知しました。
m.ts10806

2020/09/16 07:35 編集

Laravelのコードで提示されると、コピペで確認できないのですけど。 MariaDbからエクスポートしたものが良いのですが。
Touhoku

2020/09/16 07:46 編集

SELECT SQLから分かるように、プライマリキーカラムのidが1から100万まで入っているテーブルとお考え下さい。datumカラムはただの飾りです。よろしくお願いいたします。
m.ts10806

2020/09/16 08:27

CEIL(RAND() * (select count(*) from data)) 上記が何を返すか幾つか確認はしてみましたか?
Touhoku

2020/09/16 08:29

画像のように整数の値を1つのみ返します。
attercop

2020/09/16 09:15

事象からするとレコードごとにRANDが評価されているように思えますね。 Qiitaの以下の記事だとINNER JOINして比較しているのでそういう挙動なのかもしれません。 https://qiita.com/iri/items/b82795b6a3c0a8df62a5
Touhoku

2020/09/16 20:58

なるほど。貴重な記事ありがとうございます。そういうものだと割り切ってしまうのがよいのかもしれません。
guest

回答3

0

ベストアンサー

サブクエリのキャッシュ

SQL

1SELECT * From data where id = CEIL(RAND() * (select count(*) from data));

これはサブクエリを持つクエリです。サブクエリは相関項目を持たない。一般にこの動作は、サブクエリを実行して結果をキャッシュ、キャッシュを使って外部クエリが実行される。

ここから推測。キャッシュされるのは、(select count(*) from data))の結果だけで、式 CEIL(RAND() * <キャッシュされたサブクエリ>) は毎回実行されると考えると、辻褄が会うのではないでしょうか。次のようにクエリを変更します。

SQL

1SELECT * From data where id = (SELECT RID FROM (SELECT CEIL(RAND() * (select count(*) from data)) AS RID)R);

式全体をキャッシュしたので1件だけヒットすると推測します。内部結合を使う方法は他の方が回答されています。あるいは、withを使う以下の方法でもCEIL式までキャッシュできる。SQLをバラバラにしています。

SQL

1WITH RND(R) AS ( 2SELECT RAND() 3), CNT(C) AS ( 4select count(*) from data 5), CIL(RID) AS ( 6SELECT CEIL(R*C) from RND cross join CNT 7) 8SELECT * From data where id = (SELECT RID FROM CIL);

クエリとサブクエリの関係

クエリとサブクエリの関係は思ったより複雑です。2つのクエリごとにサブクエリがキャッシュされるようです。

SQL

1WITH RND(R) AS ( 2SELECT RAND() 3), CNT(C) AS ( 4select count(*) from data 5), CIL(RID) AS ( 6SELECT CEIL(R*C) from RND cross join CNT 7) 8SELECT * From data where id = (SELECT RID FROM CIL) 9UNION ALL 10SELECT * From data where id = (SELECT RID FROM CIL);

CEIL(RAND() * (select count(*) from data))はレコードごとに実行される

理由は、idと上の式の値が等しいかを判定するために、式を評価するからです。次のSQLを考えてください。これらの条件式はレコードごとに評価しています。

SQL

1select * from data where id % 2 = 0 limit 5; 2select * from data where id = power(ceil(rand()*10000),0);

最後に、質問の現象はどのテーブルでも再現できます。where条件に ceil(rand() * (select count(*) from <table>))と書けばよい。

結論

以下の2つのSQLは同じです。

SQL

1SELECT * From data where id = CEIL(RAND() * (select count(*) from data)); 2SELECT id,datum,created_at,updated_at From (select *, CEIL(RAND() * (select count(*) from data)) from data) rnd where id=`CEIL(RAND() * (select count(*) from data))`;

補足

EXPLAINを使ってSQLを確認しました。以下のSQLはSUBQUERYでなくUNCACHEABLE SUBQUERYが表示されました。しかし対象が導出表だったので同じ結果が得られると判断しました。

SQL

1MariaDB [...]> explain SELECT * From data where id = (SELECT R FROM (SELECT CEIL(RAND() * (select count(*) from data)) AS R) RND); 2+------+----------------------+------------+--------+---------------+---------+---------+-------+--------+----------------+ 3| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | 4+------+----------------------+------------+--------+---------------+---------+---------+-------+--------+----------------+ 5| 1 | PRIMARY | data | const | PRIMARY | PRIMARY | 8 | const | 1 | Using where | 6| 2 | UNCACHEABLE SUBQUERY | <derived3> | system | NULL | NULL | NULL | NULL | 1 | | 7| 3 | DERIVED | NULL | NULL | NULL | NULL | NULL | NULL | NULL | No tables used | 8| 4 | SUBQUERY | data | index | NULL | PRIMARY | 8 | NULL | 100239 | Using index | 9+------+----------------------+------------+--------+---------------+---------+---------+-------+--------+----------------+ 104 rows in set (0.043 sec)

これ以外のSQLのEXPLAINの結果は想定どおりでした。

投稿2020/09/17 00:39

編集2020/09/19 22:14
xebme

総合スコア1081

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

xebme

2020/09/17 01:13 編集

なぜ、式 CEIL(RAND() * <キャッシュされたサブクエリ>) が毎回実行されるのかには答えていません。ここから先は自分で調べるか、Stack Overflowで質問するか ... 。 <-- 愚問でした。一致判定(=)のために評価しないといけない。
Touhoku

2020/09/23 01:25

なるほど。詳しい説明ありがとうございました。 特に >これらの条件式はレコードごとに評価しています。 に納得がいきました。ベストアンサーお受け取りください。
guest

0

確かに不思議ですね、WHERE句の中のRAND() の値が一度計算されて使い回されると考えると
複数行帰ってくるのは不思議です。
挙動から考えると1行判定するごとにRAND()の値が再計算されているのかなぁ…という気がしますが、裏付けるドキュメントが見つかりませんでした。
(RAND()をselectしてしまうとそこでさらに乱数が算出されてしまうので検証にならなかったです)

SQLの形を変えて、以下のようにすると期待する動作になると思います。

sql

1SELECT data.*, rdm.rnd_id From data 2inner join (select CEIL(RAND() * (select count(*) from data)) as rnd_id) as rdm 3 on rdm.rnd_id = data.id;

投稿2020/09/16 10:21

編集2020/09/16 10:22
YakumoSaki

総合スコア2027

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

RAND()は0以上1未満の少数をランダムに返すものですので
ランダム要素がある限り結果が一意になることはないでしょう

投稿2020/09/16 07:57

yambejp

総合スコア114572

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yambejp

2020/09/16 08:01 編集

そもそもidが1から(訂正:0から)始まるユニークな整数の連番でないかぎり ヒットしなかったり、複数レコードが表示されたりします
Touhoku

2020/09/16 07:59

実はヒットしないものが出てくるのは問題ないのですが、2レコードや3レコードヒットする場合があって、これは何故だ?と質問した次第です。 一意の意味は取り違えていたので1レコードと修正しました。
yambejp

2020/09/16 08:01

idがユニークではないのでは?
Touhoku

2020/09/16 08:03

>ユニークな整数の連番でないかぎり id bigint NOT NULL AUTO_INCREMENT PRIMARY KEY としているのでユニークな整数の連番にも関わらず、複数レコードが出るのが不思議でなりません。
yambejp

2020/09/16 08:52

ロジックが正しいならたしかにおかしいですね 複数表示されるときのIDはどうなっていますか?
Touhoku

2020/09/16 20:53

複数表示されるときのIDの表示の仕方をご存じでしょうか?私は最終的なSELECT結果のidカラムを見る以外には分からないため、教えていただけないでしょうか?
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問