質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
MySQL

MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

Q&A

解決済

3回答

575閲覧

MySQL、join だけでリレーションに対して絞り込み検索したい

xipx_osx

総合スコア13

MySQL

MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

0グッド

0クリップ

投稿2018/10/24 06:46

編集2018/10/24 11:37

例えば下記のようなデータがあるとして(本来はテーブルですが、便宜上jsonにしています)、

json

1users = [ 2 { 3 "user_name": "userA", 4 "posts": [ 5 { 6 "post_name": "postA", 7 "comments": [ 8 { 9 "body": "foo" 10 }, 11 { 12 "body": "bar" 13 } 14 ] 15 } 16 ] 17 }, 18 { 19 "user_name": "userB", 20 "posts": [ 21 { 22 "post_name": "postB", 23 "comments": [ 24 { 25 "body": "foo" 26 }, 27 { 28 "body": "foo" 29 } 30 ] 31 } 32 ] 33 } 34]

(上記の json データだと紛らわしいとの指摘を受けましたので、以下テーブルデータも併記しました。)
users テーブル:

idname
1userA
2userB

posts テーブル

iduser_id
11
22

comments テーブル

idpost_idbody
11foo
21bar
32foo
42foo

このデータに対して、以下のように検索したいです。

  1. postsを持つusers;
  2. さらにそのpostscommentsを持つ;
  3. さらにそのcommentsすべては "foo" を含む.

例のデータの場合ですと、上記条件をクリアしたユーザはuserBとなります。

サブクエでできるのは分かりますが、パフォーマンスが良くなく、joinで実現できないでしょうか?
(上記はのサンプルのリレーションシップは3層だけですが、実際はもっとリレーションシップが深いです。)
それか、別のもっといいやり方はあるのでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yambejp

2018/10/24 09:15

jsonとmysqlの関係がいまいちどうしたいかわかりません。json型のカラムにご指示のデータを流し込んでいいのでしょうか?それとも配列の要素ごとを1データずつ保持するのでしょうか?
xipx_osx

2018/10/24 10:01 編集

jsonはあくまでも疑似データです、本当はテーブルです。こちらのほうがリレーションシップを分かりやすく表現できると思い、jsonにしました。
yambejp

2018/10/24 10:10

mysql5.7以降にはjson型カラムがあるので、質問のデータ提示は紛らわしいですね。sqlのデータを提示するならcreate table + insert intoもしくは所定のtableを利用して提示するようにしてください
xipx_osx

2018/10/24 11:36

なるほどですね、、テーブルデータを付加しました。
guest

回答3

0

commentsがあって、'foo'以外が無いものとすれば、commentsが全て'foo'という事になります。
※commentsの有る無しが関係ないなら、最後の条件は不要。

SQL

1select * 2from users 3where not exists( 4 select 1 from posts inner join comments on posts.id=comments.post_id 5 where posts.user_id=users.id and comments.body<>'foo' 6 ) 7 and exists( 8 select 1 from posts inner join comments on posts.id=comments.post_id 9 where posts.user_id=users.id 10 )

追記

users の行を求めたいのだから、keyのレベルを合わせるのにはサブクエリーが必須になるんですよね。
一応別パターン

SQL

1select * 2from users inner join ( 3 select user_id from posts inner join comments on posts.id=comments.post_id 4 group by user_id 5 having count(*)=sum(case when comments.body='foo' then 1 else 0 end) 6 ) cond on cond.user_id=users.id

投稿2018/10/24 08:38

編集2018/10/27 03:40
sazi

総合スコア25195

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

xipx_osx

2018/10/24 10:13 編集

ありがとうございます! 実は私のいう「サブクエリのやり方」がこれです。 いわゆる`correlated-subquery`を避けたくて…(パフォーマンスの悪化がひどいです) やはり join だけでは実現難しいのでしょうか…?
sazi

2018/10/24 15:53

サブクエリーといってもexistsは比較的高速だと思いますけど。 何に対してのパフォーマンス悪化なのかはは分かりませんが、適切なインデックスが設定されていないのでhないでしょうか。
guest

0

ベストアンサー

こんな感じでしょうか?(あれ?既存の回答と同じかな?)

  • 元データ

SQL

1create table users(id int primary key,name varchar(10),index(name)); 2insert into users values(1,'userA'),(2,'userB'),(3,'userC'),(4,'userD'),(5,'userE'); 3create table posts(id int primary key,user_id int,index(user_id)); 4insert into posts values(1,1),(2,2),(3,3),(4,4); 5create table comments(id int primary key,post_id int,body varchar(30),index(post_id,body)); 6insert into comments values(1,1,'foo'),(2,1,'bar'),(3,2,'foo'),(4,2,'foo'),(5,3,'foo');

※userEはpostsがない
※userDはpostsがあるけどpostsがcommentsを持っていない
※userAはcommentsがfooを含んでいないものを持っている

  • 検索

SQL

1select * from users as t1 2inner join posts as t2 on t1.id=t2.user_id 3and exists( 4select 1 from comments 5group by post_id 6having sum((body regexp 'foo'))=count(*) 7and post_id=t2.id 8);

※ロジックがおかしかったので修正しました

投稿2018/10/24 12:13

編集2018/10/25 01:04
yambejp

総合スコア114843

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yambejp

2018/10/24 12:15

つまりfooを含まないcommentsをもつid以外のpostsに対してusersを拾う
xipx_osx

2018/10/24 12:31

ありがとうございます!なるほど!こういう書き方もできたんですね。 やはり`correlated-subquery`は避けられないのでしょうか。。?
yambejp

2018/10/25 01:05

なんかおかしかったので修正しました。 インデックスを効かせましたがまだ遅そうですか?
guest

0

######修正分

サブクエリで遅いというのは、こんな感じにした場合ことでしょうか?
SQLがあると、アドバイスがつきやすいかもしれません。

sql

1select ... 2from users 3join posts 4 on ... 5join (select ... // fooの数とコメントの数が一致していれば、postsとcommentsをjoinできるような要素を出力する 6 from comments 7 goup by postid) as filterdComments 8 on ... 9join comments 10 on ...

投稿2018/10/24 07:28

編集2018/10/24 08:22
退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

xipx_osx

2018/10/24 08:06 編集

味噌は **commentsのすべては "foo" を含む.** ところです。 お示しいただいた例ですと、おそらく ALL ではなく、SOME になるかと。
退会済みユーザー

退会済みユーザー

2018/10/24 08:11

commentが全てfooの場合のpostが欲しいということでしょうか?
xipx_osx

2018/10/24 09:58 編集

「すべての post が持つすべての comment がfooを含む」を持つユーザ、が欲しいということです。
退会済みユーザー

退会済みユーザー

2018/10/24 10:02

なるほど。ごめんなさい、質問に書かれているのを見落としてしまっていました。私も回答しましたが、saziさんの回答のほうがスマートに思えるので、そちらを支持します。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問