質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
PostgreSQL

PostgreSQLはオープンソースのオブジェクトリレーショナルデータベース管理システムです。 Oracle Databaseで使われるPL/SQLを参考に実装されたビルトイン言語で、Windows、 Mac、Linux、UNIX、MSなどいくつものプラットフォームに対応しています。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Ajax

Ajaxとは、Webブラウザ内で搭載されているJavaScriptのHTTP通信機能を使って非同期通信を利用し、インターフェイスの構築などを行う技術の総称です。XMLドキュメントを指定したURLから読み込み、画面描画やユーザの操作などと並行してサーバと非同期に通信するWebアプリケーションを実現することができます。

Q&A

4回答

3923閲覧

NOT EXISTS中のwhere句をcase when で分岐させると取得に時間がかかりすぎる。

shakesuke

総合スコア6

PostgreSQL

PostgreSQLはオープンソースのオブジェクトリレーショナルデータベース管理システムです。 Oracle Databaseで使われるPL/SQLを参考に実装されたビルトイン言語で、Windows、 Mac、Linux、UNIX、MSなどいくつものプラットフォームに対応しています。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Ajax

Ajaxとは、Webブラウザ内で搭載されているJavaScriptのHTTP通信機能を使って非同期通信を利用し、インターフェイスの構築などを行う技術の総称です。XMLドキュメントを指定したURLから読み込み、画面描画やユーザの操作などと並行してサーバと非同期に通信するWebアプリケーションを実現することができます。

0グッド

1クリップ

投稿2020/02/28 01:00

前提・実現したいこと

以下のテーブルから
・同一レコードからcreate_dateが最新のものだけを取得したい
・同一レコードかどうかの判断は、
house_codeに値が入っていればhouse_codeが同じもの
house_codeがnullか''なら、product_nameが同じもの。

sql

1CREATE TABLE tbl_products ( 2 product_id integer NOT NULL, 3 product_name character varying (100), 4 house_code character varying (48), 5 create_date timestamp without time zone DEFAULT now() NOT NULL 6);

例えばこのようなレコードから
|ID| product_name| house_code| create_date|
|:--|:--:|--:|
1|い|1111|2020-02-18 12:46:37|
2|い| |2020-02-19 12:46:37|
3|は|2222|2020-02-20 12:46:37|
4|は| |2020-02-21 12:46:37|
5|ほ|3333|2020-02-22 12:46:37|
6|へ|3333|2020-02-23 12:46:37|
7|へ| |2020-02-24 12:46:37|

こういった結果のデータを取得したいと思っています。
|ID| product_name| house_code| create_date|
|:--|:--:|--:|
2|い| |2020-02-19 12:46:37|
4|は| |2020-02-21 12:46:37|
6|へ|3333|2020-02-23 12:46:37|
7|へ| |2020-02-24 12:46:37|

そこで現在こちらのsqlを作成したのですが、件数が10000で取得に5分以上かかります。

sql

1SELECT * 2FROM tbl_products AS a 3WHERE NOT EXISTS ( 4 SELECT 1 5 FROM tbl_products AS b 6 WHERE 7 (CASE 8 WHEN length(a.house_code) > 0 THEN a.product_name = b.product_name 9 ELSE a.house_code = b.house_code 10 END 11 ) 12 AND a.create_date < b.create_date 13); 14 15 16**NOT EXISTS中のwhere句をcase when で分岐させている**のが遅くさせている原因だと思うのですが、他にやり方が分からず立ち止まっている状態です。 17何かほかに良いsqlがあれば教えていただけないでしょうか? 18

試したこと

サブクエリでgroup byを使って取得するsqlで上手くいくのではないかと、現在試行錯誤しています。

補足情報(FW/ツールのバージョンなど)

現在postgresql9.6で開発をしています。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

workaholist

2020/02/28 01:10 編集

まずグループ化してそのグループごとに最新日付のレコードを取りたいのだと思いますが、 グループ化する条件をかくにんさせてください。 ①house_codeに値が入っていればhouse_codeが同じもの ②house_codeがnullか''なら、product_nameが同じもの の条件がよくわかりませんでした。 比較元がhouse_codeなし、比較先がhouse_codeあり であればどちらのルールが採用されるのですか?
m.ts10806

2020/02/28 01:34

実行計画とってみてください。
shakesuke

2020/02/28 01:48 編集

返信ありがとうございます。 >>workaholistさん 比較元を採用します。 >>m.ts10806さん postgresqlのクエリ実行計画を取ったことがないので、少々お時間をください。 取れたらこちらに書き込みます。 ちなみに現在phpPgAdminで直接こちらのsqlを実行しても5分ほどかかってしまいます。
m.ts10806

2020/02/28 01:51

Analyze もつけたほうがどこに問題があるか時間かかっているか観れますので、そちらを。
shakesuke

2020/02/28 01:54

>>m.ts10806さん アドバイスありがとうございます。 やってみます。
yureighost

2020/02/28 03:22

取得結果で分かりづらいのが、「い」や「は」は一つだけなのに、 「へ」は二つ取れているところですね。 複数のproduct_nameに跨るhouse_codeの場合はproduct_nameが複数取得されるのは容認するってことでしょうか。
guest

回答4

0

通常は別テーブルとして持つべきマスターテーブルとしての情報と履歴テーブルとしての情報をいっしょくたに持っていませんか?そのために同一キー(今回はproduct_name)の中で最新のデータを取得しなければならないのが負荷になっているのでは?

質問にインデックスの情報も追記した方が良いです。

SQL

1CASE 2 WHEN length(a.house_code) > 0 THEN a.product_name = b.product_name 3 ELSE a.house_code = b.house_code 4END

見るからにパフォーマンスが悪そう。

実行計画 PostgreSQLの実行計画について調べてみた が効率的かも確認しましょう。

EXISTS, NOT EXISTS などの副問合せを多用しなければならない場合もテーブル設計の正規化が間違っている場合が多いです。

投稿2020/02/28 01:54

Orlofsky

総合スコア16415

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

主な理由としては履歴テーブルと混在してるせいで処理速度が落ちてる以外なんでもない

実行計画もなにもためさんけどインデックス処理ができるSQLを組みましょう
以下のように二つに分けたほうが早い場合が多いです。

SELECT * FROM tbl_products AS a WHERE NOT EXISTS ( SELECT 1 FROM tbl_products AS b WHERE a.product_name = b.product_name AND a.house_code IS NULL AND a.create_date < b.create_date -- 履歴テーブルは基本別にしましょう。遅い原因の一つです。 ) AND NOT EXISTS ( SELECT 1 FROM tbl_products AS b WHERE a.house_code = b.house_code AND a.create_date < b.create_date -- 同上 ) );

投稿2020/03/01 03:17

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

10000件ではテストできておりませんが。例題とは同じ結果

sql

1with house_tbl AS (select a.* from tbl_products a join 2(select house_code, max(create_date) create_date from tbl_products where house_code is not null group by house_code having(count(*)>1)) b 3using (house_code,create_date) 4), name_tbl AS (select a.* from tbl_products a join 5(select product_name, max(create_date) create_date from tbl_products where house_code is null group by 1) b 6using (product_name,create_date) 7) 8select * from house_tbl 9union all 10select name_tbl.* from name_tbl left join house_tbl using(product_id) where house_tbl.product_id is null 11order by 1;

WHERE句のCASEにて、こんな書き方できるんですね。

sql

1SELECT a.* FROM tbl_products AS a, 2tbl_products AS b 3WHERE 4 CASE WHEN a.house_code is NULL THEN a.product_name = b.product_name 5 ELSE a.house_code = b.house_code 6 END 7 AND a.create_date>b.create_date 8;

投稿2020/02/29 17:16

編集2020/03/01 03:09
amura

総合スコア333

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

https://www.postgresql.jp/document/9.4/html/tutorial-window.html

rank関数を使えばできそうな気がします(PostgreSQLは持っていないので動作未検証ですが)。

sql

1-- 同一house_codeで、create_dateが大きい1件を取得する(house_code がnullでも''でもない場合) 2SELECT ID, product_name, house_code, create_date 3FROM 4 (SELECT ID, product_name, house_code, create_date, 5 rank() OVER (PARTITION BY house_code ORDER BY create_date DESC) AS pos 6 FROM tbl_products 7 WHERE (house_code IS NOT NULL AND house_code <> '') 8 ) AS house_code_rank 9WHERE pos = 1 10 11-- これの上と下のSELECT結果を連結する 12UNION ALL 13 14-- 同一product_nameで、create_dateが大きい1件を取得する(house_code がnullか''の場合) 15SELECT ID, product_name, house_code, create_date 16FROM 17 (SELECT ID, product_name, house_code, create_date, 18 rank() OVER (PARTITION BY product_name ORDER BY create_date DESC) AS pos 19 FROM tbl_products 20 WHERE (house_code IS NULL OR house_code = '') 21 ) AS product_name_rank 22WHERE pos = 1;

投稿2020/02/28 04:23

nak

総合スコア696

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問