質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
pgAdmin

pgAdminは、オープンソースのPostgreSQL管理ツール。様々な機能を持ち、コマンドラインベースでPostgreSQLへ行う操作のほとんどをpgAdminを用いて実行することができます。

PostgreSQL

PostgreSQLはオープンソースのオブジェクトリレーショナルデータベース管理システムです。 Oracle Databaseで使われるPL/SQLを参考に実装されたビルトイン言語で、Windows、 Mac、Linux、UNIX、MSなどいくつものプラットフォームに対応しています。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

Q&A

解決済

2回答

670閲覧

SQLクエリを実行するたびに抽出されるレコードの件数が変わってしまう

heji

総合スコア12

pgAdmin

pgAdminは、オープンソースのPostgreSQL管理ツール。様々な機能を持ち、コマンドラインベースでPostgreSQLへ行う操作のほとんどをpgAdminを用いて実行することができます。

PostgreSQL

PostgreSQLはオープンソースのオブジェクトリレーショナルデータベース管理システムです。 Oracle Databaseで使われるPL/SQLを参考に実装されたビルトイン言語で、Windows、 Mac、Linux、UNIX、MSなどいくつものプラットフォームに対応しています。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

0グッド

0クリップ

投稿2022/06/20 12:01

PostgreSQL 14で以下のクエリを実行したところ、実行するたびに抽出されるレコードの件数がおよそ1割前後の幅で変動し困っています。

テーブルの構成は (id1 date, id2 varchar, 計測時刻 timestamp, 属性A varchar, 条件1 integer) で、時系列で変化する属性Aが目的の順序ABCDで推移している個体を抽出することが目的です。
もちろん実行中にレコードの書き換えは行われておらず、サブクエリsb1の時点では件数の揺れは見られませんでした。

環境は Windows 10 Pro for Workstation, PostgreSQL 14.3, pgAdmin 4で、localhost上のDBに対して実行しています。

どのような原因が考えられるでしょうか。また可能なら、このような場合にどのような手段で原因に検討をつけるのが良いでしょうか。どうかご教示お願い致します。

WITH sb2 AS( SELECT id1, id2, LAG (属性A, 2) OVER 条件 AS 前2, LAG (属性A, 1) OVER 条件 AS 前1, 属性A, LEAD (属性A, 1) OVER 条件 AS 後1 FROM( -- 個体ごとに同一属性のレコードは1件を残して取捨する SELECT DISTINCT ON(id1, id2, 属性A) id1, id2, 属性A, 計測時刻 FROM テーブル1 WHERE 条件1 = 1 AND 属性A is not null AND 計測時刻::time >= time '8:00:00' AND 計測時刻::time < time '20:00:00' )sb1 WINDOW 条件 AS (PARTITION BY id1, id2 ORDER BY id1 ASC, id2 ASC, 計測時刻 ASC) ) SELECT * FROM sb2 WHERE 前2 = 'A' AND 前1 = 'B' AND 属性A = 'C' AND 後1 = 'D'

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

sazi

2022/06/20 16:31

無知で申し訳ないですが、 WINDOW 条件 AS (PARTITION BY id1, id2 ORDER BY id1 ASC, id2 ASC, 計測時刻 ASC) とは何でしょう? リファレンスなどで示してもらえると助かります。
Orlofsky

2022/06/21 11:12

質問にCREATE TABLE文くらいは載せては?
guest

回答2

0

ベストアンサー

件数については、DISTINCTを使用せずに、order by を明示してlimitで件数を限定するようにしてみてください。

投稿2022/06/20 16:35

sazi

総合スコア25195

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

heji

2022/06/21 12:53

ORDER BYを使わない限りクエリの抽出される順序が一定に定まらないことが、続くクエリの抽出結果を不安定にする原因のようでした。 ORDER BYの使用を促してくださったことが助けになりました。 ご回答ありがとうございました。
guest

0

不要かもしれませんが、DISTINCT ONを使用せず書き換えたクエリを残しておきます。

DISTINCT ONはLIMITのような最終的な取得件数を制限する目的ではなく、例として AAAnullnullBBnullCCCDnullnull という順で属性Aが推移した個体について、nullおよび属性Aが重複するレコードを除外し、ABCDという4件のレコードに整理するために考えたものでした。こうして整理した上で、LAGとLEADで時系列の推移を確認しました。
(AABBnullnullCD -> ABCD、BBCnullBAAnullBCCD -> BCBABCD、など)

推移の間にnullが挟まっても良い点や、2種類のIDの掛け合わせで個体を識別している点(WINDOW句の使用)など、私の説明の足りない点が多かったかと思います。テーブル自体についても情報が足りない中で原因を考えてくださったことは申し訳ありません。

またそもそも当初のクエリでは、たとえDISTINCT ONの対象になるレコードの順序が一定に定まったとしても、BABCDのような推移をした個体がBACDの時系列に整理されるため、ABCDの推移をしているにも関わらず正しく抽出されない初歩的な間違いがありましたので、その修正も含んでいます。まぎらわしい誤解を含む質問でした。ごめんなさい。

SQL

1CREATE TABLE テーブル1( 2id1 date, id2 varchar, 計測時刻 timestamp without time zone, 属性A varchar, 条件1 integer 3); 4-- id1は計測開始日。id2は計測開始時に再割り当てをする。 5-- id2は計測開始日が異なると重複するおそれがあるのでid1とかけ合わせて識別する。 6INSERT INTO テーブル1 7VALUES ('2022-06-01', '0001', '2022-06-01 19:30:00', null, 1) 8VALUES ('2022-06-01', '0001', '2022-06-01 20:30:00', 'A', 1) 9VALUES ('2022-06-01', '0001', '2022-06-01 21:30:00', 'B', 1) 10VALUES ('2022-06-01', '0001', '2022-06-01 22:30:00', null, 1) 11VALUES ('2022-06-01', '0001', '2022-06-01 23:30:00', 'C', 1) 12VALUES ('2022-06-01', '0001', '2022-06-02 0:30:00', null, 1) 13VALUES ('2022-06-01', '0001', '2022-06-02 1:30:00', 'D', 1) 14VALUES ('2022-06-03', '0010', '2022-06-03 8:30:00', 'B', 1) 15VALUES ('2022-06-03', '0010', '2022-06-03 9:30:00', 'A', 1) 16VALUES ('2022-06-03', '0010', '2022-06-03 10:30:00', 'B', 1) 17VALUES ('2022-06-03', '0010', '2022-06-03 11:30:00', 'C', 1) 18VALUES ('2022-06-03', '0010', '2022-06-03 12:30:00', 'D', 1) 19VALUES ('2022-06-03', '0010', '2022-06-03 13:30:00', null, 1);

SQL

1WITH wth AS( 2 SELECT id1, id2, 3 LAG (属性A, 2) OVER 条件 AS2, 4 LAG (属性A, 1) OVER 条件 AS1, 5 属性A, 6 LEAD (属性A, 1) OVER 条件 AS1 7 FROM( 8 SELECT * FROM( 9 SELECT id1, id2, 属性A, 属性A IS DISTINCT FROM LAG(属性A) OVER 条件 AS ここで変化, 計測時刻 10 FROM テーブル1 11 WHERE 条件1 = 1 12 AND 属性A is not null 13 AND 計測時刻::time >= time '8:00:00' AND 計測時刻::time < time '20:00:00' 14 WINDOW 条件 AS (PARTITION BY id1, id2 ORDER BY id1 ASC, id2 ASC, 計測時刻 ASC) 15 )sb1 16 WHERE ここで変化 = TRUE 17 )sb2 18 WINDOW 条件 AS (PARTITION BY id1, id2 ORDER BY id1 ASC, id2 ASC, 計測時刻 ASC) 19) 20SELECT * FROM wth 21WHERE2 = 'A' AND1 = 'B' AND 属性A = 'C' AND1 = 'D'

投稿2022/06/21 12:53

heji

総合スコア12

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問