質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
PostgreSQL

PostgreSQLはオープンソースのオブジェクトリレーショナルデータベース管理システムです。 Oracle Databaseで使われるPL/SQLを参考に実装されたビルトイン言語で、Windows、 Mac、Linux、UNIX、MSなどいくつものプラットフォームに対応しています。

SQLAlchemy

SQLAlchemyとはPython 用のORMライブラリです。MIT Licenceのオープンソースとして提供されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

386閲覧

PostgreSQLに保管しているデータから、期間を指定してデータフレーム化したい

karakarakarappo

総合スコア28

PostgreSQL

PostgreSQLはオープンソースのオブジェクトリレーショナルデータベース管理システムです。 Oracle Databaseで使われるPL/SQLを参考に実装されたビルトイン言語で、Windows、 Mac、Linux、UNIX、MSなどいくつものプラットフォームに対応しています。

SQLAlchemy

SQLAlchemyとはPython 用のORMライブラリです。MIT Licenceのオープンソースとして提供されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2022/07/22 13:44

表題の件がうまくいかず、知見をお持ちの方にご協力いただきたく投稿しました。

PostgreSQL内データを、期間を指定してデータフレーム化したいのですが
以下のようなエラーが発生しています。

「>」が問題のようなのですが、調べた限り他の記載の方法が不明でした。
できれば、「今日から数えて30日間」のように期間指定したいです。

抽出条件について、ご享受お願いします。

前提要件

・DBのテーブル名は「TEST」
・日付のカラム名は「date」で、まだデータタイプはは'date'になっています。
・DBへの接続は問題ありません。

エラー内容

python

1import psycopg2 2import pandas as pd 3from sqlalchemy import create_engine 4 5df = pd.read_sql(sql='SELECT * FROM TEST WHERE "date" > 2022/04/01; ', con=engine) 6df 7

なお、上記コード内の「WHERE "date" > 2022/04/01」を抜くと、問題なくデータフレームの表示ができました。

error

1ProgrammingError: (psycopg2.errors.UndefinedFunction) 演算子が存在しません: date > integer 2LINE 1: ...ELECT * FROM TEST WHERE "date" > 2022/04/... 3 ^ 4HINT: 指定した名称と引数の型に合う演算子がありません。明示的な型キャストが必要かもしれません。 5 6[SQL: SELECT * FROM TEST WHERE "date" > 2022/04/01; ] 7(Background on this error at: https://sqlalche.me/e/14/f405) 8

データフレーム化したあとに日付で指定するしかないんですかね。。。。

以上、よろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

melian

2022/07/22 14:30

SQL は全く分からないのですが、 df = pd.read_sql(sql="SELECT * FROM TEST WHERE `date` > '2022/04/01'; ", con=engine) とするとよいかもしれません。
karakarakarappo

2022/07/22 14:58

コメントありがとうございます。 その場合も試したのですが、「2022/04/01という列は存在しません」みたいなErrorが返ってきたため、この記載方法は誤っているのだと考え、質問には記載しておりませんでした。 現状他の書き方も試しているのですが、まだ解決には至っておりません。
melian

2022/07/23 06:23

先のコメントで書きました以下をそのままコピペして試してみて下さい。 df = pd.read_sql(sql="SELECT * FROM TEST WHERE `date` > '2022/04/01'; ", con=engine)
karakarakarappo

2022/07/23 06:29

コメントありがとうございます。はい、コピペで試しました。 以下のような構文エラーとなりました。 ProgrammingError: (psycopg2.errors.SyntaxError) ">"またはその近辺で構文エラー LINE 1: ...ELECT * FROM TEST WHERE `date` > '2022-04... ^ [SQL: SELECT * FROM TEST WHERE `date` > '2022-04-01'; ] (Background on this error at: https://sqlalche.me/e/14/f405) そもそも「>」というのを認識しないようです。 追加でコメントいただけることがありましたら、引き続きよろしくお願い致します。
guest

回答1

0

ベストアンサー

PostgreSQLは2022/04/01という部分を数値と解釈し(2022÷4÷1)、数値と日付型を比較しようとしてエラーになっています。

したがって、2022/04/01という部分をPostgreSQLが日付として解釈できるような値に変えてやる必要があります。たとえば以下のようにすればよいでしょう。

SQL

1SELECT * FROM TEST WHERE date > '2022-04-01'

参考: https://www.postgresql.org/docs/current/datatype-datetime.html


できれば、「今日から数えて30日間」のように期間指定したいです。

やりかたはいろいろあると思いますが、たとえば以下のようにするのはどうでしょうか?

SQL

1SELECT * FROM test WHERE date > CURRENT_DATE - INTERVAL '30 DAY'

投稿2022/07/22 15:48

neko_the_shadow

総合スコア2230

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

karakarakarappo

2022/07/22 16:02

コメント頂きありがとうございます。 頂いた内容がすごいそれっぽかったのですが、以下のようにエラーが吐き出されました。 """ ProgrammingError: (psycopg2.errors.UndefinedColumn) 列"2022-04-01"は存在しません LINE 1: ...ELECT * FROM test WHERE date > "2022-04-0... ^ [SQL: SELECT * FROM test WHERE date > "2022-04-01"] (Background on this error at: https://sqlalche.me/e/14/f405) """ 記載いただいたものは、pythonを通していない、SQL文ということでよろしいでしょうか。 また、SQLからデータフレームに変換するタイミングで読み取りがバグっているのかと思いデータ型の確認をしてみたのですが、なんでかタイプがobjectになっていて、これも原因の1つになっているのではと感じております。。。 #print(df.dtypes) #date object なにか追加でご教示いただけることがありましたら、再度コメントよろしくお願い致します。
karakarakarappo

2022/07/23 06:15

再度コメントありがとうございました。 また、正しい書き方についてご教示頂きありがとうございます。 しかし、シングルクォーテーション(')で囲んだ場合だと、構文エラーが発生していたため、ダブルクオーテーション(")で試したものを記載しておりました。 df = pd.read_sql(sql= 'SELECT * FROM ttest WHERE date > '2022-04-01';' , con=engine) ^ SyntaxError: invalid syntax 恐れ入りますが、他に考えられるエラーの原因はご存じないでしょうか。 よろしくお願い致します。
neko_the_shadow

2022/07/23 08:17

Python文字列の囲み文字をダブルクォーテーションにするか、エスケープシーケンスを利用するとよいかと思います。 "SELECT * FROM ttest WHERE date > '2022-04-01';" 'SELECT * FROM ttest WHERE date > \'2022-04-01\';'
karakarakarappo

2022/07/23 10:17

再度のコメントありがとうございます。 以下のコードに変換することで対応できました。 非常に助かりました、誠にありがとうございます。 "SELECT * FROM ttest WHERE date > '2022-04-01';"
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問