質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

3回答

714閲覧

正規表現を教えてもらいたい

Yeeeee

総合スコア18

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/11/30 04:21

t = "SELECT 基本情報,地域,入出,転出 FROM user WHERE hogehoge('a','bbb','ccc','ddd') AND BETWEEN '2018-01-01 00:00:00' AND '2018-03-01 00:00:00"

という文字列があるとします。
任意の文字列で改行をおこない、下記のような形に仕上げたいと考えています。

SELECT 基本情報 ,地域 ,入出 ,転出 FROM user WHERE hogehoge('a','bbb','ccc','ddd') AND hoteotehote BETWEEN '2018-01-01 00:00:00' AND '2018-03-01 00:00:00 AND (tokyo, kanagawa)

<現状>
replace(",", "¥n, ")のreplace関数で作成したのですが、
下記のようになってしまいます。

SELECT 基本情報 ,地域 ,入出 ,転出 FROM user WHERE hogehoge('a' ,'bbb' ,'ccc' ,'ddd') AND hoteotehote BETWEEN '2018-01-01 00:00:00' AND '2018-03-01 00:00:00 AND (tokyo , kanagawa)

<やりたいこと>
1.WHERE 以降の , の改行を行いたくない
2. ANDで開業はするが
「BETWEEN〜AND」があるばあい、「BETWEEN〜AND」のANDでは開業は行いたくない

です。

お力添えください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Zuishin

2020/11/30 04:39 編集

一般的な SQL だとカッコの扱いや文字列など他にもルールが出てくると思います。それは自分でできるんでしょうか? 逆にこれしかないのであれば手で整形すればいいだけのようにも思います。 既存のツールで整形するという手もあります。 https://style.potepan.com/articles/16725.html
Yeeeee

2020/11/30 04:45

確かに手で整形すれば良いのですが、整形するファイル数がかなりあるので、手動で行っていると膨大な時間がかかってしまうため何か対処法はないかというところです。
Zuishin

2020/11/30 04:56

SQL を整形するツールはたくさんあり、中には細かな制御オプションができるものもあると思います。大量ならなおさらそれを使う方が良いと思います。手を抜いて置換したのでは、最悪動かなくなります。
Zuishin

2020/11/30 04:59

またタイトルに「正規表現」とありますが、正規表現はネストに弱いので、全ての SQL に使用できるものを作るのは困難です。 この質問に載っているものだけ扱えれば良いのであれば簡単ですが。
Yeeeee

2020/11/30 10:49

やはり難しいですか。 ありがとうございます。
guest

回答3

0

ベストアンサー

入力文字列にhoteotehoteが入っていなかったので追加しました。

正規表現一つだけでは難しいと思います。
インデントは期待されるものとは違っています。

python

1>>> def decomp_sql(s): 2... return re.sub(r'([ ,])', r'\1\n',re.sub('WHERE.*', '', s))+'WHERE\n'+re.sub(r'(BETWEEN[^\n]*)\nAND\n', r'\1AND',re.sub(r'AND', '\nAND\n', re.sub('.*WHERE', '', s))) 3... 4>>> t = "SELECT 基本情報,地域,入出,転出 FROM user WHERE hogehoge('a','bbb','ccc','ddd') AND hoteotehote BETWEEN '2018-01-01 00:00:00' AND '2018-03-01 00:00:00' AND (tokyo, kanagawa)" 5>>> print(decomp_sql(t)) 6SELECT 7基本情報, 8地域, 9入出, 10転出 11FROM 12user 13WHERE 14 hogehoge('a','bbb','ccc','ddd') 15AND 16 hoteotehote BETWEEN '2018-01-01 00:00:00' AND '2018-03-01 00:00:00' 17AND 18 (tokyo, kanagawa)

投稿2020/11/30 09:34

編集2020/11/30 09:44
ppaul

総合スコア24666

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Yeeeee

2020/11/30 16:14

ありがとうございます。 やはりむずかしいですか。 コード参考にさせてもらいます。
guest

0

とりあえず、

Python

1result = re.sub(r"((?:\w+)?(.*?)|'.*?'|\w+)", r"\1\n", t)

でそこそこ出来ます。全部満足するにはちゃんとした構文解析をしないと無理でしょう。

投稿2020/11/30 05:08

編集2020/11/30 05:37
otn

総合スコア84796

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

漢字範囲を ⺀(2E80)~鿕(9FD5) として

Python

1import re 2 3t = "SELECT 基本情報,地域,入出,転出 FROM user WHERE hogehoge('a','bbb','ccc','ddd') AND hoteotehote BETWEEN '2018-01-01 00:00:00' AND '2018-03-01 00:00:00' AND (tokyo, kanagawa)" 4 5result = re.sub(r"(\w+\sBETWEEN.*?AND.*?'\s|(.*?)|\w+(.*?)|.[\u2E80-\u9FD5]+|.+?\s)", r"\1\n", t) 6print(result) 7""" 8SELECT 9基本情報 10,地域 11,入出 12,転出 13 FROM 14user 15WHERE 16hogehoge('a','bbb','ccc','ddd') 17 AND 18hoteotehote BETWEEN '2018-01-01 00:00:00' AND '2018-03-01 00:00:00' 19AND 20(tokyo, kanagawa) 21 22"""

投稿2020/11/30 12:40

lehshell

総合スコア1147

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問