質問するログイン新規登録
SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

MariaDB

MariaDBは、MySQL派生のオープンソースなリレーショナルデータベースシステムです。 また、MySQLとほぼ同じデータベースエンジンに対応しています。

Q&A

解決済

2回答

416閲覧

SQL 正規表現を用いた置換

bowbow

総合スコア2

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

MariaDB

MariaDBは、MySQL派生のオープンソースなリレーショナルデータベースシステムです。 また、MySQLとほぼ同じデータベースエンジンに対応しています。

0グッド

0クリップ

投稿2023/12/17 13:54

0

0

実現したいこと

SQL 正規表現を用いた置換

前提

抽出したレコード(apple, orange, melonの語を各0個以上含む文字列)の中身の"apple", "orange", "melon"のみを残して,それ以外の文字を消したい。
"apple", "orange", "melon"の個数や並びを一目見て分かるようにしたい。

該当のソースコード

MariaDB_10.XX

1SELECT 2REGEXP_REPLACE(col_name, '[^apple]', '') 3FROM tbl_name;

とすると,"apple"という文字列だけでなく,"a", "p", "l", "e"という単一文字も残ってしまいます。
例えば, abc apple abc というデータがあったときは,aappleaのようになります。
"apple", "orange", "melon"の文字列だけを残すにはどうすればよいでしょうか。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

bowbow

2023/12/19 11:38 編集

「まず、(自分で)学んでください」かあ。。。 懐かしい。全くそのとおりです。感謝です(笑)。 「15分調べてもわからないことは、質問しよう!」というサイトだったので。。。一応言い訳。 正規表現,簡単な処理は簡単なのですが,この自分がしたい処理はなかなか難しくて・・・ もう一度勉強してみます。 ikedas様,ありがとうございました! 取り急ぎお返事まで。
novelistory

2023/12/18 01:53

[]で囲ってしまっているため、[]内のいずれかの文字に一致となってしまっているのではないでしょうか? ▼参考 正規表現を使ったパターンマッチングを行う(REGEXP演算子) https://www.javadrive.jp/mysql/select/index8.html
hoshi-takanori

2023/12/18 08:40 編集

REGEXP_REPLACE(col_name, '.*?(apple|orange|melon|$)', '$1') かなぁ。 追記。mariadb は '$1' じゃなくて '\\1' かも。
bowbow

2023/12/19 10:12

hoshi-takanori様,ありがとうございました!! REGEXP_REPLACE(col_name, '.*?(apple|orange|melon|$)', '\\1') で,ほぼ上手くいきました。 ただ,改行コードが含まれていると,きれいに置換できなかった(例えば,appleの後に改行コードまでの文字列が残ってしまう)ので,次のようにしてみました。 REGEXP_REPLACE(REPLACE(col_name, '\n', ' '), '.*?(apple|orange|melon|$)', '\\1') 改行コードを除いてから,上記の置換を行っています。 冗長な感じですが,うまく置換されました。 また,出力された文字列が,appleorangeのように連結されると見づらくなるので,次のように,置換後の文字に空白スペースを連結してみました。 REGEXP_REPLACE(REPLACE(col_name, '\n', ' '), '.*?(apple|orange|melon|$)', CONCAT('\\1', ' ')) これで,apple orange と表記され,ある程度見やすくなりました。 hoshi-takanori様のおかげで,やりたいことはできるようになったと思います。 ただ,改行コード以外の不具合要因があるかもしれないので,それをもう少し探します。 また,'.*?(apple|orange|melon|$)'という正規表現の構造が複雑で,よく理解できていませんし,'\\1'(まったく初めてでした)についても,もう少し調べてみます。
bowbow

2023/12/19 11:37

hoshi-takanori様,その後の調査報告(と言うか,自分の解釈)です。 ご指摘あればお願い致します!! ************************************************ xxxappleyyyorangezzz(終端) というデータに REGEXP_REPLACE(col_name, '.*?(apple|orange|melon|$)', '\\1') を実行した場合, xxxapple が apple に置換され,  ※'\\1'は強力。便利!! ※ "?"は非貪欲モード用。 yyyorange が orange に置換され, zzz(終端) が (終端) に置換されるのですね。  ※"$"は終端の意味だったのですね。 結果として,appleorange(終端)  になる。 ************************************************ 先ほど,データに改行が含まれている場合,上手く置換されないと述べましたが, 上記の原理が分かれば,解決策を考えられます。 次のようなデータがあったとします。 xxxappleyyy(改行)xxxorangezzz(終端)  REGEXP_REPLACE(col_name, '.*?(apple|orange|melon|$)', '\\1') を実行した場合, xxxapple が appleに置換され, yyy(改行) が 置換されずに yyy(改行) のまま残り,(←ここだけ何故そうなるのかは不明) xxxorange が orangeに置換され, zzz(終端) が (終端) に置換される。 結果として, appleyyy(改行)orange(終端) となります。 yyy(改行)xxxorange を orange に置換してほしいところですが,そうなりません。 何故かは不明です。 ***** しかし,先ほどのSQLに"\n"を付け足して,以下のようにすることにより,不具合が解消されます。 REGEXP_REPLACE(col_name, '.*?(apple|orange|melon|\n|$)', '\\1')  この,SQLを実行すると, xxxapple が appleに置換され, yyy(改行) が (改行) に置換され, xxxorange が orangeに置換され, zzz(終端) が (終端) に置換される。 結果として, apple(改行)orange(終端) となります。 以上の解釈で間違いないでしょうか。
ikedas

2023/12/19 11:49

最終的にご自分で解決できたら(できそうですね)、どうやって解決したかを自分で回答として投稿し、質問を解決済みにしておいてくださいますか。
bowbow

2023/12/19 11:50

hoshi-takanori様,コメントありがとうございます。REGEXP_REPLACE(col_name, '.*?(apple|orange|melon|$)', '\\1')を試したところ,大幅に問題が解決しました! ベストアンサーに選びたいので回答欄に投稿いただけますでしょうか?
guest

回答2

0

自己解決

元データの例(途中に改行がある)

xxxappleyyy
xxxorangezzz

処理 その1

REGEXP_REPLACE(col_name, '.*?(apple|orange|melon|\n|$)', '\\1')

の実行結果

apple
orange

処理 その2

REGEXP_REPLACE(REPLACE(col_name, '\n', ' '), '.*?(apple|orange|melon|$)', CONCAT('\\1', ' '))

の実行結果

apple orange

投稿2023/12/22 01:02

bowbow

総合スコア2

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

文字クラスの書き方を根本的に勘違いされています。

文字クラス: [...], [^...] - JavaScript | MDN

おそらく必要なのはマッチ部分文字列を利用した置換でしょうね。

投稿2023/12/18 04:49

KojiDoi

総合スコア13727

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.30%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問