質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
BigQuery

BigQueryは、Google Cloud Platformが提供しているビッグデータ解析サービス。数TB(テラバイト)またはPB(ペタバイト)の膨大なデータに対し、SQL風のクエリを実行し、高速で集計・分析を行うサービスです。

Q&A

解決済

2回答

463閲覧

GCPのBigqueryを用いて、不要な文字列のみをマスキング

tarou_tabi

総合スコア6

BigQuery

BigQueryは、Google Cloud Platformが提供しているビッグデータ解析サービス。数TB(テラバイト)またはPB(ペタバイト)の膨大なデータに対し、SQL風のクエリを実行し、高速で集計・分析を行うサービスです。

0グッド

1クリップ

投稿2022/02/23 23:10

編集2022/02/23 23:15

こんにちは。
GCPのBigqueryにて、下記のような事をしたいのですが、やり方が分からずに困っています。
お知恵をお貸し頂けたらと思います。

<前提・実現したいこと>
TBL_AからTBL_Bを1発のSQLで作成したい。
TBL_Bの各カラムは下記の通り。
No:TBL_Aと同じ
name:TBL_Aと同じ
recipe_masking:TBL_Aのrecipe列の材料名のみを残し、「*」でマスキング

各テーブルのイメージは下記の通りです。
○TBL_A

Nonamerecipe
1野菜炒めキャベツざく切り、にんじん拍子切り、玉葱薄切りにして豚肉と炒める
2カレー牛肉を炒めた後、ジャガイモ、にんじん、玉葱を切り、同じ鍋で炒める

○TBL_B

Nonamerecipe_masking
1野菜炒めキャベツ*****にんじん*****玉葱******豚肉****
2カレー牛肉******ジャガイモ*にんじん*玉葱***********

<発生している問題・エラーメッセージ>
該当なし

<該当のソースコード>
該当なし

<自分で調べたことや試したこと>
下記のようにやれば、材料部分をマスキング出来るのですが、これの逆をやりたいです。
select
No as No
, name as name
, REPLACE(replace(recipe,'キャベツ','****'), 'にんじん', '****) as recipe_masking
from dataset.TBL_A

お忙しい事とは思いますが、ご教示頂けたらと思います。
どうぞ宜しくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

REGEXP_REPLACE 1つにまとめるのは私の腕ではできませんでした。
マスク時に文字数は維持するという要件であるならば今回は実現できていません。もしかしたら正規表現では無理かもしれず、その場合は BigQuery の UDF を使って Javascript で変換するのがよいと思います。

with a1 as ( select 'レシピは、キャベツざく切り、にんじん拍子切り、玉葱薄切りにして豚肉と炒める' as str ), a2 as ( select REGEXP_REPLACE(str,'(.*?)(キャベツ|にんじん|玉葱|豚肉)(.*?)','***\\2***') as str from a1 ), a3 as ( select REGEXP_REPLACE(str, '^(.*)(キャベツ|にんじん|玉葱|豚肉)(.*?)$','\\1\\2***') as str from a2 ) select * from a3

結果:

***キャベツ******にんじん******玉葱******豚肉***

投稿2022/02/24 02:30

68user

総合スコア2005

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tarou_tabi

2022/02/24 03:10

68user様 ご回答、ありがとうございます。 *の文字数を維持するのは難しいのですね。 実は先程、社内の有識者にも相談したのですが、68user様のご回答と同様、やるならUDFを使うのが良いとのことでした。 仕様変更も含めて、もう一度相談してみます。 ありがとうございました!!
tarou_tabi

2022/02/24 10:41

結局、UDFにて対応することになりました。 ありがとうございました。
guest

0

結局、SQLで実施は難しいので、UDFにて対応することになりました。
回答下さった68user様、閲覧くださった皆様、ありがとうございました。

投稿2022/02/24 10:44

tarou_tabi

総合スコア6

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問