質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
BigQuery

BigQueryは、Google Cloud Platformが提供しているビッグデータ解析サービス。数TB(テラバイト)またはPB(ペタバイト)の膨大なデータに対し、SQL風のクエリを実行し、高速で集計・分析を行うサービスです。

JSON

JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

Q&A

解決済

1回答

3659閲覧

bigqueryでjson文字列から値を取り出す方法について質問

HR_query

総合スコア2

BigQuery

BigQueryは、Google Cloud Platformが提供しているビッグデータ解析サービス。数TB(テラバイト)またはPB(ペタバイト)の膨大なデータに対し、SQL風のクエリを実行し、高速で集計・分析を行うサービスです。

JSON

JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

0グッド

1クリップ

投稿2021/04/22 11:07

編集2021/04/22 11:08

前提・実現したいこと

bigqueryでstring形式の以下のようなカラムから文字列を抜き出したいです。

◆元の表

id
[{"id1":1111},{"id2":2222},{"id3":3333}]

◆文字列を抜き出して作りたい表

id1id2id3
111122223333

試したこと

以下のjson形式の場合は、

id
{"id1":"1111","id2":"2222","id3":"3333"}

下記のようにjson_extract_scalarを使用して抜き出すことができましたが、jsonの作りが違うため、nullで返ってきます。

cast(json_extract_scalar(id, "$.id1") as int64)as id1, cast(json_extract_scalar(id, "$.id2") as int64)as id2, cast(json_extract_scalar(id, "$.id3") as int64)as id3

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

Javascript UDF の例です。

Javascript

1CREATE TEMPORARY FUNCTION my_parse_json(json_str STRING) 2RETURNS STRUCT<id1 INT64, id2 INT64, id3 INT64> 3LANGUAGE js AS """ 4 var obj = {id1: 0, id2: 0, id3: 0}; 5 var json = JSON.parse(json_str); 6 json.forEach(function(v){ 7 if ( v.hasOwnProperty('id1') ){ obj['id1'] = v.id1; } 8 if ( v.hasOwnProperty('id2') ){ obj['id2'] = v.id2; } 9 if ( v.hasOwnProperty('id3') ){ obj['id3'] = v.id3; } 10 }); 11 return obj; 12"""; 13 14SELECT my_parse_json('[{"id1":1111},{"id2":2222},{"id3":3333}]')

あるいは json_query_array を使った例です。

with x as ( select * from unnest(json_query_array('[{"id1":1111},{"id2":2222},{"id3":3333}]')) as j ) select (select json_extract_scalar(j, '$.id1') from x where json_extract_scalar(j, '$.id1') is not null) as id1, (select json_extract_scalar(j, '$.id2') from x where json_extract_scalar(j, '$.id2') is not null) as id2, (select json_extract_scalar(j, '$.id3') from x where json_extract_scalar(j, '$.id3') is not null) as id3

どっちも何か変な書き方になってしまいましたが、もっとスマートなやり方がありそうですね。

投稿2021/04/22 14:51

68user

総合スコア2005

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

HR_query

2021/04/23 02:54

ありがとうございます。 やはり、Javascript UDFか、json_query_arrayになりますかね。 シンプルにjson_extract_scalarやjson_extractを使用してできないかと、思ったのですが、 JSONPathの作り的に難しそうですね。 今後、要件整理するときに、こちら考慮できるので出すかります、ありがとうございました!
68user

2021/04/23 03:07 編集

array 要素数固定なら、 ifnull(json_extract_scalar(j, '$.[0].id1'), json_extract_scalar(j, '$.[1].id1'), json_extract_scalar(j, '$.[2].id1')) などもアリかと思ったのですが、jsonpath における配列の表現がよくわからずでできませんでした。
HR_query

2021/04/23 05:42

ありがとうございます。 ifnullは試してなかったので実行してみたのですが、 --------------- Invalid token in JSONPath at: .[0] --------------- エラーでうまくいかないですね。 >jsonpath における配列の表現 まさにここなんですが、何かしら方法が見つかったら追記したいとおもいます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問