(1)初めに
BigQuery初心者です。
SQLはよく書いていたのですが、見たこともない形式のデータを渡されて困っています。
(2)データ
BigQueryで①のようなデータが与えられたとします。
(こちらは仮のデータですが、実際のデータもこのような形をしています。)
featureという列が2列に分かれて表示されていますが、featureという列に値ではなく、配列(ディクショナリ?)のようなデータが格納されているのだと理解しています。マークダウン記法でうまく表現できませんが、例えば1行名は{"name":"Taro","feature":[{"key":"weight", "value":70},{"key":"height", "value":175}]}という値が入っているイメージです。(決して2行目のnameがnullになっているわけではありません。)
(このようなデータの呼び方ですが、「非正規形データ」で合っているでしょうか?)
データ①
行 | name | feature.key | feature.value |
---|---|---|---|
1 | Taro | weight | 70 |
height | 175 | ||
2 | Hanako | height | 155 |
age | 25 | ||
sex | F |
(3)課題
SQLを書いてデータ①をデータ②のような正規化されたデータに加工したいのですが、どのように書けばよいでしょうか。
データ②
行 | name | weight | height | age | sex |
---|---|---|---|---|---|
1 | Taro | 70 | 175 | null | null |
2 | Hanako | null | 155 | 25 | F |
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。