hiveを利用し、多次元配列のカラムを持つテーブルを作りたいと思います。
実現イメージとしては、PostgresSQLにある、
以下のようなテーブル定義とデータの持ち方です
CREATE TABLE sample_table (
user text[][]
);
データの持ち方
{taro,hanako},{jiro,nanako}
現状以下のCREATE文を作成しました。
CREATE TABLE sample_table
(
USER ARRAY<ARRAY<STRING>>
)
ROW FORMAT DELIMITED
COLLECTION ITEMS TERMINATED BY ',';
以下のデータを登録してみましたが、
実現したい形にはなりませんでした。
投入したデータ
{taro,hanako},{jiro,nanako}
↓
登録されたデータ(Hueを利用してデータ参照)
[["{taro"],["hanako}"],["{jiro"],["nanako}"]]
質問としては以下の2点になります。
1.hiveで多次元配列のカラムを持つテーブルのCREATE文はどのように書くのか
2.多次元配列のカラムにデータを登録する際のフォーマットはどのように書くのか
(LOAD DATA LOCAL INPATH '/sampleData.txt' INTO TABLE sample_table;
でデータ登録する際の、sampleData.txtの書き方)
データSELECT時に何らかの処理で実現イメージの形にさせるのではなく、
データ登録の段階で実現イメージの形で登録したいと考えています。
どなたかご存知の方いらっしゃいましたら、よろしくお願い致します。
あなたの回答
tips
プレビュー