前提・実現したいこと
s3にあるcsv.gzファイルをathenaで取得したいと思っています。
csvには以下のようなデータが入っています。
"0109","99","20200401","100" "0209","99","20200401","110"
データ型は、列1~3はstring型、列4はint型です。スキーマ情報もパーティションのプロパティも同様の型を設定しております。
これをselect * して、全てのカラムのデータを取得したいです。
発生している問題
上記のテーブルをselectすると、列1~3は取得できるのですが、列4が空白になってしまいます。
おそらくint型なのに、元のデータがダブルクォートで囲われているのが問題だと思うのですが、回避策はないでしょうか?
元のデータのダブルクォートを外すことはできない状況ですので、それ以外の対応方法がありましたらご教示願いたいです。
よろしくお願い致します。
あなたの回答
tips
プレビュー