質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.47%
Amazon Athena

Amazon Athenaは、標準SQLを使用してAmazon S3内のデータを直接分析することができるインタラクティブなクエリサービスです。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

Amazon S3

Amazon S3 (Simple Storage Service)とはアマゾン・ウェブ・サービスが提供するオンラインストレージサービスです。

AWS(Amazon Web Services)

Amazon Web Services (AWS)は、仮想空間を機軸とした、クラスター状のコンピュータ・ネットワーク・データベース・ストーレッジ・サポートツールをAWSというインフラから提供する商用サービスです。

Q&A

解決済

1回答

4028閲覧

AWS athenaの結果が表示されない。

eva_norantoite

総合スコア0

Amazon Athena

Amazon Athenaは、標準SQLを使用してAmazon S3内のデータを直接分析することができるインタラクティブなクエリサービスです。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

Amazon S3

Amazon S3 (Simple Storage Service)とはアマゾン・ウェブ・サービスが提供するオンラインストレージサービスです。

AWS(Amazon Web Services)

Amazon Web Services (AWS)は、仮想空間を機軸とした、クラスター状のコンピュータ・ネットワーク・データベース・ストーレッジ・サポートツールをAWSというインフラから提供する商用サービスです。

0グッド

0クリップ

投稿2022/01/06 17:27

前提・実現したいこと

AWS Lambdaでcsvファイルを作成しs3のパケットにアップロード。AWS athenaで作成したパケットを基にテーブルを作成し、Quicksightを用いてデータの可視化を行うシステムを作成しています。

発生している問題・エラーメッセージ

AWS athenaでクエリを実行しようとすると、結果が表示されません。
イメージ説明

該当のソースコード

csvファイル作成、s3にアップロードするプログラム。

python

1 2 # データ 3 header = ["id","day","air_temp","humidity","co2"] 4 date_value = pd.to_datetime(PLC_Time) 5 datas = [int(sensor_id),date_value,Decimal(air_temp),Decimal(humidity),Decimal(co2)] 6 bucket.download_file(savepath,filepath) 7 # 書き込み 8 with open(filepath, 'a', newline='', encoding='utf-16') as f: 9 writer = csv.writer(f,dialect='excel') 10 writer.writerow(datas) 11 bucket.upload_file(filepath,savepath) 12

s3に保存されたcsvファイル 保存先はs3/バケット名/sensordata.csv

id,day,air_temp,humidity,co2 14,2022-01-06 11:11:11,22.2,33.3,111 15,2022-01-06 11:11:11,22.2,33.3,111 16,2022-01-06 11:11:11,22.2,33.3,111 17,2022-01-06 11:11:11,22.2,33.3,111

athenaでテーブルを作成した際に用いたsql記述。
クエリは成功し、テーブルも作成される。

sql

1CREATE EXTERNAL TABLE IF NOT EXISTS default.sensordata( 2 id int, 3 day timestamp, 4 air_temp decimal, 5 humidity decimal, 6 co2 decimal 7) 8ROW FORMAT SerDe 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' 9WITH SerDeProperties ("field.delim" = ",", "escapeChar"="\", "quoteChar"="\"") 10STORED AS TEXTFILE 11LOCATION 's3://バケット名/' 12TBLPROPERTIES ('has_encrypted_data'='false', 'skip.header.line.count'='1')

athenaで実行したselect文。
実行すると上記したように、何も表示されない

sql

1SELECT * 2FROM default.sensordata 3LIMIT 100;

試したこと

dataの書式がエクセルに対応してないのが原因と予想し、pythonのプログラムのdialectを'excel-tab'に変更したが、結果は表示されなかった。
athenaのテーブル作成の時に用いる型が文字列型(string)の時に限って、値が表示された。

補足情報

pythonのバージョンは3.8です。
リージョンはオハイオ、課題発生日は2022/1/9です。
プログラミング初心者で、コードも拙いところが多々あるとは思いますが、ご教授いただけると嬉しいです。よろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yu_1985

2022/01/07 07:04

記載のcsvをそのままコピペして同様に新規作成したバケットに配置し、テーブル作成のクエリをバケット名のところだけ変えてテーブルを作成してプレビューしてみたら普通にデータを参照できてしまいましたが…。 S3バケットのリージョンとAthenaの実行リージョンが違うとか、単純にバケット名をミスってるとかそういうことはないですか? トラブルシュートのための記事もあるので貼っておきます。 https://aws.amazon.com/jp/premiumsupport/knowledge-center/athena-empty-results/ あと、この事象とは関係ないですが - このデータセットにuniqueなIDは必要? - 恐らく日々増加するデータなので適切にパーティショニングしないと毎回全量参照しようとしてパフォーマンスと料金が大変なことになりそう あたりが気になったポイントです。
eva_norantoite

2022/01/07 15:38

解答ありがとうございます! リージョンが間違ってる可能性はあるかもしれないですね。確認します データに関してはその通りですね。このままだとファイルに無限に書き込まれてしまうので、対応したいと思います。 uniqueなIDは必要ないですね。単にわかりやすくするためにつけてます。プログラム内のheaderも同様です。
guest

回答1

0

自己解決

質問への回答ありがとうございました。実装できました。
encoding='utf-16'を、'utf-8'に変更し、バケットにcsvファイルを保存し出力したところ、結果が正しく表示されました。Athenaはutf-16に対応してなかったのかもしれないですね。

投稿2022/01/11 05:22

eva_norantoite

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問