質問編集履歴
1
採用しようと考えているものを追記しました。
title
CHANGED
File without changes
|
body
CHANGED
@@ -3,9 +3,16 @@
|
|
3
3
|
以下の内容へのアドバイス及び、ここも気を付けた方が良いよ!という点があればアドバイスをお願いします。
|
4
4
|
|
5
5
|
0. EMRクラスター(Hadoop)をローカルで実行するためにCDHかHDPか(基準:どちらが検証しやすいか)
|
6
|
+
|
6
7
|
0. EMRでどれを使うか(hive QL,impala,pig)(基準:どれが性能が良いか)
|
8
|
+
impalaを採用しようかと考えています。
|
9
|
+
|
7
10
|
0. EMRの演算結果の保存先はS3かDynamoDBか(基準:どちらが安いのか、早いのか)
|
8
11
|
※HDFSは一時キャッシュのため対象外
|
12
|
+
|
9
13
|
0. Lambdaで実行する言語のはどれが良いか?(Node.js,Java,Python) (基準:製造・修正しやすいのか? 性能面)
|
10
14
|
また、Node.jsの場合、どのフレームワークを使うか(候補:angular js)
|
15
|
+
|
16
|
+
Node.jsを採用しようかと考えています。
|
17
|
+
|
11
18
|
0. DynamoDBのテーブル設計はどうすれば早くなるのか?
|