質問編集履歴

5

追記

2018/06/29 05:12

投稿

trafalbad
trafalbad

スコア303

test CHANGED
File without changes
test CHANGED
@@ -46,6 +46,6 @@
46
46
 
47
47
  from TABLE_DATE_RANGE(search_logs.search_log_, TIMESTAMP ('2012-6-10'), TIMESTAMP ('2017-6-10') )
48
48
 
49
- WHERE original_keywords_raw IS NOT NULL
49
+ WHERE original_keywords IS NOT NULL
50
50
 
51
51
  ```

4

タイトル変更

2018/06/29 05:11

投稿

trafalbad
trafalbad

スコア303

test CHANGED
@@ -1 +1 @@
1
- s3上大量画像tfrecordファイル保存する方法
1
+ Bigquery(SQL)5年間分検索単語数1日おき抽出する方法
test CHANGED
File without changes

3

追記

2018/06/29 05:11

投稿

trafalbad
trafalbad

スコア303

test CHANGED
File without changes
test CHANGED
@@ -22,6 +22,24 @@
22
22
 
23
23
  ちなみにまだ1日ごとの期間指定はしていませんが、5年分の単語抽出のSQLは以下の通りです
24
24
 
25
+ ```
26
+
27
+ original_keywords
28
+
29
+ ```は単語
30
+
31
+
32
+
33
+ ```
34
+
35
+ time
36
+
37
+ ```
38
+
39
+ は検索ワードが入力された時間です
40
+
41
+
42
+
25
43
  ```SQL
26
44
 
27
45
  SELECT original_keywords, time AS t

2

修正

2018/06/29 05:10

投稿

trafalbad
trafalbad

スコア303

test CHANGED
File without changes
test CHANGED
@@ -26,7 +26,7 @@
26
26
 
27
27
  SELECT original_keywords, time AS t
28
28
 
29
- from TABLE_DATE_RANGE(search_logs.search_log_, TIMESTAMP ('2017-6-09'), TIMESTAMP ('2017-6-10') )
29
+ from TABLE_DATE_RANGE(search_logs.search_log_, TIMESTAMP ('2012-6-10'), TIMESTAMP ('2017-6-10') )
30
30
 
31
31
  WHERE original_keywords_raw IS NOT NULL
32
32
 

1

質問変更

2018/06/29 05:08

投稿

trafalbad
trafalbad

スコア303

test CHANGED
File without changes
test CHANGED
@@ -1,11 +1,33 @@
1
- 現在s3上にある画像のパスをsqlで取得し、boto3s3から呼び出し、ec2 上tfrecordに保存しています
1
+ google big query 検索ワードをSQLで出したいのですが以下の条件抽出たいと考えています
2
-
3
- しかし、枚数が合計で50万枚くらいあり、一日にtfrecordに保存できる枚数が9万枚くらいです。
4
2
 
5
3
 
6
4
 
5
+ ・指定期間は5年間
6
+
7
- 画像tfrecordに入れるだけものすごい時間がかかってしまい、画像類ができません。よく大量画像を類している企業を見るとs3上にすでにtfrecordが作成されています。
7
+ ・1時間ごとの単語数をcountし、1列1時間分の単語数とその時の時間の2行
8
8
 
9
9
 
10
10
 
11
- s3上で大量の画像をtfrecordに保存して、手早く作成するにはどうやっていのでしょうか?どんなアドバイスでもいいので、ご教授お願いします
11
+ 要は時系列データとしてshape=(365×5×24,)((batch,time_window,dim)=(365×5,3,21)よう
12
+
13
+ の形で抽出したいと考えています。
14
+
15
+
16
+
17
+ 期間指定はできるのですが、一時間おきにcountする方法として、何かいい方法はないでしょうか?
18
+
19
+ ご教授お願いします
20
+
21
+
22
+
23
+ ちなみにまだ1日ごとの期間指定はしていませんが、5年分の単語抽出のSQLは以下の通りです
24
+
25
+ ```SQL
26
+
27
+ SELECT original_keywords, time AS t
28
+
29
+ from TABLE_DATE_RANGE(search_logs.search_log_, TIMESTAMP ('2017-6-09'), TIMESTAMP ('2017-6-10') )
30
+
31
+ WHERE original_keywords_raw IS NOT NULL
32
+
33
+ ```