質問編集履歴
5
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -46,6 +46,6 @@
|
|
46
46
|
|
47
47
|
from TABLE_DATE_RANGE(search_logs.search_log_, TIMESTAMP ('2012-6-10'), TIMESTAMP ('2017-6-10') )
|
48
48
|
|
49
|
-
WHERE original_keywords
|
49
|
+
WHERE original_keywords IS NOT NULL
|
50
50
|
|
51
51
|
```
|
4
タイトル変更
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
|
1
|
+
Bigquery(SQL)で5年間分の検索単語数を1日おきに抽出する方法
|
test
CHANGED
File without changes
|
3
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -22,6 +22,24 @@
|
|
22
22
|
|
23
23
|
ちなみにまだ1日ごとの期間指定はしていませんが、5年分の単語抽出のSQLは以下の通りです
|
24
24
|
|
25
|
+
```
|
26
|
+
|
27
|
+
original_keywords
|
28
|
+
|
29
|
+
```は単語
|
30
|
+
|
31
|
+
|
32
|
+
|
33
|
+
```
|
34
|
+
|
35
|
+
time
|
36
|
+
|
37
|
+
```
|
38
|
+
|
39
|
+
は検索ワードが入力された時間です
|
40
|
+
|
41
|
+
|
42
|
+
|
25
43
|
```SQL
|
26
44
|
|
27
45
|
SELECT original_keywords, time AS t
|
2
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -26,7 +26,7 @@
|
|
26
26
|
|
27
27
|
SELECT original_keywords, time AS t
|
28
28
|
|
29
|
-
from TABLE_DATE_RANGE(search_logs.search_log_, TIMESTAMP ('201
|
29
|
+
from TABLE_DATE_RANGE(search_logs.search_log_, TIMESTAMP ('2012-6-10'), TIMESTAMP ('2017-6-10') )
|
30
30
|
|
31
31
|
WHERE original_keywords_raw IS NOT NULL
|
32
32
|
|
1
質問変更
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,11 +1,33 @@
|
|
1
|
-
|
1
|
+
google big query で検索ワードをSQLで出したいのですが、以下の条件で抽出したいと考えています
|
2
|
-
|
3
|
-
しかし、枚数が合計で50万枚くらいあり、一日にtfrecordに保存できる枚数が9万枚くらいです。
|
4
2
|
|
5
3
|
|
6
4
|
|
5
|
+
・指定期間は5年間
|
6
|
+
|
7
|
-
|
7
|
+
・1時間ごとの単語数をcountし、1列で1時間分の単語数とその時の時間の2行分
|
8
8
|
|
9
9
|
|
10
10
|
|
11
|
-
s3
|
11
|
+
要は時系列データとしてshape=(365×5×24,)((batch,time_window,dim)=(365×5,3,21)になるようにする)
|
12
|
+
|
13
|
+
の形で抽出したいと考えています。
|
14
|
+
|
15
|
+
|
16
|
+
|
17
|
+
期間指定はできるのですが、一時間おきにcountする方法として、何かいい方法はないでしょうか?
|
18
|
+
|
19
|
+
ご教授お願いします
|
20
|
+
|
21
|
+
|
22
|
+
|
23
|
+
ちなみにまだ1日ごとの期間指定はしていませんが、5年分の単語抽出のSQLは以下の通りです
|
24
|
+
|
25
|
+
```SQL
|
26
|
+
|
27
|
+
SELECT original_keywords, time AS t
|
28
|
+
|
29
|
+
from TABLE_DATE_RANGE(search_logs.search_log_, TIMESTAMP ('2017-6-09'), TIMESTAMP ('2017-6-10') )
|
30
|
+
|
31
|
+
WHERE original_keywords_raw IS NOT NULL
|
32
|
+
|
33
|
+
```
|