質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
BigQuery

BigQueryは、Google Cloud Platformが提供しているビッグデータ解析サービス。数TB(テラバイト)またはPB(ペタバイト)の膨大なデータに対し、SQL風のクエリを実行し、高速で集計・分析を行うサービスです。

Google Cloud Platform

Google Cloud Platformは、Google社がクラウド上で提供しているサービス郡の総称です。エンドユーザー向けサービスと同様のインフラストラクチャーで運営されており、Webサイト開発から複雑なアプリ開発まで対応可能です。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

Q&A

解決済

1回答

583閲覧

Bigquery(SQL)で5年間分の検索単語数を1日おきに抽出する方法

trafalbad

総合スコア303

BigQuery

BigQueryは、Google Cloud Platformが提供しているビッグデータ解析サービス。数TB(テラバイト)またはPB(ペタバイト)の膨大なデータに対し、SQL風のクエリを実行し、高速で集計・分析を行うサービスです。

Google Cloud Platform

Google Cloud Platformは、Google社がクラウド上で提供しているサービス郡の総称です。エンドユーザー向けサービスと同様のインフラストラクチャーで運営されており、Webサイト開発から複雑なアプリ開発まで対応可能です。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

0グッド

2クリップ

投稿2018/06/28 13:20

編集2018/06/29 05:12

google big query で検索ワードをSQLで出したいのですが、以下の条件で抽出したいと考えています

・指定期間は5年間
・1時間ごとの単語数をcountし、1列で1時間分の単語数とその時の時間の2行分

要は時系列データとしてshape=(365×5×24,)((batch,time_window,dim)=(365×5,3,21)になるようにする)
の形で抽出したいと考えています。

期間指定はできるのですが、一時間おきにcountする方法として、何かいい方法はないでしょうか?
ご教授お願いします

ちなみにまだ1日ごとの期間指定はしていませんが、5年分の単語抽出のSQLは以下の通りです

original_keywords ```は単語

time

は検索ワードが入力された時間です ```SQL SELECT original_keywords, time AS t from TABLE_DATE_RANGE(search_logs.search_log_, TIMESTAMP ('2012-6-10'), TIMESTAMP ('2017-6-10') ) WHERE original_keywords IS NOT NULL

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

集計関数を利用すれば可能だと思います。
timeTIMESTAMP型ならこんな感じになるかと。

sql

1#standardSQL 2 3SELECT 4 original_keywords, 5 format_time("%Y%m%d%H", time) AS hours, 6 COUNT(*) AS cnt 7fROM 8 search_logs.search_log_* 9WHERE 10 original_keywords IS NOT NULL 11AND 12 _TABLE_SUFFIX BETWEEN '20120610' AND '20170610' 13GROUP BY 14 original_keywords, 15 format_timestamp("%Y%m%d%H", time)

投稿2018/06/30 01:46

ryutah

総合スコア48

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

trafalbad

2018/07/02 01:37

#standardSQL SELECT format_timestamp("%Y%m%d%H", time) AS hours, COUNT(original_keywords) AS cnt FROM `search_logs.search_log_*` WHERE original_keywords IS NOT NULL AND _TABLE_SUFFIX BETWEEN '20120610' AND '20170610' GROUP BY hours ORDER BY hours asc
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問