質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
BigQuery

BigQueryは、Google Cloud Platformが提供しているビッグデータ解析サービス。数TB(テラバイト)またはPB(ペタバイト)の膨大なデータに対し、SQL風のクエリを実行し、高速で集計・分析を行うサービスです。

SQL Server

SQL Serverはマイクロソフトのリレーショナルデータベース管理システムです。データマイニングや多次元解析など、ビジネスインテリジェンスのための機能が備わっています。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

Q&A

解決済

2回答

809閲覧

100万行以上,2つのテーブルを使うデータ集計におけるBigqueryとtableau、Excelの集計使い分け(初心者です)

aCama_yu

総合スコア1

BigQuery

BigQueryは、Google Cloud Platformが提供しているビッグデータ解析サービス。数TB(テラバイト)またはPB(ペタバイト)の膨大なデータに対し、SQL風のクエリを実行し、高速で集計・分析を行うサービスです。

SQL Server

SQL Serverはマイクロソフトのリレーショナルデータベース管理システムです。データマイニングや多次元解析など、ビジネスインテリジェンスのための機能が備わっています。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

0グッド

1クリップ

投稿2021/04/14 00:25

編集2021/04/14 00:26

目的
ECサイトの顧客データの集計と仮定します。Bigquery内のテーブルA「全期間買い物履歴」とテーブルB「全期間お気に入り登録履歴」を使って「お気に入り登録機能をたくさん使った人ほど、3月における1ヶ月あたりの買い物回数が多い」という仮説が正しいか確認したい。2つのテーブルは会員IDで紐づけ可能。条件として100万行近くあるためExcelで全部作業をすることは重く非効率。

※仮説はフェイクで置いているので、論理性は問わずでお願いいたします。

困っていること
今までExcel集計をメインで行ってきたため、各ツールの使い分けに悩んでいる

使えるツール
Bigquery,tableau,Excel

詳細
目的に適したデータを出す上で、ツールの使い分けに悩んでいます。
Excelであれば
① Bを使って、3月のユーザー別お気に入り登録利用頻度を出す。(期間絞り込み+ピポットテーブル使用)
② Aを使って、3月のユーザー別買い物回数を出す。(期間絞り込み+ピポットテーブル使用)
③ ②に①をvoolkで紐づけ
④ ③を使って、ピポットテーブル。買い物回数を列として、行にお気に入り利用頻度と③のユーザーID出現回数カウント、その二つを割って平均値を出したものを並べる。相関性が見られたら、仮説は正しい
というフローのイメージがわくのですが、行が多く処理できないためBigquery・tableauを活用しようと思っています。
しかしBigqueryで④までやろうとするとかなり複雑になります。①~③はBigquery、④はtableauで実施をしてみてもtableau上で重くうまく動かず悩んでおります。

みなさまでしたら、どのように処理されるでしょうか。また、使い分けはどのようにされているでしょうか。
Bigquery,tableauは初心者です。初歩的な質問ですが、アドバイスいただければ嬉しいです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

BI ツールでは表示のみ、データはその前段で済ませておく、が基本だと思っています。もちろんデータ量が少なくて BI ツールであれこれできるレベルならやっちゃえばいいんでしょうけど。

BigQuery での集計はこんなイメージですかね (動かしていませんので SQL 的な正しさは担保いたしません)。

SQL

1with a as ( 2 select userId, count(*) as buy_conut from mydataset.全期間買い物履歴 3 where 3月絞り込み 4 group by userId 5), 6b as ( 7 select userId, count(*) as fabo_count from mydataset.全期間お気に入り登録履歴 8 where 3月絞り込み 9 group by userId 10) 11select buy_count, avg(fabo_count) 12 from a full outer join b 13 on a.userId = b.userId 14 group by buy_count

相関見たいなら Tableau で散布図書いちゃえば、という気は若干いたします。

投稿2021/04/15 03:19

68user

総合スコア2005

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

aCama_yu

2021/04/22 04:20

具体的なクエリまでありがとうございます!自分が考えていたものが集計としても不足していたなということに気づくことができました。
guest

0

分析するのに必要な単位まで集計したものの件数がネックにならないなら、
分析する単位まで、Bigqueryで集計し、その結果をtableau,Excelで行うのが良さそう。

何れにせよ、ネックとならない件数となるまでをBigqueryで集計できるかという事に掛かっていると思います。

投稿2021/04/14 01:51

sazi

総合スコア25173

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

aCama_yu

2021/04/22 04:06

ありがとうございます!集計はツール上でやらない、というものなのですね。ストレスなく集計できるまで加工するとのこと、理解できました!
sazi

2021/04/22 04:18

>集計はツール上でやらない、というものなのですね。 ツールの機能を使いたいという事もあるでしょうし、件数次第ですね
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問