質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
BigQuery

BigQueryは、Google Cloud Platformが提供しているビッグデータ解析サービス。数TB(テラバイト)またはPB(ペタバイト)の膨大なデータに対し、SQL風のクエリを実行し、高速で集計・分析を行うサービスです。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

Q&A

2回答

2996閲覧

名寄せで「電話番号/Eメール/会員ID」のいずれか合致の場合、同一ユーザーと判定する方法

SatoshiMaruyama

総合スコア16

BigQuery

BigQueryは、Google Cloud Platformが提供しているビッグデータ解析サービス。数TB(テラバイト)またはPB(ペタバイト)の膨大なデータに対し、SQL風のクエリを実行し、高速で集計・分析を行うサービスです。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

0グッド

2クリップ

投稿2018/07/20 05:32

編集2022/01/12 10:55

以下のイメージで「電話番号/Eメール/会員ID」のいずれかが合致した場合、
同一ユーザーと判定するSQLを作成したいと思います。
イメージ説明

また参照元のログテーブルは、以下のように一つです。
イメージ説明

この場合、「No.4」で電話番号が変更されたと仮定します。
→「会員ID:123」は「電話番号」のデータを2つ持たせたい。
→新たに「電話番号2」というカラムを作るべきでしょうか?

【補足1】
会員IDはログイン後に付与されるようなもので、nullの場合もあります。
また、参照元ログテーブルの「主たるキー」ではありません。

【補足2】
懸念点として、
「電話番号/Eメール/会員ID」いずれも、ログテーブルでは重複する為、
一度、「電話番号etc」をユニークにする(GROUP BYで処理する)べきか?

現在、作業イメージとして考えているのは、
参照元テーブルを「自己結合」してON句の判定を複数回、実施する方法ですが、
いかがでしょうか?

【補足3】
完成イメージは、以下サイトとほぼ一緒です。
http://www.tree-tips.com/mysql/useful/nayose/

(「電話番号」または「メールアドレス」のどちらかが同じ場合、同一人物とみなします。
ただし、都道府県が異なる場合は同一人物とみなしません。)

*上記サイトではループ処理をしています。今回、BigQueryで実現したいのですが、
「ループで処理できるのか?」「他の手段はないのか?」

すみませんが、引き続きよろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hihijiji

2018/07/20 07:57

電話番号やEメールの変更を交互に複数回行ったり、同時に変更したときはどうしますか?
guest

回答2

0

作るべきではないでしょう。
電話番号を残したいなら名寄せしないでが正解と思います。

投稿2018/07/26 10:42

koji2017

総合スコア30

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

SatoshiMaruyama

2018/08/23 00:50

ご回答ありがとうございました。再考したいと思います。
guest

0

提示のログでは一意のユーザーを識別するのは困難です。
「分かりそう」で「分からない」でも「分かった」気になれるIT用語辞典
にWebページの例ですが解り易い解説があります。

それと、名寄せとは例えば 044-999-9999 と 04-4999-9999 を同じ電話番号と識別する場合に言います。

投稿2018/07/20 08:10

hihijiji

総合スコア4150

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

SatoshiMaruyama

2018/08/23 00:51

ご回答ありがとうございました。再考したいと思います。また、参照ページのご紹介もありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問