以下のイメージで「電話番号/Eメール/会員ID」のいずれかが合致した場合、
同一ユーザーと判定するSQLを作成したいと思います。
この場合、「No.4」で電話番号が変更されたと仮定します。
→「会員ID:123」は「電話番号」のデータを2つ持たせたい。
→新たに「電話番号2」というカラムを作るべきでしょうか?
【補足1】
会員IDはログイン後に付与されるようなもので、nullの場合もあります。
また、参照元ログテーブルの「主たるキー」ではありません。
【補足2】
懸念点として、
「電話番号/Eメール/会員ID」いずれも、ログテーブルでは重複する為、
一度、「電話番号etc」をユニークにする(GROUP BYで処理する)べきか?
現在、作業イメージとして考えているのは、
参照元テーブルを「自己結合」してON句の判定を複数回、実施する方法ですが、
いかがでしょうか?
【補足3】
完成イメージは、以下サイトとほぼ一緒です。
http://www.tree-tips.com/mysql/useful/nayose/
(「電話番号」または「メールアドレス」のどちらかが同じ場合、同一人物とみなします。
ただし、都道府県が異なる場合は同一人物とみなしません。)
*上記サイトではループ処理をしています。今回、BigQueryで実現したいのですが、
「ループで処理できるのか?」「他の手段はないのか?」
すみませんが、引き続きよろしくお願いします。