質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.50%

  • SQL

    2392questions

    SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

  • BigQuery

    36questions

    BigQueryは、Google Cloud Platformが提供しているビッグデータ解析サービス。数TB(テラバイト)またはPB(ペタバイト)の膨大なデータに対し、SQL風のクエリを実行し、高速で集計・分析を行うサービスです。

DB(BigQuery-Standard SQL)における一般的な「重複IDの管理方法」について

解決済

回答 2

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 132

DB(BigQuery-Standard SQL)における一般的な「重複IDの管理方法」について質問させて下さい。

以下のように「都道府県」と「市区」をDB管理する場合、
「アンネスト(フラット化)構造」と「ネスト構造」どちらで管理するべきか迷っています。

似たようなID管理を行っている方がおりましたら、管理手法をご教授頂きたいです。

イメージ説明

以下、考えられるメリット・デメリット

▼「アンネスト(フラット化)構造」の場合

【メリット】
作業途中では、データを取り扱いしやすい。

【デメリット】
集計時にID重複のリスクがある。

▼「ネスト構造」の場合

【メリット】
ID重複のリスクが低い。

【デメリット】
作業途中では、データを取り扱いにくい。

すみませんが、どうぞよろしくお願いします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

checkベストアンサー

+1

親子の関係にあるもののデータ構造としてはネスト構造をお勧めします。
フラットの場合、親部分のみを取り出すのに集計が必須になるのもデメリットです。

作業と言われているのが、エクセルなどでの手作業を言われているのでしたら、データチェックの意味も含めて自動化による補助を考えれば良いかと思います。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/06/25 09:15

    ありがとうございます。やはり「ネスト構造」を採用しました。ご指摘の通り、親部分の重複リスクを無くす為です。

    キャンセル

+1

質問とは離れますが、全国地方公共団体コード を使われては?
このページの下の[外部リンク]からデータを取得できます。
独自コードを使っていると市町村合併などの対応に時間と費用が重くのしかかります。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/06/16 11:49

    全国地方公共団体コード は県と市区町村は同列で親子関係にはありませんよ。

    キャンセル

  • 2018/06/17 10:57

    >なお、都道府県コード自体は「全国地方公共団体コード」ではない。
    ですが、
    >「都道府県に与えられた全国地方公共団体コード」は、都道府県コードに3桁コード000を続けた5桁コードである。ただしこの5桁コードを都道府県コードと呼ぶこともある。

    https://haken.val.ne.jp/h_user/jsp/jobEntoryInput?EJN=13405081
    のように「都道府県」で[東京都]を選んでも、次の[市区町村]で 札幌市 から表示してくれるのも困りもの。こんなシステムを納品されてろくに動作確認もしないで開発費を払う方も悪いですが。

    キャンセル

  • 2018/06/17 11:10 編集

    親子関係についての質問に対して、親子関係でないデータだと手間が必要になると思ってコメントしました。
    ですが、リンク先のデータが6桁で、親子関係にありませんでしたが、コード仕様を見ると6桁目はCDで、親子関係はコード体系で保障されてますね。すみません。

    コードについて、公共性があるものはそれを利用するというのは同意です。

    キャンセル

  • 2018/06/25 09:19

    >Orlofskyさん saziさん
    ありがとうございます。「全国地方公共団体コード」は初めて知りました。また「公共性があるもの」という点、「6桁目はCDで親子関係がコード体系で保障されている点」は、今後の作業で参考になりました。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.50%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

  • 解決済

    xcodeでの画面サイズ変更方法

    swiftでサンプルコードを写しているのですが、参考書を今まで放置してたのでxcodeのバージョンが違うので画面サイズ変更の方法がわからないです。 simulatorでの表示画面

  • 解決済

    Blender Game Engineでマテリアルを透過したい

    Blenderでゲーム開発をしようとしているものです。 Blender Renderで透過処理したマテリアルをBlender Gameに反映させたいと思っているのですが、透過でき

  • 解決済

    UIScrollViewのStoryboards上でのY座標がおかしい

    UIScrollViewの設定値が、どうしても最上部がマイナス値になってしまいます。 contentOffsetの値を、実行中に y:-56 とかにするとうまく表示されるので

  • 解決済

    ACCESS クエリでの一部重複?の除外方法について

    前提・実現したいこと こんにちは、質問タイトルが適格でないかもしれませんが宜しくお願いいたします。 通販事業をしており、商品の仕入から販売までのデータベースをACCESSの

  • 解決済

    pycharmのpython console部分の色の変更

    プログラムには関係ないんですが・・・ 長時間PCの画面を見てると目が疲れてしまうので、色を変えてみようと思って 色を変更してみたのですが、python consoleの部分の色

  • 解決済

    vb2017でexcel2016操作

    vb2017を使っています。 communityです。 excel2016を開いてセルのデータを読み込みたいと思っています。 参考にしているサイトです。 http://d.

  • 解決済

    ASUS ZenPadで、Camera2APIで、1分動画を2時間分撮影したいです。

    Nexsus 5Xでは、1分動画を、2時間ぶん、撮影することができました。 しかし、ZenPadでは、エラーが出ます。 このようなエラーが繰り返して表示されます。 参

  • 受付中

    RubyのBigqueryクライアント(google-cloud-bigquery)でDATE_AD...

    GCP提供のgemでクエリを投げているのですが、DATE_ADD関数がinvalidQueryとなってしまいます。 他のクエリは問題なく実行できます。 該当コード bigq

同じタグがついた質問を見る

  • SQL

    2392questions

    SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

  • BigQuery

    36questions

    BigQueryは、Google Cloud Platformが提供しているビッグデータ解析サービス。数TB(テラバイト)またはPB(ペタバイト)の膨大なデータに対し、SQL風のクエリを実行し、高速で集計・分析を行うサービスです。