質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.22%

DBにおいてテーブルを分割する事は速度改善に効果があるのでしょうか?

解決済

回答 6

投稿 編集

  • 評価
  • クリップ 1
  • VIEW 489
退会済みユーザー

退会済みユーザー

データベースの設計について質問です。

例えば50,000,000行のデータが入ったテーブルがあったとして、これを5個のテーブル、それぞれ10,000,000行ずつに分けたとすると速度はどう変わる、もしくは変わらないのでしょうか?

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • maisumakun

    2019/03/14 09:56

    どのような読み書きに対する「速度」なのでしょうか。

    キャンセル

  • quiqui

    2019/03/14 11:25

    タグ Python は間違いじゃないでしょうか。

    キャンセル

回答 6

checkベストアンサー

+3

大量なデータは適切な分割をする事で早くなります。
特徴的なものとしてパーティショニングが挙げられます。
特にpostgresは、テーブルを構造体で管理し、物理テーブルをパーティショニング単位で分割しています。
パーティショニング : 用途と利点

パーティショニングの利点
データを分割することで性能面や管理面に利点があります。特にデータベースのサイズがサーバの搭載メモリよりも大きい場合に効果が期待できます。

パーティショニングの欠点
PostgreSQL はパーティショニング専用の組み込み機能を持たず、複数のテーブル/継承/CHECK 制約などを組み合わせて実現しています。それが災いし、パーティショニングを行うと性能や機能が低下する場合があります。回避方法は多くの場合、個々のパーティションを指定したSQLを書くことです。

但し、アクセスが集中せずランダムになるようなパーティション単位だと逆に遅くなります。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

+1

分け方、アクセスの仕方によります。
例えば都道府県のデータを各県や地方でテーブルを分けた場合、検索により都道府県や地方を指定するのであればそこで使うテーブルが決まるのでアクセスするデータ量も決まった状態で検索できるので速くなると言えます。
単に分割するだけだと検索する際にunionすることになるのでほとんど効果がありません。それならきちんと正規化した方がいい。

データの状態やアクセスの仕方で決めると良いかと。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

+1

SELECTする条件(ON, WHERE)に見合ったインデックスが設定されていれば、何千万件のテーブルでも十分なレスポンスが期待できますが、適切なインデックスが設定されていても、テーブルを分割することによって

SELECT ...
FROM TABLE1
WHERE ...
UNION ALL
SELECT ...
FROM TABLE2
WHERE ...
UNION ALL
SELECT ...
FROM TABLE3
WHERE ...


とUNION ALLを多用しないといけなくなるなら実質SQLを多く実行しなければならなくなるので、パフォーマンスは落ちます。

まず、どういう条件でSQLが発行されるのかきちんと調査されては?

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

具体的な前提条件がないので「やり方による」としか。
ただ、テーブルを分割すれば早くなるかもしれませんが
それに伴い検索や更新の手間がかかるようになります。
例えば、インデックスをはれば検索は早くなるけど
更新に時間がかかるようになるみたいなはなし。
システムのターンアラウンドタイムは全体でみて
検討していかないと思わぬところではまったりします。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

一般的にはdbには、レンジ分けという機能があります。saziさんの書いたこととダブりますが、
参考として、https://qiita.com/bunty/items/6be5bbce33a4a55dced2 に記述があります。
使い方としては、mts10806の記述にもあるように住所であれば、都道府県で分けるとか、23区のような大都市の場合には、区でレンジ分けすることも考慮します。まずは50,000,000行のデータがどのような分布になっているか分析から行ってはいかがでしょうか?

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

-1

DB の種類やマシンスペックにもよるので一概には言えませんが、一般的にテーブルの行数が増えれば増えるほど、速度は遅くなると思います。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.22%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる