質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.97%

10万レコードある、booleanのカラム(edit_flag)に対して、whereで絞り込む機会が多い場合、indexをつけた方が宜しいでしょうか?

受付中

回答 4

投稿

  • 評価
  • クリップ 0
  • VIEW 4,309

qaz3330

score 111

業務要件上MySQLをしようしております。

100,000件以上レコードのあるテーブルにおいて、とあるbooleanのカラム(edit_flag)をもとに画面上からwhereで絞り込むことが多いです。

一般的にレコード数が多く、かつ、whereなどで検索するようなカラムはindexを付与した方がいいかと思いますが、

booleanのような2値のカラムに対しましては、どうなのかわかりません。

現在は100,000件ほどですが、月に10,000件ぐらいのペースで増えていきます。

宜しくお願いします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 4

+1

インデックス設計はケースバイケースです。
とは言えまぁ検索するのにインデックスを全く作らないということは考え難いため、
なんらかのインデックスは必要でしょう。

データが2値だとしても、

  • 殆どtrueで僅かにfalseのレコードやその逆のパターンかどうか
  • edit_flag以外の検索条件の有無

など考慮するべき点は色々思い付きます。
場合によってはカバリングインデックスを利用できることがあるかも知れません。
実行計画も確認しながら検索クエリのパターンを洗い出した後、
それに見合うインデックスを必要な数だけ用意しましょう。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

その boolean がよっぽど偏ってない限りインデックスを付けても意味はありません。MySQL のインデックスは木構造にデータを分類することで検索速度をあげますが、boolean では木の枝が2本しかなくスピードがあがりません。

ただし、片方の値が希少でそちらの値を持つものだけを抽出したいのであれば、意味があるかもしれません。

現在は100,000件ほどですが、月に10,000件ぐらいのペースで増えていきます。

今のコンピュータですと、このくらいの件数では、よっぽど下手を打たないと性能問題になりません。普通に他のフィールドにインデックスをつけて検索できているのであれば、その boolean のカラムはほっておいていいでしょう。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

番号、日付、担当者、所有者、相手先、等々 カラム名,COUNT(*) でレコード数が多いことを目安に
インデックスを付けています。
もしも、スピード最優先なSQLがあれば、だめもとで副問い合わせをtemporaryテーブルに分離してあえて複数のSQLに分割してみると速くなることもあります。
副問合せとは (SELECT ... FROM ベーステーブル WHERE ... ) tmp のようにSQL の中で、カッコ付きのSELECT 文の箇所のことです。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

今回と似たようなケースとしてこちらのQAで、
過去に同様に2値の値しか取らないケースでのインデックス適用可否についてやり取りされています。
上記QAの回答も合わせて参照すると有益かと思われます。

既に他の回答者さんも述べいますが、
「edit_flag」列単体でみるとデータが大きく偏りがあるケースを除くと、
インデックスの効果は見込めないというのが一般論です。
(偏りがなかったり少ないと、DBMS側もインデックスを利用しないスキャンの方が早いと判断するみたい。
加えて偏りが大きくても量の多い方で検索をあけるとこれもフルスキャンされる模様。)

「edit_flag」列以外の列も合わせて考えると、
良く利用される検索パターン(xxxx_codeとedit_flag)とかがある場合は、
それらの列に対して複合インデックスとして定義すると検索効率の向上が見込めることはあると思います。

ただし、あくまで一般論なので、
実際どのようにインデックスが利用されているかなどを、
実行計画と睨めっこして確認する必要はあることに注意して下さい。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.97%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる
  • トップ
  • MySQLに関する質問
  • 10万レコードある、booleanのカラム(edit_flag)に対して、whereで絞り込む機会が多い場合、indexをつけた方が宜しいでしょうか?