質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.34%

  • Groonga

    7questions

    Groongaは、カラムストア機能を備えているオープンソースの全文検索エンジンです。大量にある文書から目的のキーワードを含む文書を高速で見つけることができ、全文検索機能を持つ高性能のアプリケーションを開発できます。

Groongaで1:nテーブル設計

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 649

super

score 25

こんにちは。
groongaの初心者です。テーブルの設計で助けを求め、ポスト致します。

<仕様>
次の親・子関係(1:n)のテーブルの情報があります。
親・子テーブルどっちでも1,2,3でhitしたら親の記事テーブルの1-5の情報を出力したい(json type) *4,5は検索対象ではない

  • 親の記事テーブル(検索出力結果に出す)
  1. 作成者
  2. タイトル
  3. 本文
  4. 登録日時
  5. 更新日時
  • 子のコメントテーブル(0個以上有る)
  1. 作成者
  2. タイトル
  3. コメント
  4. 登録日時
  5. 更新日時
  • 子のツイッターテーブル(0個以上有る)
  1. 作成者
  2. タイトル
  3. コメント
  4. 登録日時
  5. 更新日時
  • これから子のフッターが追加されます(0個以上複数可能)

groongaはjoinができない古いバージョン(4)なので、
以下のように一個のテーブルにくっつける設計方法を考えております。

以下のリンク先の記事から大変ヒントをいただきました。
https://kitaitimakoto.github.io/apehuci/2016/02/26.html

・groonga用トータル設計テーブル
親の記事部分 + 子のコメント部分 + 子のツイッター部分 <- 子のコメント+ツイッターの数分くっつける(親の記事部分は重複有り)

・一つのポストがコメント3個、ツイッター2個を持つ場合の例

{
    post_id : 1,
    post_register : "register01",
    post_title : "title01",
    post_contents : "contents01",
    post_create_dt : 2017-01-12 11:12:13,
    post_update_dt : null,
    comments_register : "register0101",
    comments_title : "title0101",
    comments_contents : "contents0101",
    comments_create_dt : 2017-01-12 11:12:13,
    comments_update_dt : null,
    twitter_register : "register010101",
    twitter_title : "title010101",
    twitter_contents : "contents010101",
    twitter_create_dt : 2017-01-12 11:12:13,
    twitter_update_dt : null
},
{
    post_id : 1,
    post_register : "register01",
    post_title : "title01",
    post_contents : "contents01",
    post_create_dt : 2017-01-12 11:12:13,
    post_update_dt : null,
    comments_register : "register0102",
    comments_title : "title0102",
    comments_contents : "contents0102",
    comments_create_dt : 2017-01-12 11:12:13,
    comments_update_dt : null,
    twitter_register : "register010102",
    twitter_title : "title010102",
    twitter_contents : "contents010102",
    twitter_create_dt : 2017-01-12 11:12:13,
    twitter_update_dt : null
},
{
    post_id : 1,
    post_register : "register01",
    post_title : "title01",
    post_contents : "contents01",
    post_create_dt : 2017-01-12 11:12:13,
    post_update_dt : null,
    comments_register : "register0103",
    comments_title : "title0103",
    comments_contents : "contents0103",
    comments_create_dt : 2017-01-12 11:12:13,
    comments_update_dt : null,
    twitter_register : "",
    twitter_title : "",
    twitter_contents : "",
    twitter_create_dt : ,
    twitter_update_dt : 
}
...

親のpost部分にhitしたら(子のレコードの)重複分、結果が出るためdrilldownコマンドで親のpost毎、グルーピングしたいと思います。
commentsやtwitterの子に1件以上hitしても、結果は親のpost毎、グルーピングしたいと思います。

以下groongaのドキュメントを見て想像したselectコマンドです。公式ページでは最新バージョンのドキュメントが載ってるので古いバージョンをインストールして確かめないと動くか分からないんですが、設計法として最善策かが知りたいです。mroongaなどは使えなくバージョンも4のgroonga httpサーバーに決まっております。

select 
    --table Post 
    --match_columns post_register, post_title, post_contents, comments_register, comments_title, comments_contents, twitter_register, twitter_title, twitter_contents
    --output_columns _key, post_id, post_register, post_title, post_contents, post_create_dt, post_update_dt
    --query @検索語
    --drilldown post_id

もし勘違いしているどころや、
もっといい設計方法など是非教えてください。
(テーブルをPost, Comments, Twitterの3個に分けて検索しながら親のPostを参照して出力する方法など)

助かるリンクなども構いません。
よろしくお願いいたします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

+1

「JOINができない」というのは「ネストされたインデックスが使えない」という意味ですよね?

「ネストされたインデックス」はバージョン3の頃から使えるのでバージョン4でも使えるはずです。

なので、こんな感じでいけると思います。

table_create Comments TABLE_HASH_KEY UInt32
column_create Comments register COLUMN_SCALAR ShortText
column_create Comments title COLUMN_SCALAR ShortText
column_create Comments contents COLUMN_SCALAR Text

table_create Tweets TABLE_HASH_KEY UInt32
column_create Tweets register COLUMN_SCALAR ShortText
column_create Tweets title COLUMN_SCALAR ShortText
column_create Tweets contents COLUMN_SCALAR Text

table_create Posts TABLE_HASH_KEY UInt32
column_create Posts register COLUMN_SCALAR ShortText
column_create Posts title COLUMN_SCALAR ShortText
column_create Posts contents COLUMN_SCALAR Text
column_create Posts created_at COLUMN_SCALAR Time
column_create Posts comments COLUMN_VECTOR Comments
column_create Posts tweets COLUMN_VECTOR Tweets

table_create Terms TABLE_PAT_KEY ShortText \
  --normalizer NormalizerAuto \
  --default-tokenizer TokenBigram
column_create Terms posts_index COLUMN_INDEX|WITH_POSITION|WITH_SECTION \
  Posts register,title,contents
column_create Terms comments_index COLUMN_INDEX|WITH_POSITION|WITH_SECTION \
  Comments register,title,contents
column_create Terms tweets_index COLUMN_INDEX|WITH_POSITION|WITH_SECTION \
  Tweets register,title,contents

column_create Comments posts_index COLUMN_INDEX Posts comments
column_create Tweets posts_index COLUMN_INDEX Posts tweets

load --table Comments
[
{"_key": 11, "register": "register0101", "title": "title0101", "contents": "contents0101"},
{"_key": 12, "register": "register0102", "title": "title0102", "contents": "contents0102"},
{"_key": 13, "register": "register0103", "title": "title0103", "contents": "contents0103"}
]

load --table Tweets
[
{"_key": 101, "register": "register010101", "title": "title010101", "contents": "contents010101"},
{"_key": 102, "register": "register010102", "title": "title010102", "contents": "contents010102"}
]

load --table Posts
[
{"_key": 1, "register": "register01", "title": "title01", "contents": "contents01", "comments": [11, 12, 13], "tweets": [101, 102], "created_at": "2017-01-12 11:12:13"}
]

select \
  --table Posts \
  --match_columns register,title,contents,comments.register,comments.title,comments.contents,tweets.register,tweets.title,tweets.contents \
  --output_columns _key,register,title,contents,created_at \
  --query 'title010102' \
  --output_pretty yes

結果例:

[
  [
    0,
    1484270763.037899,
    0.05170822143554688
  ],
  [
    [
      [
        1
      ],
      [
        [
          "_key",
          "UInt32"
        ],
        [
          "register",
          "ShortText"
        ],
        [
          "title",
          "ShortText"
        ],
        [
          "contents",
          "Text"
        ],
        [
          "created_at",
          "Time"
        ]
      ],
      [
        1,
        "register01",
        "title01",
        "contents01",
        1484187133.0
      ]
    ]
  ]
]

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/01/13 13:35 編集

    貴重なご意見有難う御座います。
    とても丁寧にサンプルコードまで書いてくださって、ありがとうございます。
    古いバージョンでテーブルの分割がだめだと思い、テーブルを一つにする方法を考えましたが理想的な策をご提示していただいて助かりました。
    他のどころも試してみましたが、完璧に親・子で検索、出力できました。
    理解ができるまで分析して使いたいと思います。
    本当に有難うございます。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.34%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • Groonga

    7questions

    Groongaは、カラムストア機能を備えているオープンソースの全文検索エンジンです。大量にある文書から目的のキーワードを含む文書を高速で見つけることができ、全文検索機能を持つ高性能のアプリケーションを開発できます。