はじめに
サイト内の検索機能を実現するにあたり、データ(記事のタグ)の関連度を評価する必要が出てきました。しかしデータの構造について学ぶ機会がこれまでになく、どういったものにしたらよいか見当がつきません。
実現したいこと
例えばタグAに対して最も関連度の高いタグBが選ばれ、また逆でも同じことをさせるためには、順不同なデータ構造であるべきだと思います。
tag1 | tag2 | 関連度(同時に検索された回数など) |
---|---|---|
A | B | 111 |
A | C | 222 |
A | D | 333 |
B | A | 444 |
B | C | 555 |
... | ... | ... |
浅知恵で臨んだ結果上述のデータ構造を思いつきましたが、これだとタグの数の2乗ほどデータが必要で、しかも順不同の要件は全く満たせません。これでも無理やり実現することは可能だと思うのですが、データが多くなりすぎて処理速度の問題が出てきます。
抽象的なご相談で恐縮ですが、是非お力をお貸しいただきたいです。
あなたの回答
tips
プレビュー