「この本を買った人はこんな本も買っています」などのレコメンデーションに興味があり、実装してみたいと思うのですが、数多くのサイトではどのようにユーザー行動履歴の収集&レコメンドの実装をしているのでしょうか?
また、Apache Mahoutとという機械学習フレームワークがありましたが利用経験がある方の意見なども聞きたいです。
回答2件
あなたの回答
tips
プレビュー
Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。
アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。
プログラミング言語はパソコン上で実行することができるソースコードを記述する為に扱う言語の総称です。
Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。
Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。
アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。
プログラミング言語はパソコン上で実行することができるソースコードを記述する為に扱う言語の総称です。
Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。
0グッド
8クリップ
投稿2014/08/18 05:59
「この本を買った人はこんな本も買っています」などのレコメンデーションに興味があり、実装してみたいと思うのですが、数多くのサイトではどのようにユーザー行動履歴の収集&レコメンドの実装をしているのでしょうか?
また、Apache Mahoutとという機械学習フレームワークがありましたが利用経験がある方の意見なども聞きたいです。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
回答2件
0
はじめまして。知人から紹介され来ました。
私は日次アクセス数が数十億規模のサービスでレコメンド含む各種機械学習活用した開発をしているのですが、
各行動履歴等のログデータは全て HDFSに集約されるようにし、レコメンドアルゴリズムは独自にJava MapReduce等の分散実装を書くことが多いです。
全てのログをHadoopに集約する形にしているのは、ログ探索・収集に関するコストを減らすため (詳細)。
そして、独自に実装しているのは、提供したい体験がありそれに適切なアルゴリズムを設計・実装するためです。
最終的に提供したいのは体験なので、役割として、体験の設計〜洗練サイクル設計・ログ設計・分散アルゴリズム設計・実装、等の一連を担う形で進めています (詳細)。
その中で、提供したいと体験が、既存のアルゴリズム実装だけで実現できることはまずなく、また、ユーザの反応に応じて、アルゴリズムを早いサイクル洗練していきたいため、小回りが利く、独自実装をしています。
Mahout に関して、足回り系のところは便利なので用いています。
また、協調フィルタ等をクイックに試したい場合には、taste の RecommenderJob が JobDriver になっているので、まず気軽に実行し試してみるとよいかと思います。
投稿2014/08/22 16:52
総合スコア21
0
ベストアンサー
自分もレコメンドエンジンは作ったことはないですが興味があって勉強中です。
調べたところ、一般的にはベイズの定理という確率の計算方法(?)を使ったり、
それを独自に発展させたものを使ってるんじゃないかと思います。
手元の書籍によるとはてなはナイーブベイズという方法で記事のカテゴリ分けしてるらしいです。
レコメンドエンジンがどういう実装をしているかは「この記事」が結構勉強になると思います。
ベイズの定理は「AがBカテゴリに属す確率」とか、
「Aを買った人がBを買う確率」とかを出せるので、
Aを中心にいろいろなものに対して確率計算して一番高いものを使う感じです。
計算方法は、
P(B|A) = P(A|B) * P(B) / P(A)
です。
投稿2014/08/18 12:55
総合スコア843
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
質問の解決につながる回答をしましょう。 サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。 また、読む側のことを考えた、分かりやすい文章を心がけましょう。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。