現在、いろいろと勉強をしつつチャットボットを作ろうとしております。
画像は、tensorflowで理解して、kerasに拡張して勉強していてなんとなくは理解できたのですが、自然言語は画像と違って理論が複雑でどの方法がいいのか選定中です。
基本的には、ある特定分野でのチャットボットでのやり取りを想定しております。
RSTMでの学習方法がありますが、この場合、教師なし学習で、単語のベクトル変換をしてやって、それからcos近似度から推定してくものではないかと思っております。
基本的には、FAQ的なものをディープラーニングを利用して学習してやりたいと思っております。
短文には、正解用ラベルデータをょういできるとは思っておりますが、入力を形態素解析で解析してやって、それから名詞などを抜き出し、それからネットワーク層をうまく作ってやって学習させてやって、それにたいして、正解の単語のone-hotベクトルを与えてやってうまくできないのかなと思っています。
基本的にやりたいこと
入力:::短文のFAQを入力
正解:::入力に対して正解の単語を選択
をやりたいのですが、基本的にいろいろ調べてはいますが、非常に難しいことなのかなと思っております。
画像のように、文章を無理やりネットワークにぶち込んでやって、正解をsoftmax関数で得られる方法はないのかなと思っていろいろ模索しております。
一般的に、FAQやチャットボットなどは、どのようにデータを与えて、正解判定はどのようにしているのでしょうか。
一般的な話でかまいません、何か足掛かりになるような情報を教えていただけないでしょうか。
このような質問をするのがここで正しいのかわかりませんが、どなたか教えてくださる方がいらっしゃいましたらよろしくお願いいたします。
どうぞよろしくおねがいいたします。
あなたの回答
tips
プレビュー