質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

2回答

1222閲覧

内容の濃い文章を抽出したい

yryuu

総合スコア151

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

3クリップ

投稿2018/12/31 03:06

javascriptの配列に
文章がいくつも入っています。

javascript

1texts = [ 2"〜食べた", 3"〜という商品を食べましたが、値段が500円で量があり、お得感がありました。購入店舗は〜でした 4]

という配列があったとしたら、ユーザに紹介したいコメントは二つ目のコメントになります。

こういった内容量のある文章を特定する技術というものはどういうものがあるのか
教えていただけますでしょうか

また商品Aがあったときに本当にその商品の事を書き込んでいるのかもできる限り特定したいのですが
商品名から文章の関連度を図る技術などもどのようなものがあるのか教えてください

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベースラインとして以下のような方法が考えられます。

  • 内容量のある文章を特定したい

→文字数にもとづいてスコアリングする

  • 本当にその商品の事を書き込んでいるのか調べたい

→商品名の出現回数にもとづいてスコアリングする

数十分で実装できそうですが、目的によってはこれで十分用を達するかもしれません。そうであれば他の方法を考える必要はありません。

一方で、

  • →文字数にもとづいてスコアリングする

無駄なことをダラダラ書いてる文章が高くスコアリングされてしまう

  • →商品名の出現回数にもとづいてスコアリングする

表記ゆれなどに対応できない

といった問題が出てくる可能性もあります。その場合は、前者の問題はたとえば「値段」「お得感」「店舗」など『盛り込んでおいてほしいキーワード』を100個くらい(適当ですが)決め打ちして、それに基づいてスコアリングをするとか。後者は編集距離的なもので表記ゆれ語の検出をしても良いし、共起語使うとかもありだし。

いろいろ方法は考えられますが、まずは単純な手法から実装して、課題点を探すようにすると作りやすいと思います。

投稿2018/12/31 23:07

編集2018/12/31 23:08
hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

詳しくはありませんが、共起度解析で関連度合いを調べる方法があるようです。
素直に実装するなら、

  1. 形態素解析
  2. 商品Aにマッチ
  3. 「共起語の数」を関連度合いに比例するものとする

この辺りのキーワードで調べれば良いでしょう。

Re: yryuu さん

投稿2018/12/31 03:44

think49

総合スコア18156

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問