自然言語処理初学者です。
機械学習の分野から自然言語処理を学ぼうとした際、よくわからない部分があったので、質問致します。
疑問点が複数ありますので、答えられるものがあれば回答をお願いします。
元々、プログラミングはできるので、Pythonを使用して文章分類や要約をする事から自然言語処理に足を踏み入れました。
例えば、文章分類や要約をする際、流れとしては
・形態素解析→単語のベクトル化→学習器による学習(分類)又は、アルゴリズムによる重要度決定(要約)
といった流れで行います。
(上記の処理はライブラリに頼っています)
しかし、自然言語処理の学習をしたところ、日本語の処理の流れは以下の様に行うのが一般的なようです。
・形態素解析→構文解析→意味解析→文脈解析
単純に日本語の自然言語処理の流れと、文章分類の流れを組み合わせた場合、
・形態素解析→構文解析→意味解析→文脈解析→ベクトル化→学習器による学習
といった流れになるのがよさそうな印象を受けるのですが、ネット上にある機械学習の記事では、形態素解析した単語をベクトル化して分類している物しか見つかりませんでした。
このような状況のなか、いくつか知りたいことが出てきました。
- 文脈解析をふまえた結果をベクトル化するのが難しいので、形態素解析をして単語同士の関係をベクトル化しているのか?それとも、知らない間にライブラリで文脈解析までされているのか?
- 自然言語処理系のライブラリは英語圏で作成されたものなので、日本語の構文解析→意味解析→文脈解析は行わないのか?(それなら、出回っているライブラリを使用しても日本語の制度は期待できないのか?)
- 形態素解析をした情報を機械学習に応用する方法は、文章分類を行っているのでイメージできるが、構文解析、意味解析、文脈解析をした結果を機械学習に利用する事(ベクトル化する事)は可能なのか?
- 構文解析、意味解析、文脈解析の結果はどのように使用されるのか?(検索エンジン?音声認識?)
- 英語にも構文解析や意味解析、文脈解析は必要に思えるが、なぜ左の解析は日本語独特のものとして扱われるのか?
- 自身が実現したいことは、文章分類や要約を上手く行うことなので、構文解析、意味解析、文脈解析の部分は意識しなくてもよいのか?
- 達成したい用途によってどこまで解析を行うのか判断する必要があるのか?
- 例)文章を分類したい→単語同士の関係に着目すると精度が出そう→形態素解析の結果をベクトル化
- 例)1文から重要な単語を抽出したい→文脈を理解することで、重要な単語を取り出すとよさそう→文脈解析を行う
質問は以上です。
回答お願い致します。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/10/12 06:09
2019/10/12 14:49