前提・実現したいこと
指定したWebサイトから複数の記事の本文を自動的に取得し、文章の類似度を計算、類似している点(できれば文で)を出力する。
つまりWebサイトで多くの人が言っていることを抽出したいな。ということです。
発生している問題
上記のようなソフトを作成したいのですが、何から手をつければ良いのかわかりません。
必要になりそうだと思ったものが合っているのか、どのような順番で勉強したらいいのかわからないのです。
なるべくアプリケーションを実装しながら学習することが好きなので、オススメの勉強法があれば教えていただきたいです。
よろしくお願いいたします。
必要になりそうだと思ったもの
記事をサイトから取得する為:Webスクレイピング技術,PHP
文章類似度計算:文章のベクトル化、形態要素解析など自然言語処理
補足情報(FW/ツールのバージョンなど)
Python,Cの基本的な文法を学んだ程度のプログラミング初心者です。
Python3.7.4
Mac OS
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/08/13 01:04
2019/08/13 02:04 編集
2019/08/13 02:11 編集
2019/08/13 02:18 編集
2019/08/13 06:28
2019/08/13 06:38
2019/08/13 07:13 編集