Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。
Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。
Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。
Q&A
2回答
2515閲覧
総合スコア12
0グッド
0クリップ
投稿2018/04/18 11:40
0
MeCab+Python3で品詞+正規表現を使用した検索・語彙抽出の方法をご存知の方がいましたら、方法をご教授頂けないでしょうか。
例) 名詞 と設定すると、WEBサービス、介護サービス、介護事業,・・・などの語が取得できる。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
質問へのコメント
回答2件
要望の例示からすると、ある単語に対して類似語・関連語を抽出する方法論を求めているものと理解しました。そうすると、トピックモデルかword2vecあたりが適用できそうな気がします。 トピックモデルは、文章には何らかのトピックが含まれており、トピックはそのトピックに適した語群で構成されるという前提で、文章-トピック-語群の紐付けを学習するモデルです。したがって、外から語を与えた場合、それからトピックを検索し、そのトピックに含まれる語を抽出するという仕組みにすれば、要望に対応できるような気がします。 word2vecは、単語の特徴をその単語の前後に現れる他の単語を使ったベクトル表現するモデルのことで、このベクトル同士の近似度合い(つまり類似性)を計算することで類似語・関連語を抽出することができます。実際にはword2vecのほうが要望にダイレクトに応えているように思うので調べてみるといいかと思います。
投稿2018/04/19 11:08
総合スコア3378
投稿2018/04/19 04:15
総合スコア13727
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
まだベストアンサーが選ばれていません
アカウントをお持ちの方はログイン
15分調べてもわからないことはteratailで質問しよう!
ただいまの回答率85.29%
質問をまとめることで思考を整理して素早く解決
テンプレート機能で簡単に質問をまとめる
MeCabで品詞+正規表現を使った語彙抽出(Python3)
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。