質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

解決済

1回答

1367閲覧

pythonでの自然言語処理(SVOC判別)について

tys.prg

総合スコア13

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

1グッド

0クリップ

投稿2018/05/16 10:30

前提・実現したいこと

プログラミング始めて1ヶ月程で、progateを中心に手探りで勉強しています。まだ趣味の範疇です。
とりあえずアウトプットとして、英語の文型(SVOC)を自動判別するプログラムを作りたいと考えています。
そこで以下質問です。

・使用言語はpythonで考えているが、問題ないか(機械学習やディープラーニングに興味があるため選択)
・初学者が独学で取り組むにはハードルが高過ぎないか
・おすすめの言語処理ツール(tree tagger,NLTKなど)
(・その他学習に役立つサイトや書籍、勉強会等)

右も左も分からず質問が成り立っているのかすら心配ですが、どなたかご回答のほどよろしくお願い申し上げます。

yoshizirou👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

progateでどんなことをやっているのかわからないので、適当に自然言語処理の入門として書きますが・・・。

使用言語はpythonで考えているが、問題ないか(機械学習やディープラーニングに興味があるため選択)

問題ありません。2018年現在においてはベストな選択でしょう。

初学者が独学で取り組むにはハードルが高過ぎないか

高いと思います。構文解析がややこしいです(ライブラリに投げるだけとも言いますが、使いこなすのがまた面倒くさいです)。ルールベースで文型を判定するのも面倒です。

もしかしたら既存のものがあるかもしれませんが、そしたらアウトプットとして面白くないでしょうし。

とりあえず文書から特徴語や特徴的な表現を抽出するみたいなネタとか、文書分類(スパム分類やニュースのカテゴリ判定など)あたりで遊んでみては? 

おすすめの言語処理ツール(tree tagger,NLTKなど)

英語でそういう解析(構文とかPOSタグとかいじるの)をやるなら事実上ほぼnltk一択です。nltkから色々なものを呼べるので、かなり便利です。ただし、nltkですべて完結するかはまた別です。
統計的言語処理チックにやるならgensimとか色々あります(LDAやword2vecなんかが使えます)。あとは機械学習使うと思うので、scikit-learnとか入れましょう。深層学習は当分手を出さなくて良いと思います(それよりコンベンショナルな機械学習を先に理解しないと辛いと思います)。

その他学習に役立つサイトや書籍、勉強会等

自然言語処理というテーマでまとまったサイトは日本語圏には(私の知る限り)ありません。書籍は色々あると思いますが、新しめで十分網羅的で入門書的なものはない印象です(一昔前なら「入門自然言語処理」という本がありましたが、さすがにもう古いと思います)。タイトルが良さそうなものを片っ端から読んでいくしかないです。
勉強会は行かないので知りません。ごめんなさい。

投稿2018/05/16 10:51

hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tys.prg

2018/05/16 10:57

早くてご親切で分かりやすいパーフェクトなご回答本当にありがとうございました……。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問