質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

解決済

1回答

513閲覧

python corenlpモジュールが使用できない

humuhimi

総合スコア49

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

0クリップ

投稿2019/07/17 02:15

編集2019/07/17 02:17

stanford core nlpを使って、自然言語処理の問題を解こうとしているのですがうまく行きません。
昔のqiita 記事を参考に試しているので、動かない場合があるとは思うのですがどうしたらうまく行きますか?

どなたかご教授ください。
また、stanford core nlpでオススメのライブラリがあれば教えていただきたいです。

こちらの記事を参考にさせていただきました

python

1""" 253. Tokenization 3Stanford Core NLPを用い,入力テキストの解析結果をXML形式で得よ.また,このXMLファイルを読み込み,入力テキストを1行1単語の形式で出力せよ. 4""" 5import pprint 6import json 7import corenlp 8 9# パーサの生成 10corenlp_dir = "/Users/*/Downloads/stanford-corenlp-full-2013-06-20/" 11parser = corenlp.StanfordCoreNLP(corenlp_path=corenlp_dir) 12 13# パースして結果をpretty print 14result_json = json.loads(parser.parse("I am Alice.")) 15pprint.pprint(result_json)

error

1Traceback (most recent call last): 2 File "/usr/local/lib/python3.7/site-packages/pexpect/expect.py", line 111, in expect_loop 3 incoming = spawn.read_nonblocking(spawn.maxread, timeout) 4 File "/usr/local/lib/python3.7/site-packages/pexpect/pty_spawn.py", line 485, in read_nonblocking 5 return super(spawn, self).read_nonblocking(size) 6 File "/usr/local/lib/python3.7/site-packages/pexpect/spawnbase.py", line 176, in read_nonblocking 7 raise EOF('End Of File (EOF). Empty string style platform.') 8pexpect.exceptions.EOF: End Of File (EOF). Empty string style platform. 9 10During handling of the above exception, another exception occurred: 11 12Traceback (most recent call last): 13 File "n53_exercise.py", line 11, in <module> 14 parser = corenlp.StanfordCoreNLP(corenlp_path=corenlp_dir) 15 File "/usr/local/lib/python3.7/site-packages/corenlp/corenlp.py", line 435, in __init__ 16 self._spawn_corenlp() 17 File "/usr/local/lib/python3.7/site-packages/corenlp/corenlp.py", line 424, in _spawn_corenlp 18 self.corenlp.expect("\nNLP> ") 19 File "/usr/local/lib/python3.7/site-packages/pexpect/spawnbase.py", line 341, in expect 20 timeout, searchwindowsize, async_) 21 File "/usr/local/lib/python3.7/site-packages/pexpect/spawnbase.py", line 369, in expect_list 22 return exp.expect_loop(timeout) 23 File "/usr/local/lib/python3.7/site-packages/pexpect/expect.py", line 117, in expect_loop 24 return self.eof(e) 25 File "/usr/local/lib/python3.7/site-packages/pexpect/expect.py", line 63, in eof 26 raise EOF(msg) 27pexpect.exceptions.EOF: End Of File (EOF). Empty string style platform. 28<pexpect.pty_spawn.spawn object at 0x10a9c2a20> 29command: /usr/bin/java 30args: ['/usr/bin/java', '-Xmx3g', '-cp', '/usr/local/lib/stanford-corenlp-full-2013-06-20/stanford-corenlp-3.2.0.jar:/usr/local/lib/stanford-corenlp-full-2013-06-20/stanford-corenlp-3.2.0-models.jar:/usr/local/lib/stanford-corenlp-full-2013-06-20//xom.jar:/usr/local/lib/stanford-corenlp-full-2013-06-20//joda-time.jar:/usr/local/lib/stanford-corenlp-full-2013-06-20//jollyday.jar:/usr/local/lib/stanford-corenlp-full-2013-06-20/ejml-0.19-nogui.jar', 'edu.stanford.nlp.pipeline.StanfordCoreNLP', '-props', '/usr/local/lib/python3.7/site-packages/corenlp/default.properties'] 31buffer (last 100 chars): b'' 32before (last 100 chars): b'java:190)\r\n\tat java.base/java.lang.ClassLoader.loadClass(ClassLoader.java:499)\r\n\t... 23 more\r\n' 33after: <class 'pexpect.exceptions.EOF'> 34match: None 35match_index: None 36exitstatus: None 37flag_eof: True 38pid: 32876 39child_fd: 5 40closed: False 41timeout: 60 42delimiter: <class 'pexpect.exceptions.EOF'> 43logfile: None 44logfile_read: None 45logfile_send: None 46maxread: 8192 47ignorecase: False 48searchwindowsize: 80 49delaybeforesend: 0.05 50delayafterclose: 0.1 51delayafterterminate: 0.1 52searcher: searcher_re: 53 0: re.compile(b'\nNLP> ')

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

quickquip

2019/07/17 02:30 編集

Stanford CoreNLP (Pythonラッパーではなく)が動くことは確認しているのでしょうか? というかこの課題は(Pythonラッパーではない)CoreNLPを使って解析してXML形式で保存して、PythonのプログラムからそのXML形式のファイルを読め、という意味かと思います。 (もちろん、PythonからCoreNLPを呼ぶことに挑戦したいというモチベーションがあるなら、そう解いても全然構いません)
humuhimi

2019/07/17 02:37

問題の解釈自体間違ってました! 一度、Stanford CoreNLP で解いてみて確認してみます! ありがとうございます
quickquip

2019/07/17 03:07

> 一度、Stanford CoreNLP で解いてみて Stanford CoreNLP はツールの名前で、それ自体はJavaで実装されています。 Stanford CoreNLP を使うことで、平文ファイルから解析結果情報を含むXMLファイルを作れるはずです。
humuhimi

2019/07/17 06:37

承知しました! やってみます。ありがとうございます
humuhimi

2019/07/17 08:37

普通にできました! 助かりました。ありがとうございます
guest

回答1

0

自己解決

python

1""" 253. Tokenization 3Stanford Core NLPを用い,入力テキストの解析結果をXML形式で得よ.また,このXMLファイルを読み込み,入力テキストを1行1単語の形式で出力せよ. 4 5stanford-corenlp-full-2018-10-05.zipをダウンロード 6cd stanford-corenlp-full-2018-10-05 7./corenlp.sh -file nlp.txt 8mv nlp.txt.xml Chapter6/ 9""" 10 11 12import pprint 13import xml.etree.ElementTree as ET 14import re 15 16# ファイルを読み込む 17tree = ET.parse('nlp.txt.xml') 18root = tree.getroot() 19prog = re.compile('^\n') 20 21 22for word in root.itertext(): 23 if not re.match(prog,word): 24 print(word) 25 26

投稿2019/07/17 08:37

humuhimi

総合スコア49

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問