質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Twitter

Twitterは、140文字以内の「ツイート」と呼ばれる短文を投稿できるサービスです。Twitter上のほぼ全ての機能に対応するAPIが存在し、その関連サービスが多く公開されています。

Mecab

Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

5146閲覧

PythonでMeCab使用時に0xc000007bのエラーが出る

退会済みユーザー

退会済みユーザー

総合スコア0

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Twitter

Twitterは、140文字以内の「ツイート」と呼ばれる短文を投稿できるサービスです。Twitter上のほぼ全ての機能に対応するAPIが存在し、その関連サービスが多く公開されています。

Mecab

Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2017/02/05 20:51

編集2019/03/11 08:18

###前提・実現したいこと
PythonでCSVファイルを読み込んでMeCabによる形態素解析を行いたいです。
twitterのツイートをCSVファイルに変換したものを読み込ませて名詞だけを取り出して、出てきた回数をカウントするものです。

参考にしているサイトはこちらです。
http://stone-book.hatenablog.com/entry/2016/10/10/231324

###発生している問題・エラーメッセージ
実行時に出てくるのは
runfile('C:/Users/seatrp/.spyder-py3/pro4/pro4-2.py', wdir='C:/Users/seatrp/.spyder-py3/pro4')
Traceback (most recent call last):

File "<ipython-input-2-b61b8e7c8e14>", line 1, in <module>
runfile('C:/Users/seatrp/.spyder-py3/pro4/pro4-2.py', wdir='C:/Users/seatrp/.spyder-py3/pro4')

File "C:\Users\seatrp\Anaconda3\lib\site-packages\spyder\utils\site\sitecustomize.py", line 866, in runfile
execfile(filename, namespace)

File "C:\Users\seatrp\Anaconda3\lib\site-packages\spyder\utils\site\sitecustomize.py", line 102, in execfile
exec(compile(f.read(), filename, 'exec'), namespace)

File "C:/Users/seatrp/.spyder-py3/pro4/pro4-2.py", line 32, in <module>
wordlist = pd.read_csv("out_mecab2.txt" , header=None , delimiter="\t")

File "C:\Users\seatrp\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 562, in parser_f
return _read(filepath_or_buffer, kwds)

File "C:\Users\seatrp\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 315, in _read
parser = TextFileReader(filepath_or_buffer, **kwds)

File "C:\Users\seatrp\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 645, in init
self._make_engine(self.engine)

File "C:\Users\seatrp\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 799, in _make_engine
self._engine = CParserWrapper(self.f, **self.options)

File "C:\Users\seatrp\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 1213, in init
self._reader = _parser.TextReader(src, **kwds)

File "pandas\parser.pyx", line 523, in pandas.parser.TextReader.cinit (pandas\parser.c:5214)

EmptyDataError: No columns to parse from file

そして
「mecab.exe - アプリケーションエラー」のウィンドウ
「アプリケーションを正しく起動できませんでした(0xc000007b)。[OK]をクリックしてアプリケーションを閉じてください」
というものです。

用意したCSVファイルが10行あり、このエラーのウィンドウが10回出てくるのでMeCabを呼び出す際に問題が起こっているのかな・・・とは思うのですが解決の仕方がどうもよくわかりません。

###該当のソースコード
開発環境としてSpyderを使っています。

import subprocess import pandas as pd import codecs import re #CSVファイル読込 datas = pd.read_csv("tweet2.csv" , header=None) for key, row in datas.iterrows(): #Mecab用に出力 fout =codecs.open("in_mecab2.txt", "w" , "utf-8") #5列目にツイート本文 tw = str(row[5]) #英数字を消し、日本語のみに tw = re.sub("[^ぁ-んァ-ンー一-龠]", "", tw); #Mecabに食わせるファイルを出力 fout.writelines(tw) fout.close() #Mecab実行 -E でEOFを出力しない、 >> で追記 cmd = "\"C:\Program Files (x86)\MeCab\bin\mecab.exe\" < in_mecab2.txt >> out_mecab2.txt -E \"\" " subprocess.call(cmd , shell=True) #出力結果を読込 wordlist = pd.read_csv("out_mecab2.txt" , header=None , delimiter="\t") #一般名詞だけ抽出 MeCabの形態素解析結果に品詞が記載されている nounlist = wordlist[wordlist[1].str.contains("名詞,一般")] #名詞のカウントをする pd.DataFrame(nounlist[0].value_counts(), columns=["COUNT"])

###試したこと
エラーコードを調べたところVisual Studio 2012 更新プログラム 4 の Visual C++ 再頒布可能パッケージの32bit版をインストールすると解決する場合があるとのことだったのでやってみたのですがダメでした。
https://www.microsoft.com/ja-jp/download/details.aspx?id=30679

###補足情報(言語/FW/ツール等のバージョンなど)
最後になりますが現在の環境を挙げさせていただきます。
OS:Windows10(64bit)
言語:Python3.5.2(Anaconda4.2.0利用しインストール)
形態素解析ツール:MeCab

ほぼ以下のサイトの通りにやってみました。
http://qiita.com/h_kabocha/items/5bee9e9b852aed11411b

原因わかる方いらっしゃいましたら回答のほどよろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

かなり前に投稿したことなので何が原因でどうしたら解決したのかを正直あまり良く覚えていません。
おそらく解決などせず、他の方法で乗り越えたような気がします。
ソースコードを見ていただくとわかる通り、ツイートに対して形態素解析をかけたかったのですが上手くいかずこのような投稿をしました。
Pythonも形態素解析もあまりよくわかっていなかった時の投稿なので今見ると本当にひどいなと思います。
投稿してからの時間の経過も手助けとなり、地味に閲覧数が多いような気がするのでお恥ずかしながら投稿は消さずに残しておこうと思います。
何のヒントになるかもわかりませんが誰かの手助けとなれば幸いです。

投稿2019/03/11 08:23

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

wordlist = pd.read_csv("out_mecab2.txt" , header=None , delimiter="\t")
で、
EmptyDataError: No columns to parse from file
のエラーになっているようなので、

out_mecab2.txt にデータが書き込まれていないのではないでしょうか?
実際にファイルを開いて目的のものが書き込まれているかを確認してみると良いと思います。

また、MeCabをPythonの外で外部呼び出しをしていますが、MeCab-Pythonなどを使って、Pythonの環境のみで行う方法も検討したほうが良いかと思います。
MeCab以外の形態素解析エンジンを使うという選択肢もあろうかと思います。

投稿2017/02/16 09:12

terapyon

総合スコア313

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問