🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Mecab

Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

解決済

1回答

1983閲覧

MeCabでUniDicを実行したい

ym1111

総合スコア16

Mecab

Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

1クリップ

投稿2021/02/02 13:56

前提・実現したいこと

MeCabでUnidicを使えるようにしたいです。
なぜか、2月に入って久しぶりにプログラムを実行したところ、MeCabのUnidicが使えなくなりました。
以前は使えていたにも関わらずです。
以下のようなエラーメッセージを消したいです。
なお言語はpythonで、エラーメッセージは以下のようになります。

発生している問題・エラーメッセージ

Failed initializing MeCab. Please see the README for possible solutions: https://github.com/SamuraiT/mecab-python3#common-issues If you are still having trouble, please file an issue here, and include the ERROR DETAILS below: https://github.com/SamuraiT/mecab-python3/issues issueを英語で書く必要はありません。 ------------------- ERROR DETAILS ------------------------ arguments: -d unidic-csj-3.0.1.1 error message: [ifs] no such file or directory: unidic-csj-3.0.1.1/dicrc ---------------------------------------------------------- Traceback (most recent call last): File "/Users/my_name/Documents/pyrank.py", line 34, in <module> mecab = MeC/Documents/pyrank.py", line 34, in <module> mecab = MeCab.Tagger("-d unidic-csj-3.0.1.1")#Taggerというクラスのインスタンスを生成 File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/MeCab/__init__.py", line 124, in __init__ super(Tagger, self).__init__(args) RuntimeError
import MeCab import glob import re from collections import Counter import csv #import io,sys #sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8') k_w = [] tmp = "tmp.txt" #複数のtextを一つにまとめるためのtext fileobj = open(tmp,"w") #tmpファイルを一度'空'にする。 fileobj.close() gyou = 0 #ETV/**/*.txt行数 for file in glob.glob("aiai/*.txt"):#aiai下全てのテキストファイルを読み込む file_data = open(file,"r") while True: text = file_data.readline() #text = text.replace("\n", "")#改行コード削除 text = text.replace("\r\n", "")#改行コード削除 if text: fileobj = open(tmp,"a") fileobj.write(text)#1行ずつtmpに追記していく fileobj.close() gyou += 1 #行数を数える else: break file_data.close() fileobj = open(tmp,"r") text = fileobj.read() #print(gyou) #形態素解析,単語分割 mecab = MeCab.Tagger("-d unidic-csj-3.0.1.1")#Taggerというクラスのインスタンスを生成 parse = mecab.parse(text)#解析結果を文字列として取得 lines = parse.split('\n')#改行削除 items = (re.split('[\t,]', line) for line in lines) fileobj.close() words = [] n = [] cnt = 0 char_count = 0 # 名詞をリストに格納 for item in items: cnt += 1 if (item[0] not in ('EOS', '', 't', 'ー') and item[1] not in('助詞','助動詞','記号','接頭辞','接尾辞','固有名詞','補助記号') and #item[2] != ('非自立') and item[2] not in ('数詞','固有名詞') and len(item[0])!=1 and len(item)>7): char_count += 1 words.append({"語彙":item[8],"品詞":item[1],"読み":item[7]}) # print(item)

試したこと

MeCabやUniDicをもう一度インストールしてみたりしましたが、できませんでした。
インストールの方法は、UniDicのインストール用のWebページ(https://unidic.ninjal.ac.jp)から現代話し言葉UniDicをダウンロードしました。
###環境
MeCabとUniDicの場所は以下のようになっております。
Users/my_name/opt/anaconda3/lib/python3.7/site-packages/mecab
Users/my_name/Documents/unidic-csj-3.0.1.1
です。
実行方法は、IDLEで「Run」を押しました。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

no such file or directory: unidic-csj-3.0.1.1/dicrc

と言っていますので、そのようなファイルが存在するか再度確認してみては。

投稿2021/02/02 14:28

68user

総合スコア2022

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

68user

2021/02/03 01:21

ブラウザ依存性があるようなので補足ですが、Chrome で見ると 3.0.1.1 の直前に何か文字が入っているように見えます。Firefox で見るとぱっと見普通に見えますけれども。
ym1111

2021/02/03 03:18

ありがとうございました。 68user様の言う通り、この空白の文字のせいでエラーになっておりました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問