🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
プログラミング言語

プログラミング言語はパソコン上で実行することができるソースコードを記述する為に扱う言語の総称です。

Mecab

Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

1回答

1639閲覧

mecabでunidicを使えない

ym1111

総合スコア16

プログラミング言語

プログラミング言語はパソコン上で実行することができるソースコードを記述する為に扱う言語の総称です。

Mecab

Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

0クリップ

投稿2021/02/02 04:00

編集2021/02/02 06:24

前提・実現したいこと

MeCabでUnidicを使えるようにしたいです。
なぜか、2月に入って久しぶりにプログラムを実行したところ、MeCabのUnidicが使えなくなりました。
以前は使えていたにも関わらずです。
以下のようなエラーメッセージを消したいです。
なお言語はpythonで、エラーメッセージは以下のようになります。

発生している問題・エラーメッセージ

Failed initializing MeCab. Please see the README for possible solutions: https://github.com/SamuraiT/mecab-python3#common-issues If you are still having trouble, please file an issue here, and include the ERROR DETAILS below: https://github.com/SamuraiT/mecab-python3/issues issueを英語で書く必要はありません。 ------------------- ERROR DETAILS ------------------------ arguments: -d unidic-csj-3.0.1.1 error message: [ifs] no such file or directory: unidic-csj-3.0.1.1/dicrc ---------------------------------------------------------- Traceback (most recent call last): File "/Users/my_name/Documents/pyrank.py", line 34, in <module> mecab = MeC/Documents/pyrank.py", line 34, in <module> mecab = MeCab.Tagger("-d unidic-csj-3.0.1.1")#Taggerというクラスのインスタンスを生成 File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/MeCab/__init__.py", line 124, in __init__ super(Tagger, self).__init__(args) RuntimeError
import MeCab import glob import re from collections import Counter import csv #import io,sys #sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8') k_w = [] tmp = "tmp.txt" #複数のtextを一つにまとめるためのtext fileobj = open(tmp,"w") #tmpファイルを一度'空'にする。 fileobj.close() gyou = 0 #ETV/**/*.txt行数 for file in glob.glob("低学年番組書き起こし/*.txt"):#ETV下全てのテキストファイルを読み込む file_data = open(file,"r") while True: text = file_data.readline() #text = text.replace("\n", "")#改行コード削除 text = text.replace("\r\n", "")#改行コード削除 if text: fileobj = open(tmp,"a") fileobj.write(text)#1行ずつtmpに追記していく fileobj.close() gyou += 1 #行数を数える else: break file_data.close() fileobj = open(tmp,"r") text = fileobj.read() #print(gyou) #形態素解析,単語分割 mecab = MeCab.Tagger("-d unidic-csj-3.0.1.1")#Taggerというクラスのインスタンスを生成 parse = mecab.parse(text)#解析結果を文字列として取得 lines = parse.split('\n')#改行削除 items = (re.split('[\t,]', line) for line in lines) fileobj.close() words = [] n = [] cnt = 0 char_count = 0 # 名詞をリストに格納 for item in items: cnt += 1 if (item[0] not in ('EOS', '', 't', 'ー') and item[1] not in('助詞','助動詞','記号','接頭辞','接尾辞','固有名詞','補助記号') and #item[2] != ('非自立') and item[2] not in ('数詞','固有名詞') and len(item[0])!=1 and len(item)>7): char_count += 1 words.append({"語彙":item[8],"品詞":item[1],"読み":item[7]}) # print(item)

試したこと

MeCabやUniDicをもう一度インストールしてみたりしましたが、できませんでした。
インストールの方法は、UniDicのインストール用のWebページ(https://unidic.ninjal.ac.jp)から現代話し言葉UniDicをダウンロードしました。
###環境
MeCabとUniDicの場所は以下のようになっております。
Users/my_name/opt/anaconda3/lib/python3.7/site-packages/mecab
Users/my_name/Documents/unidic-csj-3.0.1.1
です。
実行方法は、IDLEで「Run」を押しました。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

quickquip

2021/02/02 04:03

どういうディレクトリの下で、どういうファイルが置かれていて、どうやって実行しているのか、という情報が足りません。 > MeCabやUniDicをもう一度インストールしてみたりしましたが、 具体的にどうやって? という情報がありません。
ym1111

2021/02/02 05:00

mecabとUniDicの場所は、それぞれ ./opt/anaconda3/lib/python3.7/site-packages/mecab /Documents/unidic-csj-3.0.1.1 です。 インストールの方法は、UniDicのインストール用のWebページ(https://unidic.ninjal.ac.jp)から現代話し言葉UniDicをダウンロードしました。
quickquip

2021/02/02 05:16

情報はこの欄ではなくて質問を編集して記載してくたさい。 質問のコードをどうやって実行しているかがまだ不明です。 上のコメントのパスがフルパスじゃないようなのでどの程度信頼していいのか、という気分になります。 個人情報の部分は伏せ字にしてもよいので、なるべくフルパスがよいと思います。 (質問に氏名が入っているので削除依頼を出して新規で質問をしてもいいかと感じました)
guest

回答1

0

Python

1 2#Taggerというクラスのインスタンスを生成 3mecab = MeCab.Tagger("-d unidic-csj-3.0.1.1") 4

この-d unidic-csj-3.0.1.1のところをフルパスにすればいいと思います。

ただ,コピペした時に
mecab = MeCab.Tagger("-d unidic-csj-3.0.1.1")#Taggerというクラスのインスタンスを生成
とパスが化けていたので,意図せず変な文字コードがパスの文字列内に混入したのかもしれません。

投稿2023/05/27 00:20

ujimushi_sradjp

総合スコア2152

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問