質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.51%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Mecab

Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。

Q&A

解決済

1回答

3123閲覧

mecabで出力したデータの型と内容

bunks

総合スコア30

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Mecab

Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。

0グッド

0クリップ

投稿2017/12/11 10:33

python3でmecabを用いた形態要素解析をしています。

from natto import MeCab m = MeCab() s = ”散歩したい。” l = m.parse(s) print(l) 出力結果↓ 散歩 名詞,サ変接続,*,*,*,*,散歩,サンポ,サンポ し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ たい 助動詞,*,*,*,特殊・タイ,基本形,たい,タイ,タイ 。 記号,句点,*,*,*,*,。,。,。 EOS

以上のようなコードと出力結果で

print(l[4]) ↓ 詞

であることから、出力された配列は[散,歩,名,詞]のようになっていると考えられます。

これを[散歩,名詞,サ変接続]のように出力するにはどうすれば良いでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

mecabのparseの結果はテキストの固まりです。したがって、改行記号・タブ記号などを頼りに各要素を分割してリスト化する必要があります。
実装は以下のような感じでいかがでしょうか?参考にして改良してください。

python

1def word_parse(txt) : # 引数にはmecabの解析結果を設定 2 i = 0 # Loopの1回目かどうかを識別するFlagの初期設定 3 x = txt.split("\n") # 単語単位の切れ目("\n")で分割 4 5 x.remove('') # クリーニング 6 x.remove('EOS') 7 for y in x : # 単語単位に名詞のみを抽出し、ひとつの配列として出力 8 9 tmp1 = y.split("\t")[0] # 単語の取得 10 tmp2 = y.split("\t")[1].split(",")[0] # 品詞情報などの取得 11 12 13 if tmp2 == '名詞' : # 名詞のみ抽出 14 print(i) 15 if i == 0 : 16 result = [tmp1] 17 else : 18 result.append(tmp1) 19 i = i + 1 20 else : 21 i = i + 1 22 return result

投稿2017/12/11 13:35

R.Shigemori

総合スコア3376

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

bunks

2017/12/15 05:25

ご回答ありがとうございます。 どういうわけか、やはりlistで出力されていたので、以下のようにして、一旦文字列に戻してから配列に置き換えました。 for x in l: mojiretsu += x hairetsu = mojiretsu.split(",") その後のクリーニングの作業などは回答を参考にして行わせていただきました。ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.51%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問