下記のコードのようにOchasenをつかって品詞が名詞のものだけ、取り出したいと思っていますが、どう書いていけばよいのかわからず色々試してみたもののそろそろ詰まってきました。Ochasenを使わなくてもとりあえず、名詞の単語が取り出せればいいと思っています。
なにか、こうかける、こうしたほうがいいなどがありましたら、ご教示頂けると助かります。
path = '/yyy/dddd/xxxx.csv' mecab = MeCab.Tagger("-Ochasen") with open(path, 'r') as f: texts = [line.rstrip('\n').split(',') for line in f] # ループで順番に取得するようにあとでかく line = [line[2] for line in texts] >> texts [['0','url', '日本語日本語日本語'], ['1','url','それは、孔子の教えであり、先生へ向けた言葉でもある'], ['2','url','ほげ高い山にのぼることができた']] >> line ['日本語日本語日本語', 'それは、孔子の教えであり、先生へ向けた言葉でもある', 'ほげ高い山にのぼることができた']
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/04/11 11:05
2019/04/11 11:09
2019/04/12 02:36
2019/04/12 02:46 編集
2019/04/12 12:04