###前提・実現したいこと
まず、janomeの簡略辞書を作り、
その後、csvのnameの部分を形態素解析したいと考えています。
csvと簡略辞書の中身は以下のようになっています。
【csv(food.csv)】
name,price1,price2
トマト 袋 スタンドポリ,398円,429円
ミニトマト 1個,158円,170円
トマト袋 無選別 500g,398円,429円
︙
【簡略辞書(userdic.csv)】
トマト,カスタム名詞,トマト
ルネッサンストマト,カスタム名詞,ルネッサンストマト
ミニトマト,カスタム名詞,ミニトマト
︙
tokenize() メソッドに解析したい文字列以外をいれたいとき、どのようなコードを書けばよいのか
わかりません。
調べても目的と合致するページを見つけることができないので、皆さんに教えていただければ幸いです。
###該当のソースコード
python
1import csv 2from janome.tokenizer import Tokenizer 3t = Tokenizer("userdic.csv", udic_type="simpledic", udic_enc="utf8") 4 5with open('food.csv', 'rt') as f: 6 reader = csv.reader(f) 7for i in t.tokenize(u'reader'): 8 print(i)
上記のコードを実行してもreaderが形態素解析されます。

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/10/26 07:19