前提・実現したいこと
Pythonで入力文章をある語彙表の語句だけで言い換える(平易化する)システムを作っています。
入力文章をMeCabで分かち書きしてその語句をcsvファイルで保存し,csvファイルの語彙表と比較して,言い換える必要のある語句(語彙表に登録されていない語句)を検出する機能を実装中に以下の問題が発生しました。
私が行き詰っている方法でなくとも,分かち書きした語句と元々ある語彙表を比較して,語彙表にない語句を検出できる方法があれば教えていただきたいです.よろしくお願いいたします.
発生している問題・エラーメッセージ
分かち書きした語句をcsvファイルに保存すると1つのセルの中に入力されてしまう
該当のソースコード
Python
ソースコード
import sys
import MeCab
import csv
path_w = '---.csv'
data = []
#######形態素解析##########
m = MeCab.Tagger ("-Owakati")
print("形態素解析したい文章を入力してください")
x = input()
#######ファイル書き込み#######
with open(path_w, mode = 'w') as f:
f.write(str(m.parse(x)))
with open(path_w) as f:
print(f.read())
###########################
for row2 in csv.reader(open('---2.csv','r'),delimiter = '\t'):
for row1 in csv.reader(open('---.csv','r'),delimiter = '\t'):
if( row2 != row1):
print(row1)
試したこと
リストに入れて出力したら,セル別で保存されたが,クオーテーションが付くため表の前処理が必要となり断念した.
補足情報(FW/ツールのバージョンなど)
Windows7
Python 3.7.1
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
退会済みユーザー
2018/11/08 08:57