##初めに
現在、文章を形態素解析を行い、その結果をtxtファイルに書き込もうと思っています。
ただ、結果全てを書くのではなく、所々を排除したいと考えています。
##環境
windows10
jupyter notebook python 3
##現在のコード
python
1import sys 2import MeCab 3import csv 4 5csv_file = open("combination.csv", "r", encoding="ms932", errors="", newline="" ) 6fi = csv.reader(csv_file, delimiter=",", doublequote=True, lineterminator="\r\n", quotechar='"', skipinitialspace=True) 7list=[] 8header = next(fi) 9list.append(header) 10text = ' '.join(map(str,header)) 11m = MeCab.Tagger("-Ochasen") 12ana= m.parse(text) 13strs = ana.split('n') 14f = open('morphology.txt', 'w') 15f.writelines(strs) 16print(ana)
##jupyter notebookの出力結果
今日 キョウ 今日 名詞-副詞可能
も モ も 助詞-係助詞
また マタ また 接続詞
…(略)
##txtファイルの書き込み結果
今日 キョウ 今日 名詞-副詞可能
も モ も 助詞-係助詞
また マタ また 接続詞
…(略)
同じです。
##txtファイルの理想の書き込み
今日 も また …(略)
##説明
文章を形態素解析で区切った結果のうち、一番左のみを、次々にテキストファイルに書き込んでいくようにしたいと考えています。
##コードの説明
最初に、文章が入っているcsvファイルを読み込み、リスト型に配列されている文字列を、1つの文字列に連結させています。
そのあと、その文章を形態素解析を行っています。
今回は、最初の1つのセルに入っている文章のみを形態素解析しているので、連結する必要はありません。
で、MeCabで形態素解析をした結果を変数に代入して、そのままテキストファイルに入力しています。
##おわりに
おそらく、書き込みの部分を改造すればできると思うのですが、教えて頂けると助かります。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。