.txtを読み込んでngramを実装し.txtに保存するプログラムを作成している。
出力結果が[['私','は','学生','です'],['は','学生','です','。']]と表示されてしまう。
この[]や‘’、,を消したい
リストなのが悪いのは理解したがどうすればいいのかわからない。
最後に文字列にしていると思っているのでそこで消そうと試したがうまくいかないのでアドバイスがほしいです
import re
import sys
def n_gram(target, n):
result = []
for i in range(0, len(target) - n + 1):
result.append(target[i:i + n])
return result
with open('wakati.txt','r',encoding='utf-8') as f:
target =f.read()
file=open('output.txt','w',encoding='utf-8')
words_target = target.split(' ')
result = n_gram(words_target, 4)
print(result)
data = str(result)
file.writelines(data)
file.write(' ')
file.close()
~
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。