ファイル読み込みから別ファイルへの保存
受付中
回答 0
投稿
- 評価
- クリップ 0
- VIEW 542

退会済みユーザー
前提・実現したいこと
csvファイルには1行ごとに英語の文章があります。
reviewディレクトリ内のcsvファイルを一つずつ読み込み
csvファイル内にgreatが含まれている文章だけを残して別のディレクトリに保存を行いたいです。
該当のソースコード
# -*- coding: utf-8 -*-
# 単語の出現頻度をExcelに
import openpyxl
import os
import codecs
import glob
from collections
def Treetaggerwrapper_en(spotname):
try:
word = [] # 単語
try:
fr = codecs.open(spotname, "rb", "sjis", "ignore") #読み込み
texts = fr.read().split("\n") #ファイルを1行ずつリストとしてtextに
fr.close()
texts = list(filter(lambda a: a != "", texts)) #空リスト削除
debug = 0
for text in texts:
debug +=1
if debug%50 == 0:
print("open_file = " + spotname + " lines = " + str(debug))
word = word + treetagger_en.keitaiso_kaiseki(text.replace("\s", " ")) #分かち書きしたワード
except Exception:
import traceback
traceback.print_exc()
except Exception:
import traceback
traceback.print_exc()
def Save_File_en2(data, save_directory, save_filename):
#ファイルに書き込み
wb = openpyxl.Workbook()
ws = wb.active
num = 1
for k,v in sorted(data.items(),key=lambda x:x[1],reverse=True):
ws.cell(column=1, row=num).value=k # 単語(原型)
ws.cell(column=2, row=num).value=v # 出現回数
num += 1
wb.save(save_directory + save_filename)
print("Save_Complete!\n")
if __name__ == '__main__':
path = os.getcwd() # このプログラムの場所
textrank_dir = "\\textrank\\" # "textrank"を保存するディレクトリ
review_dir = "\\review\\" # "review"ディレクトリ
if os.path.isdir(path + textrank_dir) == False: # "textrank"というフォルダが無ければ作成
os.mkdir(path + textrank_dir)
os.chdir("review/")
csv_files = glob.glob("*.csv")
save_directory = path + textrank_dir
csv_files_jp = []
csv_files_en = []
for j_or_e in csv_files:
if 'a' <= j_or_e[0:1] <= 'z' or 'A' <= j_or_e[0:1] <= 'Z':
csv_files_en.append(j_or_e)
else:
csv_files_jp.append(j_or_e)
-
気になる質問をクリップする
クリップした質問は、後からいつでもマイページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
クリップを取り消します
-
良い質問の評価を上げる
以下のような質問は評価を上げましょう
- 質問内容が明確
- 自分も答えを知りたい
- 質問者以外のユーザにも役立つ
評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。
質問の評価を上げたことを取り消します
-
評価を下げられる数の上限に達しました
評価を下げることができません
- 1日5回まで評価を下げられます
- 1日に1ユーザに対して2回まで評価を下げられます
質問の評価を下げる
teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。
- プログラミングに関係のない質問
- やってほしいことだけを記載した丸投げの質問
- 問題・課題が含まれていない質問
- 意図的に内容が抹消された質問
- 過去に投稿した質問と同じ内容の質問
- 広告と受け取られるような投稿
評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。
質問の評価を下げたことを取り消します
この機能は開放されていません
評価を下げる条件を満たしてません
質問の評価を下げる機能の利用条件
この機能を利用するためには、以下の事項を行う必要があります。
- 質問回答など一定の行動
-
メールアドレスの認証
メールアドレスの認証
-
質問評価に関するヘルプページの閲覧
質問評価に関するヘルプページの閲覧
まだ回答がついていません
15分調べてもわからないことは、teratailで質問しよう!
- ただいまの回答率 88.22%
- 質問をまとめることで、思考を整理して素早く解決
- テンプレート機能で、簡単に質問をまとめられる
質問への追記・修正の依頼
can110
2018/12/06 18:17
現在発生している問題(どこまでできているか)と分からない(できていない)ことを具体的に追記ください。