質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

2回答

2346閲覧

[pythonでのファイル処理] split()した単語をcsvファイルに書き込みたい

Yukiya025

総合スコア86

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2018/09/18 09:44

編集2018/09/18 22:00

ロシア語でドストエフスキーの『26人の男と1人の少女』という小説を読んでみようと思っています。しかし如何せん単語力がないため、まず一つ一つの単語を.csvファイルに書き込んで、それに対応する日本語をつける予定です。

そのための第一歩、「split()した単語をcsvファイルに書き込む」という段階で躓いています。

ちなみに『26人の男と1人の少女』は、現れた1人のかわいらしい少女に夢も希望もない26人の男が好意を抱き、彼女の前では言動を慎み、女神に対する態度もかくやと思われるほど彼女をみんなで敬い大切にしていたが、その幻想がもろくも崩れ去り男達は夢も希望もない精神状態に逆戻り、という内容です。
ロマン・ガリの『天国の根』の逆バージョンとも言えます。

実行環境

  • Python 3.6.5
  • Windows7
  • Jupyter notebook

実現したいこと

.txtの内容を1単語ずつ.csvファイルに書き込みたい。なんとかcsvファイルに書き込めるまで改善できましたが、なぜか最初の5単語しかcsvファイルに書き込まれていません。
すべての単語をcsvファイルに書き込めるようにしたいです。

成功イメージ
12and1

.txtの内容

Нас было двадцать шесть человек — двадцать шесть живых машин, запертых в сыром подвале,...(略)

.txtファイル内容のsplit()はできた

コード

python

1f = open('26and1.txt', 'r', encoding = 'utf-8') 2for line in f: 3 print(line.split())

実行結果

['\ufeffНас', 'было', 'двадцать', 'шесть', 'человек', '—', 'двадцать', ...(略)]

上記でsplit()した単語をcsvファイルに書き込みたい

私が考えたコード (なぜかリスト0-4しかcsvに書き込まれない)

python

1import csv 2f = open('26and1.txt', 'r', encoding = 'utf-8-sig') 3 4with open('26and1.csv', 'w') as file: 5 for line in f: 6 # print(line) 7 data = line.split() 8 # print(data[0:2]) 9 for n in range(0, 103): 10 writer = csv.writer(file, lineterminator = '\n') 11 writer.writerow([data[n]])

出力結果
コード出力

現状

  • 単語数は103個あるはずなのに0~4までしかcsvファイルに書き込まれていない。

よろしくお願いしますorz

できましたー!

キリル文字はutf-8だと文字化けするので、utf-8-sigを使用。

python

1import csv 2f = open('26and1.txt', 'r', encoding = 'utf-8-sig') 3 4with open('26and1.csv', 'w', encoding = 'utf-8-sig') as file: 5 for line in f: 6 data = line.split() 7 for n in range(0, len(data)): 8 writer = csv.writer(file, lineterminator = '\n') 9 writer.writerow([data[n]])

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

世界の挨拶(utf-8).csv
上記ファイルをカンマ区切りから空白区切りに変換してサンプルデータを作りました。

実行結果
58

Python3

1import csv 2 3file_in = r'C:\workspace\tmp\test_in.txt' 4file_out = r'C:\workspace\tmp\test_out.csv' 5 6count_w = 0 7src = open(file_in, 'r', encoding = 'UTF-8') 8with open(file_out, 'w', encoding = 'UTF-8') as file: 9 for line in src: 10 data = line.split() 11 for n in range(len(data)): 12 writer = csv.writer(file, lineterminator = '\n') 13 writer.writerow([data[n]]) 14 count_w += 1 15print(count_w) 16

投稿2018/09/18 15:49

opyon

総合スコア1009

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Yukiya025

2018/09/18 22:10

opyonさま、おはようございます:) ありがとうございます(*≧∀≦) おかげさまで動きました! range(len(data))に差し替えました! 便利ですね<3 これで単語数に関係なくコードが動きます! ちなみに、キリル文字はutf-8だと文字化けするので、utf-8-sigを使いました^^/
opyon

2018/09/18 22:38

Желаю удачи!
Yukiya025

2018/09/18 22:48

Спасибо, opyon! Ты тоже изучаешь русский язык?
opyon

2018/09/18 22:52

Нет.Я искал в сети.
Yukiya025

2018/09/18 23:54

Ахаха, ты молодец! xD
guest

0

ベストアンサー

こうしてみてはいかがでしょうか。

with open('26and1.csv', 'w') as file:

with open('26and1.csv', 'w', encoding='UTF-8') as file:

出来上がったCSVファイルを開く際に文字コード指定でひらかなければなりませんが、一応これで書き込みが可能になります。

投稿2018/09/18 13:16

SatoshiMashino

総合スコア210

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Yukiya025

2018/09/18 22:07

SatoshiMashinoさま、おはようございます:) ありがとうございます(*≧∀≦) おかげさまで動きました! これでロシア文学をロシア語で読むのを簡単にするコードが進められます! ちなみに、キリル文字はutf-8だと文字化けしたので、utf-8-sigを使いました^^/
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問