質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

3828閲覧

Pythonのテキストデータ読み込みで、途中停止してしまう問題を回避したい

RKwg1028

総合スコア1

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

2クリップ

投稿2021/04/13 15:14

前提・実現したいこと

リストにテキストデータの内容を読み込ませたいのですが、ファイルの途中までしか読み込まれません。エラーメッセージも出ず、その後に書いたプログラムの処理は続行されています。

発生している問題・エラーメッセージ

下記のコードのようにprint(len(data))で読み込んだ行数を確認すると、約22,000行のうち一部しか読み込まれておらず、止まる位置は試行ごとにランダム(2,000-20,000行のどこか)です。

該当のソースコード

python

1with open(Filename[0]) as fileobj: 2 data=fileobj.readlines() 3 print(len(data))

試したこと

fileobj = open(Filename[0], 'r') #DATファイル読み込み
data=fileobj.readlines()
fileobj.close()

というwithを使わない方式、

encoding='UTF-8'

など、エンコーディングの指定も試しましたが結果は同様です。

while True:
line = fileobj.readline()
if line:
data.append(line)
row_no += 1
print(row_no)
else:
fileobj.close
break

のように一行ずつ読み込み、print(row_no)で行数を表示し続けると読み込めますが、時間がかかりすぎます。また、一行ずつ読む場合でも print(row_no) を外すとやはり途中までしか読まれません。

補足情報(FW/ツールのバージョンなど)

Python 3.9.2-64bit, Windows10 上で実行

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

bsdfan

2021/04/14 00:33

そのファイルはどうやって作成したものでしょうか? 書き込みながら(例えばダウンロードしながら)、読み込んでいたらこういうことが起きそうな気がします。
RKwg1028

2021/04/14 07:07

ファイルの作成を検知してすぐに読み込みにいくようなプログラムにしていたので、sleepを入れてファイルの作成完了まで待たせることにより解決しました。大変助かりました。ありがとうございます。
guest

回答1

0

ベストアンサー

ちょっと原因が読めませんが…たとえば下記ではどうなりますか?
もし該当のファイル(あるいはダミーデータ)をアップロードできるのでしたら、もっと詳しい方が回答してくれるかもしれません。

python3

1with open(Filename[0]) as fileobj: 2 data=fileobj.read() 3 print(len(data.split("\n"))

投稿2021/04/13 23:15

jeanbiego

総合スコア3966

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

RKwg1028

2021/04/14 00:08

ご回答ありがとうございます。 教えていただいたコードを試してみましたが、やはり同様にランダムな位置で読み込みが止まります。データファイルはアップロードできないので再現できるダミーデータを作りたいのですが、今のところ問題が再現できるダミーが作れていない状態です。
jeanbiego

2021/04/14 00:18

そうなんですね。 ちなみに質問欄と同じコードで23000行のテキストファイルを読んでみましたが、問題はおきませんでした。そのファイル特有の問題かもしれません。
RKwg1028

2021/04/14 07:12

ファイルの作成を検知してすぐに読み込みにいくようなプログラムにしていたので、sleepを入れてファイルの作成完了まで待たせることにより解決しました。色々と試していただきありがとうございます。
jeanbiego

2021/04/14 07:13

なるほど、ファイルが仕上がってなかったんですね。スッキリしました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問