質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
86.02%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

大量のテキストファイルを読み込んで、その数だけ変数を作ってそれに入れる方法

fujikei
fujikei

総合スコア5

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

4回答

1グッド

0クリップ

336閲覧

投稿2023/02/07 09:06

実現したいこと

大量のテキストファイルを読み込んで変数に一個ずつ入れたい。

前提

初心者でGoogle ColaboratoryでPythonの勉強をしています。

発生している問題・エラーメッセージ

Google Colaboratoryにテキストファイルをアップロードして、それをテキストファイルの数と同じ数の変数を作ってそれに入れたいと思っているのですがうまくいきません。

該当のソースコード

Python

1textpath = sorted(glob.glob('/content/*.txt')) 2#print(textfile) →['/content/a.txt, '/content/b.txt, '/content/c.txt'] 3 4for i in textpath: 5 with open(i, mode='r', encoding='SHIFT-JIS') as f: 6 lines = f.readlines() 7 ??? 8

試したこと

このままだと用意したテキストファイルの内容がlinesに全て入っています。
私がしたいことはテキストファイルの内容が入った変数をテキストファイルと同じ数だけ作って、その後それぞれの変数をpandasのdataframeに変換していろいろいじりたいなと思っていたのですがどうしたらいいか分かりません。
大量のテキストファイルを読み込んでそれを大量の変数に順番に入れるコードが思いつきません。
かなり基本的なことを聞いてる気がしますが、よろしくお願いします。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

melian😄を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

回答4

1

以下は辞書に格納する場合です。辞書のキーはファイルの stem にしています。

python

1from pathlib import Path 2 3textpath = sorted(glob.glob('/content/*.txt')) 4texts = {} 5for i in textpath: 6 name = Path(i).stem 7 with open(i, mode='r', encoding='SHIFT-JIS') as f: 8 lines = f.readlines() 9 texts[name] = lines 10 11print(texts) 12 13# {'a': ['Hello World\n', 'Good Bye World\n'], 'b': ['1, 2, 3\n', '4, 5, 6\n'], 'c': ['list 1\n', 'dict 2\n']}

投稿2023/02/07 09:23

melian

総合スコア17079

fujikei😄を押しています

下記のような回答は推奨されていません。

  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

0

ベストアンサー

変数を複数用意するのではなく、以下のようにリストなりに入れるのが一般的です。
あるいはファイル名をキーとした辞書に入れるのもよいでしょう。

Python

1file_list = [] 2file_dict = {} 3for i in textpath: 4 with open(i, mode='r', encoding='SHIFT-JIS') as f: 5 lines = f.readlines() 6 file_list.append(lines) 7 file_dict[i] = lines

投稿2023/02/07 09:18

can110

総合スコア36961

下記のような回答は推奨されていません。

  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

回答へのコメント

fujikei

2023/02/07 09:27

大量の変数ということにこだわりすぎて、空のリストが思いつきませんでした。解決できました。ありがとうございました。

0

変数をテキストファイルと同じ数だけ作って

こういうことがしたいときにはリストの出番です。

python

1lines = [] 2for i in textpath: 3 with open(i, mode='r', encoding='SHIFT-JIS') as f: 4 lines.append(f.readlines())

これで、読み込んだ内容を lines[0], lines[1], のように扱うことができます。

ただ、「変数をpandasのdataframeに変換して」ということなので、内容が表のようなデータ(CSVとか)であれば、もっと他の良い策があると思うので、どのような内容のファイルで、最終的にどのようにしたいのかについて別途質問したほうがいいように思います。

投稿2023/02/07 09:14

編集2023/02/07 10:16
TakaiY

総合スコア10933

下記のような回答は推奨されていません。

  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

回答へのコメント

fujikei

2023/02/07 09:19

すぐの回答ありがとうございます。 試したところ'list' object attribute 'append' is read-onlyというエラーが出てきたのですが、何か前提が間違っていましたか?
TakaiY

2023/02/07 10:18

コードが間違えていたの直しました。

0

これは、あなたがやろうとしていることを達成できるコードスニペットです:

textpath = sorted(glob.glob('/content/*.txt')) データ = [] テキストパスの私のために: open(i, mode='r', encoding='SHIFT-JIS') を f: 行 = f.readlines() data.append(行)

現在、データはリストのリストであり、各リストにはテキストファイルの内容が含まれています
最初のファイルは data[0]、2 番目のファイルは data[1] など、データにインデックスを付けることで、各テキスト ファイルの内容にアクセスできます。
各テキスト ファイルの内容を pandas データフレームに変換するには、次のコードを使用します。

dfs = [データ内の d の pd.DataFrame(d)]

dfs は、テキスト ファイルごとに 1 つずつ、パンダ データフレームのリストになりました。
最初のファイルは dfs[0]、2 番目のファイルは dfs[1] などのように、dfs にインデックスを付けることで、各データフレームにアクセスできます。

投稿2023/02/07 09:14

Queenterry

総合スコア16

下記のような回答は推奨されていません。

  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
86.02%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。