大量のテキストファイルを読み込んで、その数だけ変数を作ってそれに入れる方法
退会済みユーザー
総合スコア0

Question

### 実現したいこと

大量のテキストファイルを読み込んで変数に一個ずつ入れたい。

### 前提
初心者でGoogle ColaboratoryでPythonの勉強をしています。

### 発生している問題・エラーメッセージ

Google Colaboratoryにテキストファイルをアップロードして、それをテキストファイルの数と同じ数の変数を作ってそれに入れたいと思っているのですがうまくいきません。

### 該当のソースコード

```Python
textpath = sorted(glob.glob('/content/*.txt'))
#print(textfile) →['/content/a.txt, '/content/b.txt, '/content/c.txt']

for i in textpath:
    with open(i, mode='r', encoding='SHIFT-JIS') as f:
        lines = f.readlines()
        ???

```

### 試したこと
このままだと用意したテキストファイルの内容がlinesに全て入っています。
私がしたいことはテキストファイルの内容が入った変数をテキストファイルと同じ数だけ作って、その後それぞれの変数をpandasのdataframeに変換していろいろいじりたいなと思っていたのですがどうしたらいいか分かりません。
大量のテキストファイルを読み込んでそれを大量の変数に順番に入れるコードが思いつきません。
かなり基本的なことを聞いてる気がしますが、よろしくお願いします。

### 補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。

Accepted Answer

変数を**複数用意するのではなく**、以下のようにリストなりに入れるのが一般的です。
あるいはファイル名をキーとした辞書に入れるのもよいでしょう。
```Python
file_list = []
file_dict = {}
for i in textpath:
    with open(i, mode='r', encoding='SHIFT-JIS') as f:
        lines = f.readlines()
        file_list.append(lines)
        file_dict[i] = lines
```

Answer

以下は辞書に格納する場合です。辞書のキーはファイルの `stem` にしています。
```python
from pathlib import Path

textpath = sorted(glob.glob('/content/*.txt'))
texts = {}
for i in textpath:
    name = Path(i).stem
    with open(i, mode='r', encoding='SHIFT-JIS') as f:
        lines = f.readlines()
        texts[name] = lines

print(texts)

# {'a': ['Hello World
', 'Good Bye World
'], 'b': ['1, 2, 3
', '4, 5, 6
'], 'c': ['list 1
', 'dict 2
']}
```

Answer

> 変数をテキストファイルと同じ数だけ作って
こういうことがしたいときにはリストの出番です。

```python
lines = []
for i in textpath:
    with open(i, mode='r', encoding='SHIFT-JIS') as f:
        lines.append(f.readlines())
```
これで、読み込んだ内容を lines[0], lines[1], のように扱うことができます。

ただ、「変数をpandasのdataframeに変換して」ということなので、内容が表のようなデータ(CSVとか)であれば、もっと他の良い策があると思うので、どのような内容のファイルで、最終的にどのようにしたいのかについて別途質問したほうがいいように思います。

Answer

これは、あなたがやろうとしていることを達成できるコードスニペットです:
```ここに言語を入力
textpath = sorted(glob.glob('/content/*.txt'))
データ = []
テキストパスの私のために：
open(i, mode='r', encoding='SHIFT-JIS') を f:
行 = f.readlines()
data.append(行)
```
現在、データはリストのリストであり、各リストにはテキストファイルの内容が含まれています
最初のファイルは data[0]、2 番目のファイルは data[1] など、データにインデックスを付けることで、各テキスト ファイルの内容にアクセスできます。
各テキスト ファイルの内容を pandas データフレームに変換するには、次のコードを使用します。
```ここに言語を入力
dfs = [データ内の d の pd.DataFrame(d)]
```
dfs は、テキスト ファイルごとに 1 つずつ、パンダ データフレームのリストになりました。
最初のファイルは dfs[0]、2 番目のファイルは dfs[1] などのように、dfs にインデックスを付けることで、各データフレームにアクセスできます。

実現したいこと

前提

発生している問題・エラーメッセージ

該当のソースコード

試したこと

補足情報（FW/ツールのバージョンなど）

関連した質問