解決したいこと
1.大量の日別(1分おき)×3変数のテキストファイルがあり、それを1つの「時系列csvファイル」にしたいです。
下記データ構造は「Tの後より10-10 18:11(10月10日18時11分)を、Dはデータのことです。
2.また、可能なら途中に「空行」があるので空行削除も行いたいです。
日別ファイルのデータ構造(追記)
テキストデータなので1行表記ですが、\n\n(改行)で同列数・列名のdataframeになります。
データの意味は「T月日時分D変数1、変数2、変数3」です。
\n\nT,10,10,18,11,D,280,523,835,\n\nT,10,10,18,12,D,280,516,834,\n\nT・・
目指したいデータ構造
datetime val_1 val_2 val_3
10-01 18:11 700 200 200
10-01 18:12 680 150 180
10-01 18:13 670 130 160
(略)
10-31 23:59 120 80 100
環境
windows10
python:3.6
コード/試行したこと
python
1import pandas as pd 2import csv 3import os, glob 4 5dir = './test_sin' 6text_files = glob.glob(dir + '/*.txt') 7 8for text_f in text_files: 9 file = open(text_f, 'r') #読み込み 10 string = file.read() #全データをと読み込む 11 #w = csv.writer(file, delimiter=',')
(output)text_fは./test_sin\D1029.TXTのみですが、
for
1 print(text_f)```だと全ファイルを読み込んでいます。 2 3 4 5### 他に試したこと 6\n\nで改行されていますのでエクセルでひとつずつ開いてみました。datetimeなのでcsv変換はできます。但し、日々の大量のテキストデータを1つずつ開くのは非現実的です。何とかpythonで処理したいと考えています。 7 8何卒、ご教授のほどよろしくお願いします。
回答2件
あなたの回答
tips
プレビュー