質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

2298閲覧

複数のtxtファイルから数値のみを取り出したいです.

Blackhoney115

総合スコア5

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2021/06/15 07:34

編集2021/06/16 11:00

複数のtxtファイルから数値のみを自動で取り出し,一つのテキストファイルに出力したいです.(可能であればExcelファイルに出力したいです.)

例としてテキストファイルの中身は,
#初期段階
X1-1
QE:gate
2.090633E-13
のようなものになっています.
ファイル名はcoulomb_~.txtです.

#一度目の修正後
知識が浅いため,ネットを参考に自分で作ってみたプログラムが以下です.
import pandas as pd
import glob
import re

all_files = glob.glob( "*.txt")

li = []

for filename in all_files:
df = pd.read_csv(filename, header=None,delimiter=" ")
df_num = re.sub(r"\d+","",df)
li.append(df_num)

frame = pd.concat(li, axis=0, ignore_index=True)

しかしこれでは,expected string or bytes-like objectというエラーがでて不可能でした.

#二度目の修正後
回答者様のおかげですべてのファイル内に存在するデータを一つのExcelファイルにすることはできましたが,どのファイルのデータとつながっているのかわからず,整理が難しいまま残ってしまいました.
ファイル名のcoulombの後には-2~3の数値が0.1刻みに存在しているのですが,これらのファイルが小さい順でしっかり並んでくれれば問題ないのですが,数値の絶対値でファイルが並び替えられてしまうので,順番に値を取得できるようにしたいです.
import pandas as pd
import glob
import re
import os

def get_num(file):
nums = []
with open(file) as f:
for line in f:
"実際に数値に変換してみて、できたものだけ取得する"
try:
nums.append( float(line.strip()))
except ValueError:
pass
return nums

nums = []
hoge = glob.glob("*.txt")
for file in hoge: # 取得対象のtxtファイルをglobなり取得する
nums += get_num(file)

df = pd.DataFrame([nums])
df.to_excel("ret.xlsx", header=False, index=False)

#三度目の修正後
Excelでデータの入れ替えなどが行えたためこれで完了とします.

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2021/06/15 07:41

やりたいことはわかりましたが、問題・課題はなんでしょうか
Blackhoney115

2021/06/15 07:53 編集

そもそもの自動システムの作成例を教えていただきたいです.
guest

回答1

0

ベストアンサー

とりあえず以下のようなコードで数値のみを取得できます。
Excelファイルとして出力するのはPandasto_excelが使えます。

Python

1import pandas as pd 2 3def get_num(file): 4 nums = [] 5 with open(file) as f: 6 for line in f: 7 # 実際に数値に変換してみて、できたものだけ取得する 8 try: 9 nums.append( float(line.strip())) 10 except ValueError: 11 pass 12 return nums 13 14nums = [] 15for file in ['coulomb_.txt']: # 取得対象のtxtファイルをglobなり取得する 16 nums += get_num(file) 17 18df = pd.DataFrame([nums]) 19df.to_excel('ret.xlsx', header=False, index=False)

投稿2021/06/15 07:56

can110

総合スコア38278

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Blackhoney115

2021/06/15 08:11 編集

サンプルありがとうございます!実際にfor文の[]の中に具体的なファイル名を入力した場合,ret.xlsxが出力されました! 実際にはファイルはcoulomb_-2からcouloumb_3まで数値が0.1刻みにあって,これらのファイルの中にある数値を一括で抽出して一つのエクセルファイルに変換したいのですが,可能でしょうか?
Blackhoney115

2021/06/15 08:17

import pandas as pd import glob import re import os def get_num(file): nums = [] with open(file) as f: for line in f: # 実際に数値に変換してみて、できたものだけ取得する try: nums.append( float(line.strip())) except ValueError: pass return nums nums = [] hoge = glob.glob("*.txt") for file in hoge: # 取得対象のtxtファイルをglobなり取得する nums += get_num(file) df = pd.DataFrame([nums]) df.to_excel("ret.xlsx", header=False, index=False) このように変更した場合は,一つのエクセルファイルにデータをすべて取ることが可能になりました! しかし,どのファイルをどの順番でとったのかわからず整理に苦労しそうです...
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問