🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

ファイル

ファイルとは、文字列に基づいた名前又はパスからアクセスすることができる、任意の情報のブロック又は情報を格納するためのリソースです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1998閲覧

python DATファイルの加工

ekTJ

総合スコア109

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

ファイル

ファイルとは、文字列に基づいた名前又はパスからアクセスすることができる、任意の情報のブロック又は情報を格納するためのリソースです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/11/27 05:02

f = open(file_text.get(), 'r')、でDATデータを読み込んだ後の処理に大変苦戦しています。

求めているものは・・・
1.1行目は飛ばしたい
2.DATデータの中身はこのような数字の羅列です。
[20395089035130095 025838719000092770000052009 0015] 
この中から太字部分を1列目、2列目のように抽出したい
3.最後はCSVとして出力したい

慣れないDATファイルに迷走しております。宜しくお願いします。

import tkinter as tk #GUIライブラリ import tkinter.messagebox as tkm from pathlib import Path #ファイルシステムのパスを扱えるライブラリ import pandas as pd #csv扱うライブラリ import datetime as dt import cx_Oracle from tkinter import filedialog now = dt.datetime.now() #時刻 time = now.strftime('%Y%m%d-%H%M%S') def OpenFileDlg(tbox): ftype = [('','*')] dir = '.' # ファイルダイアログ表示 filename = filedialog.askopenfilename(filetypes = ftype, initialdir = dir) # ファイルパスをテキストボックスに表示 tbox.insert(0, filename) def btn_click(): # ボタン関数 cc=str(txt1.get())# テキストボックスの文字をccに代入 sc=str(txt2.get()) if not len(cc) == 6 : tkm.showerror("入力エラー", "顧客番号は6桁です") return elif not len(sc) == 7 : tkm.showerror("入力エラー", "社員番号は7桁です") return elif file_text.get() == '': tkm.showerror('エラー','データファイルを指定してください') return else: tkm.showinfo("情報", "CSVを保存中です") f = open(file_text.get(), 'r') root = tk.Tk() #Tkクラス生成 root.geometry('500x400+600+300') # 画面サイズ+位置 root.title('入力画面') # 画面タイトル #顧客番号 lbl1 = tk.Label(text='顧客番号',font=(u'MS ゴシック', 11, 'bold')) lbl1.place(x=85, y=145) txt1 = tk.Entry(width=30) txt1.place(x=160, y=150) btn = tk.Button(root, text='CSV出力',width=20, font=("Menlo",11),command=btn_click) btn.place(x=155, y=220) #社員番号 lbl2 = tk.Label(text='社員番号',font=(u'MS ゴシック', 11, 'bold')) lbl2.place(x=85, y=175) txt2 = tk.Entry(width=30) txt2.place(x=160, y=180) btn1 = tk.Button(root, text="終了", width=20, font=("Menlo",11),command=root.destroy) btn1.place(x=155, y=250) # Excelファイルダイアログ label = tk.Label(root, text='データファイル',font=(u'MS ゴシック', 10, 'bold')) label.place(x=100, y=95) file_text = tk.Entry(root, width=40) file_text.place(x=100, y=115) fdlg_button = tk.Button(root, text='ファイル選択', command = lambda: OpenFileDlg(file_text) ) fdlg_button.place(x=360, y=110) root.mainloop() #画面表示

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

pandas.read_fwfを使うと固定長ファイルを柔軟に読み込めます。

Python

1import pandas as pd 2from io import StringIO 3 4# テストデータ 5s = """header 620395089035130095 025838719000092770000052009 0015""" 7 8df = pd.read_fwf(StringIO(s), skiprows=1, header=None, colspecs=[(20,30), (47,51)], dtype=str) 9 10print(df) 11# 0 1 12#0 2583871900 0015 13 14df.to_csv('ret.csv', index=False)

投稿2020/11/27 05:24

can110

総合スコア38341

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ekTJ

2020/11/27 05:35

f = open(file_text.get(), 'r') df = pd.read_fwf(StringIO(f), skiprows=1, header=None, colspecs=[(20,30), (47,51)], dtype=str) print(df) のように実行したところ[initial_value must be str or None, not _io.TextIOWrapper]とのエラー表示が…どうしたのでしょうか。
can110

2020/11/27 05:36

「df = pd.read_fwf(file_name,~」 file_nameにはファイル名を指定してください。
ekTJ

2020/11/27 05:38

変数fにファイルのパスをしているのですが、それではダメということでしょうか?
can110

2020/11/27 05:44

具体的には「df = pd.read_fwf(’hoge.dat’,~」という感じです。 StringIO()は不要です。
ekTJ

2020/11/27 05:52

本当にありがとうございます!無事に抽出できました!! ちなみにどうしてStringIO()は不要だったのでしょう??
ekTJ

2020/11/27 06:26

can110様 1から10まで教えていただきありがとうございます!! また、宜しくお願いします。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問