質問編集履歴 - Pandasで読み込んだデータのX文字目からY文字目までを結合する方法について又は任意の文字数でのtableの分割方法

書式の改善

2020/09/04 12:54

投稿

スコア1

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- Pandasで読み込んだデータのX文字目からY文字目までを結合する方法について
1	+ Pandasで読み込んだデータのX文字目からY文字目までを結合する方法について又は任意の文字数でのtableの分割方法

body CHANGED Viewed

File without changes

317 716

書式の改善

2020/09/04 12:54

投稿

ErstNeun

スコア1

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -21,13 +21,14 @@
 HDABCDEF           000111    YYYYMMDDYYYYMMDDYYYYMMDD
 > 作成したいデータ
-HD,ABCDEF,           ,000111,    ,YYYYMMDD,YYYYMMDD,YYYYMMDD
+HD,ABCDEF,           ,000111,    ,YYYYMMDD,YYYYMMDD,YYYYMMDD
 ※スペースは文字列としてカウント
 結合は
+  HD,ABCDFE,           ,000111,    ,YYYYMMDD,YYYYMMDD,YYYYMMDD
-1～2, 3～7, 8～18, 19～24, 25～28, 29～36, 37～44, 45～52 文字目を結合したいです。
+1～2, 3～7, 8～18     ,19～24, 25～28, 29～36, 37～44, 45～52 文字目を結合したいです。
-  2    6     11      6       4       8       8       8    ←それぞれの結合したい文字数
+  2    6     11          6       4       8       8       8    ←それぞれの結合したい文字数
 ### 該当のソースコード
 `````````````````````````````````````````````````````````````````````

317 716

段落修正

2020/09/01 04:14

投稿

ErstNeun

スコア1

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -19,8 +19,10 @@
 > 引用テキスト(元データ)
 HDABCDEF           000111    YYYYMMDDYYYYMMDDYYYYMMDD
-作成したいデータ
+> 作成したいデータ
 HD,ABCDEF,           ,000111,    ,YYYYMMDD,YYYYMMDD,YYYYMMDD
 ※スペースは文字列としてカウント
 結合は

317 716

誤字

2020/09/01 03:59

投稿

ErstNeun

スコア1

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -21,6 +21,7 @@
 HDABCDEF           000111    YYYYMMDDYYYYMMDDYYYYMMDD
 作成したいデータ
 HD,ABCDEF,           ,000111,    ,YYYYMMDD,YYYYMMDD,YYYYMMDD
+※スペースは文字列としてカウント
 結合は
 1～2, 3～7, 8～18, 19～24, 25～28, 29～36, 37～44, 45～52 文字目を結合したいです。

317 716

ソースコードを途中までですが、最初から記載いたしました。

2020/09/01 03:57

投稿

ErstNeun

スコア1

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -6,24 +6,50 @@
 ### 発生している問題・エラーメッセージ
 元のテキストデータはTabや「,」で区切られておりません。
-このため、行ったのは1行目1,005行を一文字づつ区切って
+このため、行ったのは1,005文字を一文字づつ区切って
 data[0]+data[1]...で結合を行っているが、1,005文字あるのでこれを手作業で行うよりは
 X文字目からY文字目まで結合するなどのコードが分かればと思い質問させていただきました。
 よろしくお願いします。
+コードを使う使わない別として、全てのコードを記載しました。
+分かりづらくて申し訳ありません。
+現在成功している事
+読み込んだデータを１文字づつ区切る
-### 該当のソースコード
+> 引用テキスト(元データ)
-元データ(一部抜粋)
-HDABCDEF           000111    202009012020080120200831
+HDABCDEF           000111    YYYYMMDDYYYYMMDDYYYYMMDD
 作成したいデータ
-HD,ABCDEF,           ,000111,    ,20200901,20200801,20200831
+HD,ABCDEF,           ,000111,    ,YYYYMMDD,YYYYMMDD,YYYYMMDD
+結合は
+1～2, 3～7, 8～18, 19～24, 25～28, 29～36, 37～44, 45～52 文字目を結合したいです。
-df = pd.read_table(filepath , header=None, encoding='cp932')
+  2    6     11      6       4       8       8       8    ←それぞれの結合したい文字数
-これで元データを１文字づつに区切り
+### 該当のソースコード
+`````````````````````````````````````````````````````````````````````
+import pandas as pd
+import numpy as np
+import os
+import openpyxl
+import glob
+import re
+#ファイルパス
+filepath = ('Python/test.txt')
+#ファイル読み込み
+df = pd.read_table(filepath , header=None)
+df1 = df.iloc[0][0]
+#1文字づつ分割
-data[0]+data[1], data[2]+(中略)+data[7], data[8]+(中略)+data[18], .......
+data = [df1[i: i+1] for i in range(0, len(df1), 1)]
+#1文字目と2文字目、     3～7文字目を結合、                                8～18文字目を結合
+df2 = data[0]+data[1], data[2]+data[3]+data[4]+data[5]+data[6]+data[7], data[8]+data[9]+data[10]+data[11]+data[12]+data[13]+data[14]+data[15]+data[16]+data[17]+data[18]
+``````````````````````````````````````````````````````````````````````
 という形での途中まで結合を行いました。
-解決法がございましたら、よろしくお願いします。
+解決法がございましたら、よろしくお願いします。
-```ここに言語名を入力
-Python3
-```

317 716