### 前提 ```txt data 0: 10, 20 data 1: 20, 30 data 2: 30, 40 data 3: 40, 50 data 4: 50, 60 data 5: 60, 70 ``` の形式で記述されたテキストファイルがあります。このファイルにおける```:```と```,```を目印にして、以下のようなcsvファイルを作成したいです。 ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-01-24/029c0c4f-0895-4442-91d5-67c13da178a0.png) ### 試したこと ```Python with open(filename, encoding="shift-jis") as f: lines = f.readlines() ``` はじめに、上記の処理によりテキストを1行ずつリストに格納することを試みました。その上で、```split()```によるテキスト分割をしようと思い試行したところ以下の出力となりました。 ```Python data = linlines[0].split() #['data', '0:', '10,', '20'] ``` ```data[0]```および```data[1]```が分割されてしまってる上に、```data[2]```に余計な```,```が含まれる結果となってしまいました。解決策をご教授いただけるとありがたいです。

```python import re filename = 'data.txt' with open(filename, encoding="shift-jis") as f: csv_lines = f.read().translate(str.maketrans({' ': '', ':': ','})) #csv_lines = re.sub(r'[ :]', lambda g: {' ': '', ':': ','}[g[0]], f.read()) print(csv_lines) # data0,10,20 # data1,20,30 # data2,30,40 # data3,40,50 # data4,50,60 # data5,60,70 ```

以下のような手順はどうでしょうか。 1. 行からすべての空白を削除。 1. 「:」で分割する。 1. 2つめを「,」で分割する。 re.split()を使えば「:もしくは,で分割する」もできますね。

テキスト文字列における":"と","で区切ってcsv化したい

前提

txt
1data   0: 10,   20
2data   1: 20,   30
3data   2: 30,   40
4data   3: 40,   50
5data   4: 50,   60
6data   5: 60,   70

の形式で記述されたテキストファイルがあります。
このファイルにおける:と,を目印にして、以下のようなcsvファイルを作成したいです。

試したこと

Python
1with open(filename, encoding="shift-jis") as f:
2    lines = f.readlines()

はじめに、上記の処理によりテキストを1行ずつリストに格納することを試みました。
その上で、split()によるテキスト分割をしようと思い試行したところ以下の出力となりました。

Python
1data = linlines[0].split()
2#['data', '0:', '10,', '20']

data[0]およびdata[1]が分割されてしまってる上に、data[2]に余計な,が含まれる結果となってしまいました。
解決策をご教授いただけるとありがたいです。

行動規範の内容に同意します

回答2件

ベストアンサー

python
1import re
2
3filename = 'data.txt'
4with open(filename, encoding="shift-jis") as f:
5    csv_lines = f.read().translate(str.maketrans({' ': '', ':': ','}))
6    #csv_lines = re.sub(r'[ :]', lambda g: {' ': '', ':': ','}[g[0]], f.read())
7
8print(csv_lines)
9
10# data0,10,20
11# data1,20,30
12# data2,30,40
13# data3,40,50
14# data4,50,60
15# data5,60,70

投稿2023/01/24 08:56

編集2023/01/24 09:02

melian

総合スコア21713

katamalix

2023/01/24 08:57

ありがとうございます。このようにスマートに記述できることに感動しました。参考にさせていただきます。

melian

2023/01/24 09:03

str.translate() の方が簡便なので、そちらに書き直しました。(import re が不要になります)

katamalix

2023/01/24 09:59

ありがとうございます。質問ではtxtファイルを読み込むことを想定した記述としましたが、実際は膨大なtxtファイルから該当部分を抽出したオブジェクトを操作しております。すなわち、 with open(filename, encoding="shift-jis") as f: lines = f.readlines() lines_len = len(lines) line_arr = np.array(lines) smp_start = np.where(line_arr=="START")[0][-1] smp_end = np.where(line_arr=="END")[0][-1] smp_data = lines[smp_start:smp_end] のような操作をしており、smp_data (リスト) が手元にある状態です。このリストを一旦txt出力し、再度with文で読ませればmelian様の記述した文で対応できるのですが、 txt出力を介さない方法があればご教授頂きたいです。

katamalix

2023/01/24 10:24

for i in range(len(smp_data)): smp_data[i] = re.split( ",|:",smp_data[i].translate(str.maketrans({' ': '', ':': ',', '\n': ''}))) この記述とし2次元配列化、to_csv()で実現できました。ありがとうございました。

行動規範の内容に同意します