質問編集履歴
1
詳しく書きました
test
CHANGED
File without changes
|
test
CHANGED
@@ -5,5 +5,17 @@
|
|
5
5
|
text = extract_text(file_path)
|
6
6
|
print(text)
|
7
7
|
|
8
|
+
修正前↓
|
8
9
|
'2022/07/290000029210株式会社○○先方0000000081321,100,000python.3.0.Win.ZAR0000.Batch.GRP015\x0c**入金消込処理リスト**作表日:作表者:会社名:2022年08月02日 PAGE-33/64エラー区分 エラー摘要入金伝票日入金取引先手数料負担入金No入金額消込条件消込対象先回収予定日 請求書No請求摘要商品区分3対象金額債権計上No',
|
9
10
|
|
11
|
+
修正後の理想形↓
|
12
|
+
'2022/07/290000029210株式会社○○先方0000000081321,100,000',
|
13
|
+
|
14
|
+
試したこと↓
|
15
|
+
削除したい先頭を《に、後尾を》に置き換え、
|
16
|
+
atx = text.replace('python', '《').replace('債権計上No', '》').
|
17
|
+
正規表現を用いて、《から》までを削除する
|
18
|
+
btx = re.sub(r'《.+?》', '', atx)
|
19
|
+
|
20
|
+
結果↓
|
21
|
+
TypeError: expected string or bytes-like object
|