質問編集履歴

1

詳しく書きました

2022/08/16 03:10

投稿

GKHHKJ
GKHHKJ

スコア39

test CHANGED
File without changes
test CHANGED
@@ -5,5 +5,17 @@
5
5
  text = extract_text(file_path)
6
6
  print(text)
7
7
 
8
+ 修正前↓
8
9
  '2022/07/290000029210株式会社○○先方0000000081321,100,000python.3.0.Win.ZAR0000.Batch.GRP015\x0c**入金消込処理リスト**作表日:作表者:会社名:2022年08月02日 PAGE-33/64エラー区分 エラー摘要入金伝票日入金取引先手数料負担入金No入金額消込条件消込対象先回収予定日 請求書No請求摘要商品区分3対象金額債権計上No',
9
10
 
11
+ 修正後の理想形↓
12
+ '2022/07/290000029210株式会社○○先方0000000081321,100,000',
13
+
14
+ 試したこと↓
15
+ 削除したい先頭を《に、後尾を》に置き換え、
16
+ atx = text.replace('python', '《').replace('債権計上No', '》').
17
+ 正規表現を用いて、《から》までを削除する
18
+ btx = re.sub(r'《.+?》', '', atx)
19
+
20
+ 結果↓
21
+ TypeError: expected string or bytes-like object