Pythonで特定の文字を削除または置換

Question

### 前提

下記のテキストを特定の文字（’TubiPad&#10d5**;’）で始まる文字を削除したいです。
replaceを使って削除できましたが、毎回TubiPad以降が変化するので、
パターン1・パターン２のように変化しても削除できる方法ありますか。
もしあるのでしたら、どのように修正すれば良いでしょうか。
お手数ですが、ご確認をお願い致します。

### 実現したいこと
テキスト
パターン1
```
TubiPad&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;

TubiPad&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;

Test send
```
テキスト
パターン2
```
TubiPad&#11d5;&#12d6;&#x5fe2;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#x5fe2;&#xff09;&#10d5;&#10d6;&#x14a8;&#x5fe2;&#xff09;&#10d5;&#10d6;&#x14a8;&#x5fe2;&#xff09;&#10d5;&#10d6;&#x14a8;&#x5fe2;&#xff09;&#10d5;&#10d6;&#x14a8;&#x5fe2;

TubiPad&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#x5fe2;&#xff09;&#10d5;&#10d6;&#x14a8;&#x5fe2;&#xff09;&#10d5;&#10d6;&#x14a8;&#x5fe2;&#xff09;&#10d5;&#10d6;&#x14a8;&#x5fe2;&#xff09;&#10d5;&#10d6;&#x14a8;&#x5fe2;

Test send_2
```

**パターン1のように出力したい**
```
Test send
```

**パターン２のように出力したい**
```
Test send_2
```

### 該当のソースコード

```
import re

#ファイル読み込み
f = open(r"test.txt", 'r', encoding='UTF-8')

data = f.read()
#print(data)

#置換
new_data=data.replace('TubiPad&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;', ' ')
#print(new_data)
#改行なし
print(new_data.replace("
", " "))

f.close()
```

Accepted Answer

もし、正規表現を使いたいのであれば、以下のようにすると良いと思います。

```re.sub('TubiPad&#10d5.*?;
','',data)```は、
"TubiPad&#10d5"から始まり、最も少ない文字数の任意の文字をはさみ、";{改行}"で終わるパターンを、''に置換します。

``` python
import re

data = """
TubiPad&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;

TubiPad&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;&#10d5;&#10d6;&#x14a8;&#xff09;

Test send
"""
#print(data)

#置換
data = re.sub('TubiPad&#10d5.*?;
','',data)

print(data.replace("
", ""))
# Test send
```

Answer

リストとして読み込んで、特定の文字から始まるアイテムだけ除外して出力するのがてっとり早いと思います。
ファイル内の行をリストして読み込む、`.readlines()` というメソッドがあります。
特定の文字列を探すために、リストに対して使えるメソッド、`.startswith()` を使います。

ファイルの開閉は with 構文を使うと安全です。with 文を抜けると自動的にファイルが close されます。

```python
with open("test.txt", "r", encoding="utf-8") as f:
    lines = f.readlines()
    for line in lines:
        if not line.startswith("TubiPad&#10d5"):
            print(line)
```

前提

実現したいこと

該当のソースコード

関連した質問