python3で読み込んだBytes型の文字列から\x00などを削除したい

Question

いつも大変お世話になります。
急遽、三菱のシーケンサからシリアル（RS-232C）で出力されるデータをラズベリーパイ3で受け取り、保存することになりました。
ラズベリーパイ3はStrechを使用し、手元にあったエレコムのUC-SGTと言うRS-232C⇔USBケーブルを使用してシーケンサと接続しています。
受け取りプログラムはPython3でとりあえず以下のようにいたしました。
```
import serial
import time

def main():
    ser = serial.Serial('/dev/ttyUSB_UC-SGT', 9600)
    time.sleep(2)
    print(ser.portstr)

    while 1:
        # シリアル通信でデータを受信
        rStr = ser.readline()
        #rStr.replace('\x00','')
        # 読み込んだデータの表示
        #print(rStr.decode('utf-8'))
        print(rStr)

if __name__ == '__main__':
    try:
        main()
    except KeyboardInterrupt:
        pass
```
上記のプログラムのprint(rStr)の出力結果は以下の通りです。
```
b'      \x00\x00\x00\x00 2 ,                                                             ,0  ,0  ,   ,   ,       4370  ,        993  ,  
'
```
この出力結果からヌル文字と改行コードを取り除きたいのです。
いろいろ探して以下のようなサイトも見つけましたが内容としてはstr型のようで問題なく実行できますが当方の出力結果はbytes型なので当たり前ですがうまくいきませんでした。
https://stackoverflow.com/questions/38883476/how-to-remove-those-x00-x00

シーケンサの内容を確認してもらったところヌル文字は全く意味がないそうですが、シーケンサをいじることはできません。

大変申し訳ありませんが何か参考になるものがありましたらよろしくお願いいたします。

Accepted Answer

もし出力が`unicode`型でも構わないのでしたら、

```lang-python
import re

b = b'      \x00\x00\x00\x00 2 ,                                                             ,0  ,0  ,   ,   ,       4370  ,        993  ,  
'
u = b.decode("utf-8").replace("\x00","")
u = re.sub(r"[
]+","",u)

print(u)
```
を実行することで
```
       2 ,                                                             ,0  ,0  ,   ,   ,       4370  ,        993  ,  
```
を得ることができます。

Answer

```python
rStr = b'      \x00\x00\x00\x00 2 ,                                                             ,0  ,0  ,   ,   ,       4370  ,        993  ,  
'

for old in (b'\x00', b'', b'
'):
    rStr = rStr.replace(old, b'')

print(rStr)
```
デコードしなくてもbytesのままreplaceできます。

Answer

同じ環境を持っていないのでテストできませんが、コメントアウトしてある「.decode('utf-8)」で文字列に変換できませんか? 文字列に変換できてしまえば、stackoverflowのリンクに書いてある.replace()と.strip()で余分な文字を取り除けると思います。

```python
    raw_data = bytes.fromhex('00 68 65 00 6C 00 6C 6F 0D 0A 00')
    print(raw_data)  # b'\x00he\x00l\x00lo
\x00'
    print('================')

    txt = raw_data.decode('utf-8') #  文字列に変換
    txt = txt.replace('\0', '')    #  \0を削除
    txt = txt.strip('
')        #  改行文字を削除
    print(len(txt))
    print(txt)                     #  'hello'の5文字
```

ヌル文字が先頭か末尾にしかこないのであれば、.replace()なしでもいけると思います。
```python
    txt = raw_data.decode('utf-8')
    txt = txt.strip('
\0')
```