質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

3回答

2262閲覧

特定のテキストファイルを正規表現を使用して置換したファイルにして書き出したい

masahiro2017

総合スコア4

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/04/11 16:14

編集2020/04/11 16:25

前提・実現したいこと

最近コロナウイルスの影響もあり、Zoomを使用したミーティングが増えています。
ミーティング後にチャットログを保存しており、悪い事ではないのですが拍手を意味する「888888」「8888」などが大量に残っております。

少し内容を追いにくいと感じたのでPythonを利用し正規表現を使用したプログラムで「8もしくは8が2回以上続いた行がある場合、その行を置換して削除する」ツールを作成しようと考えています。

しかしながら、初心者のため置換した内容を上手くファイルに書き出すことが出来ず。。
恐縮ですがご教示いただけますと幸いです。
※初めての質問となり、内容に過不足がありましたら申し訳ございません。

発生している問題・エラーメッセージ

色々ためしており、このエラーメッセージが。。というものが出せず申し訳ありません。
途中までソースコードはなんとか作成してみています。
'test2.txt'を置換後のファイルとして作成出来ればと考えているのですが、上手く出来ません。

該当のソースコード

Python

1 2#coding: UTF-8 3import os 4import re 5import shutil 6 7src = 'test.txt' 8copy = 'test2.txt' 9 10if os.path.isfile(src): 11 shutil.copyfile(src,copy) 12 f = open('test2.txt') 13 list = f.readlines() 14 for line in list: 15     print(re.sub('^.*(8{1,}|8{1,}).$(\r\n|\r|\n)', '', line)) 16     line = f.readline() 17 f.close 18

試したこと

open() mode 'w'でなんとか新しいファイルに追記していけばと試行錯誤してみたのですが、上手く出力出来ていない状態です。

補足情報(FW/ツールのバージョンなど)

'test.txt'は下記のようなテキストファイルを使用してテストしていました。

======
10:00 氏名 よろしくおねがいします。 残る行
10:00 氏名 よろしくおねがいします。8 残る行
10:00 氏名 よろしくおねがいします。8 残る行
10:00 氏名 テスト8 残る行
10:00 氏名 テスト8 残る行
10:00 氏名 88 
10:00 氏名 888
10:00 氏名 8888
10:00 氏名 88888
10:00 氏名 888888
10:00 氏名 88888888
10:00 氏名 8 残る行
10:00 氏名 88
10:00 氏名 888
10:00 氏名 8888
10:00 氏名 88888
10:00 氏名 888888

======

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

pp.py

python3

1import os 2 3src = "test.txt" 4dest = "test2.txt" 5 6if os.path.isfile(src): 7 with open(src, mode="r") as f: 8 with open(dest, mode="w") as f2: 9 for line in f: 10 # 8もしくは8が2回以上続いた行がある場合、その行を削除する 11 if not("88" in line or "88" in line): 12 f2.write(line)

実行例:
イメージ説明

投稿2020/04/12 01:49

katoy

総合スコア22324

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ファイル全体を処理するのはいろいろ方法があります。

案1:ファイルを2つオープンして、ファイル1から1行読んで、ファイル2にその1行を書く、というのを繰り返す。メモリに入りきらない巨大なファイルでもOK
案2:ファイル1を全部メモリーに読み込んで、ファイル2にまとめて書く。この場合、同じファイルでもOK
両者の折衷案:

もとのコードを活かして折衷案(まとめて読んで、1行ずつ書く)で行くとすると、

Python

1with open(src) as f: 2 list = f.readlines() 3 4with open(copy,"w") as f: 5 for line in list: 6 lineの変更処理 7 f.write(line)

投稿2020/04/11 17:00

otn

総合スコア85901

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

一番重要なポイントとしては、test2.txtは「書き込みモード」でopenします。現状のコードでは「読み込みモード」ですから、期待したような内容のファイルを作ることはできません。

参考:
writeメソッドで文字列を書き込む

re.subの中身にも再考の余地がありそうです。8888の行は丸ごと廃棄でよいのか。それとも日付や名前は残しておきたいのか。「日本人の88%がコロナに感染します」みたいなコメントがあったとき、それは消すのか? その辺をどうするかで書き方が変わってきますが、質問を読む限りその辺の仕様が曖昧な気がします。

投稿2020/04/11 16:33

KojiDoi

総合スコア13692

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問