###正規表現処理を順番にしていきたいです。
0000.jsonl~2900.jsonlのテキストファイルがあり、ファイル一つずつに正規表現を使って置換をしなければなりません。
あまりの膨大な量のデータなので、grepを用いても全てのファイルを一括で置換することはできないでの、一つずつ順番に0000.jsonlの処理を終えたら0001.jsonlの処理という風に最後の2900.jsonlまで順番に正規表現処理をしたいです。
ちなみに正規表現処理というのは、コーパスファイルを扱っているのですが、各ファイルの中のタグだけを抽出するため、タグ以外の部分を検索し、その部分を""に(つまり空白)置換しようとしています。
環境はMacで、python,perlなどを使っております。
何かヒントだけでもいただけないでしょうか?
回答1件
あなたの回答
tips
プレビュー