Pythonで特定の文字列を抽出したいです。
とあるフォルダ内に入っているテキストファイル名には必ず
「-数字4桁-数字2桁」というまとまりの文字列がファイル名のどこか入っています。この部分だけを抜き出したいです。(-はハイフン)
以下のような感じです。
例1)ファイル名:soccor-0123-45honda.txt
→ -0123-45
例2)ファイル名:-2020-1234baseball-0055-00ichiro.txt
→ -0055-00 (-2020-12は34が後ろについてるため「-数字4桁-数字4桁」のまとまりだからダメ)
条件
①どんなファイル名かはわからないとする。
②抜き出したい部分は必ずまとまっているとする。
("〇〇-数字4桁〇〇-数字2桁.txt"みたいなのはなし)
③例2のように抜き出したい部分以外にも数字や-(ハイフン)が含まれている可能性があるとする。
④一つの名前に抜き出したい部分は1つだけしかないとする。
(ファイル名:〇〇-数字4桁-数字2桁〇〇-数字4桁-数字2桁.txt みたいなのはなし)
もし条件③がなかったら「-(ハイフン)からそれを含め8文字取り出す」みたいな処理ができるのですが、なかなか条件が厳しくて困っています。
詳しい方教えていただけると幸いです。よろしくお願いします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2022/05/27 09:35