正規表現を用いて、「.html」を含む文字列以外の単語を抜き取ろうとしているのですが、全く抜き取れません。
以下がデータで、抜き取りたいのは「programs」「algorism」「data」「structure」です。
program algorithm sort.html search.html data.html data structure
どのように記述すればよいのでしょうか。
ソースコードは以下のとおりです。
file = open("上記のテキストデータ", "r") txt = file.read() re.findall("^([a-zA-Z]+.html)", txt)
※.htmlを含む文字列の抽出はできました。
re.findall("[a-zA-Z]+.html", txt)
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/05/10 06:54