回答率: 85.35%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.35%

トップ Python 3.xに関する質問

Q&A

解決済

2回答

791閲覧

Pythonのreモジュールで数字がうまくマッチしない

総合スコア140

0グッド

0クリップ

投稿2021/10/07 08:57

0

0

環境：　Python 3.7.6

reモジュールを使って、リスト内の数字を含む文字列を抽出したいです。

import re
sample = ['は3週間後', 'HJ2021', '書き溜め10万文字', '起承転結の4話完結', '第２次大戦', 'HSF杯2009', '美少女３姉妹？', '小学1年生', 'Ｒ-15Ｇ', '30分チャレンジ', '３００文字', '15話完結',]
[s for s in sample if re.match('\d', s)]

sample内の全ての文字列が数字を含んでいるのでmatchするかと思うのですが、これを実行すると、

['30分チャレンジ', '３００文字', '15話完結']

となり、抽出されない文字列があります。予想としては『「3週間」「2021」は時間を表すから単なる数字ではない、同じく「３姉妹」「1年生」などは人を表しているから数字ではない。』みたいなことかなとチラッと思います。（でも、30分は時間じゃないの？　Ｒ-15Ｇは何で弾かれるの？　4話がダメで15話がOK？？　とかイマイチしっくりきません。）
私が求めているのはそんな高度なことではなく、単純に半角か全角の数字を含む文字列を全部抽出したいというだけなのですが、なぜこのような結果になるのでしょうか？　私の意図のように動く、別のやり方がございますか？

行動規範の内容に同意します

回答2件

0

ベストアンサー

match()のドキュメントを読みましょう。

string の先頭で 0 個以上の文字が正規表現 pattern にマッチすれば、...

string 中のどこででもマッチさせたいなら、代わりに search() を使ってください

投稿2021/10/07 09:05

編集2021/10/07 09:06

総合スコア21695

2021/10/07 11:55

回答ありがとうございました。 matchという言葉に引きづられて、どこでもマッチするのかと勘違いしておりました。 searchが全体検索なんですね。

行動規範の内容に同意します

0

matchは文字列の先頭がマッチするかテスト、抽出します。
先頭に限らずでどこでもいいのならsearchを使用できます。

投稿2021/10/07 09:06

総合スコア8402

2021/10/07 11:56

回答ありがとうございました。 matchが先頭のみとは、全く気づいてませんでした。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ Python 3.xに関する質問

Pythonのreモジュールで数字がうまくマッチしない