質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

2回答

791閲覧

Pythonのreモジュールで数字がうまくマッチしない

coffeebar

総合スコア140

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2021/10/07 08:57

環境: Python 3.7.6

reモジュールを使って、リスト内の数字を含む文字列を抽出したいです。

import re sample = ['は3週間後', 'HJ2021', '書き溜め10万文字', '起承転結の4話完結', '第2次大戦', 'HSF杯2009', '美少女3姉妹?', '小学1年生', 'R-15G', '30分チャレンジ', '300文字', '15話完結',] [s for s in sample if re.match('\d', s)]

sample内の全ての文字列が数字を含んでいるのでmatchするかと思うのですが、これを実行すると、

['30分チャレンジ', '300文字', '15話完結']

となり、抽出されない文字列があります。予想としては『「3週間」「2021」は時間を表すから単なる数字ではない、同じく「3姉妹」「1年生」などは人を表しているから数字ではない。』みたいなことかなとチラッと思います。(でも、30分は時間じゃないの? R-15Gは何で弾かれるの? 4話がダメで15話がOK?? とかイマイチしっくりきません。)
私が求めているのは そんな高度なことではなく、単純に半角か全角の数字を含む文字列を全部抽出したいというだけなのですが、なぜこのような結果になるのでしょうか? 私の意図のように動く、別のやり方がございますか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

match()のドキュメントを読みましょう。

string の先頭で 0 個以上の文字が正規表現 pattern にマッチすれば、...

string 中のどこででもマッチさせたいなら、代わりに search() を使ってください

投稿2021/10/07 09:05

編集2021/10/07 09:06
int32_t

総合スコア21695

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

coffeebar

2021/10/07 11:55

回答ありがとうございました。 matchという言葉に引きづられて、どこでもマッチするのかと勘違いしておりました。 searchが全体検索なんですね。
guest

0

matchは文字列の先頭がマッチするかテスト、抽出します。
先頭に限らずでどこでもいいのならsearchを使用できます。

投稿2021/10/07 09:06

itagagaki

総合スコア8402

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

coffeebar

2021/10/07 11:56

回答ありがとうございました。 matchが先頭のみとは、全く気づいてませんでした。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問