質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

1241閲覧

「大文字のアルファベット一文字」を文字列から見つけ、削除したい

takurooper

総合スコア11

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/04/24 08:24

「大文字のアルファベット一文字」を文字列から見つけ、削除したいと考えています。

正規表現について公式ドキュメントを読み、次のように考えました。

  • 「大文字のアルファベット」は[A-Z] もしくは ¥U で指定できるのではないか
  • {1} もしくは ? を直後につけることで一文字と指定できるのではないか

https://docs.python.org/ja/3/library/re.html#regular-expression-syntax

問題のコード

python

1import re 2hogehoge = "1 F 11 FF 111 FFF" 3result = re.sub(r'[A-Z]{1}', '', hogehoge) 4print(result)

output

11 11 111 2

理想のアウトプットは以下の通りです。

idealoutput

11 11 FF 111 FFF 2

なお、r'[A-Z]?' とした場合には同様の出力。r'¥U{1}'とした場合にはhogehogeが返ってきました。

実行環境

mac 10.15.4(19E287)
Python 3.8.1
jupyter-notebook 6.0.3

なにか凡ミスだと思うのですが、よろしくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

こういうことですかね。

re.sub(r'(?<![A-Z])[A-Z](?![A-Z])', '', hogehoge)

投稿2020/04/24 08:41

編集2020/04/24 08:42
KojiDoi

総合スコア13692

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

takurooper

2020/04/24 08:51

ご回答ありがとうございます!! 先に回答していただいたため、LouiS0616様をベストアンサーとさせていただきました。
guest

0

ベストアンサー

質問の意図を読み違えていたので修正。

例えば、

hogehoge = "1 FF 11 F 111 G"
という文字列を
result = "1 FF 11 111" (空白については不問)
として取り出したいと考えております。

否定先読み・後読みが便利です。

Python

1>>> re.sub(r'(?<![A-Z])[A-Z](?![A-Z]) ?', '', '1 F 11 FF 111 FFF') 2'1 11 FF 111 FFF' 3>>> re.sub(r'(?<![A-Z])[A-Z](?![A-Z]) ?', '', '1 FF 11 F 111 G') 4'1 FF 11 111 '

追記・別解

ド派手に質問を勘違いした上に、
修正の結果KojiDoiさんのパクリみたいになってしまったので差別化のため追記。

次のようなアプローチも有効だと思います。

Python

1import re 2 3src = '1 FF 11 F 111 G' 4dst = ' '.join( 5 seq for seq in src.split() 6 if not re.fullmatch(r'[A-Z]', seq) 7) 8print(dst)

修正前の回答

re.subはマッチした部分文字列の全てを置き換えます。そういう仕様です。
置き換え回数を抑制したい場合は、引数countを利用します。

Python

1>>> re.sub(r'[A-Z]{1}', '', hogehoge) 2'1 11 111 ' 3>>> re.sub(r'[A-Z]{1}', '', hogehoge, count=1) 4'1 11 FF 111 FFF'

re --- 正規表現操作 — Python 3.8.2 ドキュメント


なお、正規表現はただ [A-Z] で充分です。
[A-Z]{1} は冗長ですし、[A-Z]? だとちょっと意味合いが変わってきます。

投稿2020/04/24 08:28

編集2020/04/24 08:57
LouiS0616

総合スコア35668

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

takurooper

2020/04/24 08:34

ご回答ありがとうございます。質問の意図がわかりにくかったかもしれませんが、アルファベット一文字を、回数の制限なく削除したいと考えています。 例えば、 hogehoge = "1 FF 11 F 111 G" という文字列を result = "1 FF 11 111" (空白については不問) として取り出したいと考えております。
LouiS0616

2020/04/24 08:37

確かに『大文字のアルファベット一文字』を素直に解釈するとそうなりますね。 ちょっと読み違えていたようです。失礼しました。 回答を修正しますので、少々お待ち下さい。
LouiS0616

2020/04/24 08:42

ああっと、修正しましたのですがこれもちょっと外してますね。もうちょっと手直しします。
LouiS0616

2020/04/24 08:46

修正しました。
takurooper

2020/04/24 08:50

できました、ありがとうございます!! {1}では一文字を指定できず、 (A-Z以外)(A-Z)(A-Z以外) のように指定するということだったのですね。助かりました!
KojiDoi

2020/04/24 08:57

「{1}では一文字を指定できず、」ではありません。正規表現マッチは基本的に部分マッチなので、X{1}はXにもXXにもXXXにもマッチしてしまいます。単に量指定子を使っただけでは質問の意図のような選別は出来ないのです。「この前に大文字は来ない」「この後に大文字は来ない」を明確に指示してやる必要があるということです。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問