実現したいこと
Googleスプレッドシートの正規表現にて、データの都道府県名より後ろの文字列を削除したいのですが、
いい線まで行ったのですが、最後の仕上げで苦戦しています。
※実際のデータは、クレジットカードの明細なのですが、使用しているAMEXカードだけ、
都道府県名、市区町村名が入り、これを除外したいです。
GARB Tokyo 東京都 千代田区 GARB JR東日本 えきねっと 東京都 渋谷区 JR東日本 スターバックスカフェ ◯◯店 東京都 港区 ココナラ 東京都 渋谷区 チャットワーク -大阪府 大阪市 チャットワーク -東京都 港区 チャットワーク -東京都 港区 チャットワーク -東京都 港区 **ADOBE ADOBE SYSTEMS **帝都自動車交通株式会社
該当のソースコード
=REGEXEXTRACT(A1, "^(.+?)(?: .+?[都道府県].*)?$")
試したこと
4時間ぐらい粘って、上記のところまで達したのですが、
一般化すると、下記のようなデータ
XXX X 京都府 京都市 XXX XX 京都府 京都市 XXX XXX 京都府 京都市 **XXX X **XXX XX **XXX XXX
を抽出して、
下記
XXX X XXX XX XXX XXX **XXX X **XXX XX **XXX XXX
のようにしたいのですが、
下記
XXX XXX XXX **XXX X **XXX XX **XXX XXX
のようになってしまいます。
うまく行かない部分として
GARB Tokyo 東京都 千代田区 GARB JR東日本 えきねっと 東京都 渋谷区 JR東日本 スターバックスカフェ ◯◯店 東京都 港区
のようななデータを
GARB Tokyo JR東日本 えきねっと スターバックスカフェ ◯◯店
のようにしたいのですが、
GARB JR東日本 スターバックスカフェ
と、途中が消えてしまい、都道府県名・市区町村名以外も削除されてしまいます。
どうすれば抽出できるか正規表現を助けていただきたいです。
なお、都道府県名の前にあることがある「-」は、
あとから削除しようと思っていましたが、最終的には削除したいです。
何卒よろしくお願いします。

回答2件
あなたの回答
tips
プレビュー