質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 2.7

Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

3回答

9106閲覧

文字列の住所を(配列に)分割したい

decimal

総合スコア11

Python 2.7

Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2018/08/05 06:06

文字列の住所を(配列に)分割したい

文字列:
東京都千代田区丸の内1-9-2グラントウキョウサウスタワー23階

結果例:
[東京都, 千代田区, 丸の内, 1-9-2, グラントウキョウサウスタワー23階]

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

郵便番号データベースを利用しては如何でしょう。
https://www.post.japanpost.jp/zipcode/dl/oogaki-zip.html

サウスタワー 23 を検索すると、こんな行がヒットします。
イメージ説明

"東京都" "千代田区" "丸の内グラントウキョウサウスタワー(23階)"
までは分解できそうです。

投稿2018/08/05 06:36

katoy

総合スコア22324

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

decimal

2018/08/05 06:43

回答ありがとうございます。 利用シーンとして、必ず都道府県から始まるとは限らない住所が何行もあるCSVがあって、 その住所から例えばKEN_ALL.csvに突合させて郵便番号を取得するというものなんです。 また、利用環境はオフラインのため、外部とは接続できません。
guest

0

自己解決

import re

s_nums = '東京都千代田区丸の内1-9-2グラントウキョウサウスタワー23階'
pat = '(...??[都道府県])((?:旭川|伊達|石狩|盛岡|奥州|田村|南相馬|那須塩原|東村山
|武蔵村山|羽村|十日町|上越|富山|野々市|大町|蒲郡|四日市|姫路|大和郡山|廿日市|下>松|岩国|田川|大村|宮古|富良野|別府|佐伯|黒部|小諸|塩尻|玉野|周南)市|(?:余市|高市
|[^市]{2,3}?)郡(?:玉村|大町|.{1,5}?)[町村]|(?:.{1,4}市)?[^町]{1,4}?区|.{1,7}?[市
町村])(.+)'

print(re.split(pat, s_nums))

['', '東京都', '千代田区', '丸の内1-9-2グラントウキョウサウスタワー23階', '']

投稿2018/08/05 06:28

decimal

総合スコア11

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

先人が既に挑戦していますが、ものすごく大変です。
Qiita - なるべく短い正規表現で住所を「都道府県/市区町村/それ以降」に分けるエクストリームスポーツ

なぜそのような処理が必要なのか追記した方が良いでしょう。

投稿2018/08/05 06:10

LouiS0616

総合スコア35658

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

decimal

2018/08/05 06:15

住所マスタとマッチングをかけたいため。 RubyやPHPですと、ググると同様の解決例を目にしたのですが、 Pythonのものがなかったため。 また、文字列を後ろから1文字ずつ消していって、マッチングをかけるのも考えましたが、 処理に時間がかかることが想定されるため。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問