実現したいこと
住所カラムから市町村名だけを抽出し、新たなカラムを作りたい
実現したいデータ内容(例)
python
1import pandas as pd 2 3date = pd.DataFrame([['埼玉県所沢市松郷xx-xx','所沢市'], 4 ['埼玉県さいたま市浦和区北浦和x-x-x','さいたま市'], 5 ['神奈川県横浜市港北区大曽根x','横浜市']], 6 columns = ['住所','市町村']) 7 8 9 住所 市町村 100 埼玉県所沢市松郷xx-xx 所沢市 111 埼玉県さいたま市浦和区北浦和x-x-x さいたま市 122 神奈川県横浜市港北区大曽根x 横浜市 13
実行したこと
python
1import re 2 3test = '埼玉県所沢市松郷xx-xx' 4pat = '(...??[都道府県])((?:旭川|伊達|石狩|盛岡|奥州|田村|南相馬|那須塩原|東村山|武蔵村山|羽村|十日町|上越|富山|野々市|大町|蒲郡|四日市|姫路|大和郡山|廿日市|下>松|岩国|田川|大村|宮古|富良野|別府|佐伯|黒部|小諸|塩尻|玉野|周南)市|(?:余市|高市|[^市]{2,3}?)郡(?:玉村|大町|.{1,5}?)[町村]|(?:.{1,4}市)?[^町]{1,4}?区|.{1,7}?[市町村])(.+)' 5 6print(re.split(pat, test)) 7 8Out:['', '埼玉県', '所沢市', '松郷xx-xx', '']
分けたものを取り出して、カラムにする方法が分かりません。
ご教授いただくことは可能でしょうか?
よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。