前提・実現したいこと
pythonの正規表現で,住所を取りたいです
[漢字]県[漢字]市[漢字]町[数字(番地)]と[適当]が入った文章だけを抽出したいです.
また,住所にあたる部分も出せたら嬉しいです.
抽出したいtext例 : 明日は朝日県正午市夕方町1-1に行きます.適当にブラブラします
抽出したい例 : '朝日','正午','夕方','1','1',
発生している問題・エラーメッセージ
'Series' object has no attribute 're'
該当のソースコード
python
1import pandas as pd 2import re 3def make_dataframe(filename): 4 df = pd.read_csv(filename, encoding='utf-8', na_values='nan') 5 return df 6 7df = make_dataframe('hoge.csv') 8 9df2 = df[df['text'].re.search(r'(.+{0-9a-zA-Zぁ-んァ-ン}県)*(.+{0-9a-zA-Zぁ-んァ-ン}市)(.+{0-9a-zA-Zぁ-んァ-ン}町)*(.+)') & df['text'].str.contains('適当')] 10print(df2) 11print('取得テキスト数') 12print(len(df2['text']))

バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/12/06 16:51