実現したいこと
pandas str.contains で、カタカナの全角、半角の区別をしないせず、抽出したいです。
アルファベットの大文字、小文字は、引数で、case=False で区別せず抽出できるのですが、
カタカナの全角、半角が入った文字を区別せずに抽出することができません。
該当のソースコード
python
1import pandas as pd 2list = ['A','B'] 3df1 = pd.DataFrame([['イチロー'], ['ICHIRO'], ['ichiro'],['イチロー']], columns=['名前']) 4df1 5 名前 60 イチロー 71 ICHIRO 82 ichiro 93 イチロー 10 11df1[df1['名前'].str.contains('ichiro',case=False)] #I全て子大文字 12 名前 131 ICHIRO 142 ichiro 15 16df1[df1['名前'].str.contains('IChiro',case=False)] #ICが大文字 17 名前 181 ICHIRO 192 ichiro 20 21df1[df1['名前'].str.contains('イチロー',case=False)] #全て子文字 22 名前 233 イチロー 24 25df1[df1['名前'].str.contains('イチロー',case=False)] #イが大文字 26 名前 27
カタカナの文字列の、全角、半角の混ざった検索語での抽出方法はないでしょうか?
回答1件
あなたの回答
tips
プレビュー