要素がバラバラに並んだpandasのデータフレームから、Geocoderなどを使って、都市名が存在すればその都市名だけをとりだすことはできるでしょうか?例えば、
df1 = pd.DataFrame({'Information1' : ['New York', 'game','Prof. HANA YAMADA', 'tennis','NICK'], 'Information2' : ['books', 24, 'GroupA','A. ELIZABETH JONES.',26], 'Information3' : ['Mr. ADAMS', 'Rome', 'Japan', 23,'GroupB'], 'Information4' : ['teacher', 'MARCO', 25, 'Moscow','pilot']}, index = {'Person 1','Person 2','Person 3', 'Person 4','Person 5'} )
これを出力して
Information1 Information2 Information3 Information4 Person 1 New York books Mr. ADAMS teacher Person 2 game 24 Rome MARCO Person 3 Prof. HANA YAMADA GroupA Japan 25 Person 4 tennis A. ELIZABETH JONES. 23 Moscow Person 5 NICK 26 GroupB pilot
という情報の種類がばらばらに並んだデータフレームdf1とがあるとします。
この、それぞれの人のInformation1からInformation4までで都市名があればその都市名を抽出することはできるでしょうか?
もし都市名が見つからなければ、以下のデータフレームdf2のGroupA~GroupDと一致するGroup名を取り出したいです。
df2= pd.DataFrame({'Number' : [0, 1, 2, 3]}, index = {'GroupA','GroupB','GroupC', 'GroupD'} )
これを出力して
Number GroupC 0 GroupB 1 GroupD 2 GroupA 3
この、「都市名が見つからなければGroup名をいれる」というのはif関数でできそうですが、
やはり前半の「都市名」のみ取り出す方法がさっぱりわかりません。
最終的に次のようになるのが理想です。
Place Person 1 New York Person 2 Rome Person 3 GroupA Person 4 Moscow Person 5 GroupB
詳しい方がいらっしゃいましたら、ぜひご回答ください。
よろしくお願いいたします。
回答3件
あなたの回答
tips
プレビュー