データセットのカラムに格納された空白で区切られたデータの最初の文字列を削除する方法

前提・実現したいこと

空白で区切られた文字列の最初の１つを削除しようとしています。
具体的には、以下のようなデータフレームがあり、「都市」カラムは空白で区切られた文字列が格納されています。そして、この場合、各行最初の文字列「札幌、釜山、メルボルン」を削除したいです。

データフレームはJupyternotebookで読み込んで、整形します。

国	|都市
日本	|札幌　仙台　東京
韓国	|釜山　ソウル
オーストラリア	|メルボルン　シドニー

発生している問題・エラーメッセージ

検索で手法を調べたのですが、
Python, splitでカンマ区切り文字列を分割、空白を削除しリスト化といったものしか見当たらず、空白で区切られた文字列の１つ目を特定する方法がどうしてもわからない状態です。
アドバイスや参考になりそうなコードをご存知の方がいらっしゃいましたら、教えていただきたいです。

追加で知りたいこと

同じデータフレームで、空白で区切られた文字列の単語数を数える方法を知りたいです。

国	|都市
日本	|札幌　仙台　東京
韓国	|釜山　ソウル
オーストラリア	|メルボルン　シドニー

の場合、日本は「３」、韓国とオーストラリアは「２」と新しくカラムを作って格納するにはどのように数えるべきでしょうか。

補足情報（FW/ツールのバージョンなど）

Python3.6
Jupyternotebook 5.0.0

行動規範の内容に同意します

回答2件

ベストアンサー

Series.str.extract() 使って正規表現つかうのはどうでしょう

コメントを受けて、"都市の数:のカラムを生成する処理を追加

Python
1import pandas as pd
2import io
3
4data='''
5国,都市
6日本,札幌　仙台　東京
7韓国,釜山　ソウル
8オーストラリア,メルボルン　シドニー
9'''
10
11df = pd.read_csv(io.StringIO(data))
12
13#都市数のカラムを追加
14df['都市の数'] = df['都市'].str.split().apply(len)
15print(df)
16#         国     都市  都市の数
17#0       日本  仙台　東京     3
18#1       韓国    ソウル     2
19#2  オーストラリア   シドニー     2
20
21#先頭の都市を削除
22df['都市'] = df['都市'].str.extract('[^　]*　(.+)', expand=False)
23print(df)
24#         国     都市  都市の数
25#0       日本  仙台　東京     3
26#1       韓国    ソウル     2
27#2  オーストラリア   シドニー     2
28
29