Series の各値に整数値を割り当てたい場合
Series.factorize() をお使いください。
pandas.Series.factorize — pandas 0.24.2 documentation
python
1import pandas as pd
2
3s = pd.Series(["東京", "千葉", "埼玉", "千葉", "埼玉"])
4
5city_ids, cities = s.factorize()
6
7# 割り当てられた整数
8print(city_ids) # [0 1 2 1 2]
9
10# 値の種類
11print(cities) # Index(['東京', '千葉', '埼玉'], dtype='object')
Series を one-hot 表現にしたい場合
pandas.get_dummies() をお使いください。
pandas.get_dummies — pandas 0.24.2 documentation
python
1import pandas as pd
2
3s = pd.Series(["東京", "千葉", "埼玉", "千葉", "埼玉"])
4
5onehot = pd.get_dummies(s)
6print(onehot)
7# 千葉 埼玉 東京
8# 0 0 0 1
9# 1 1 0 0
10# 2 0 1 0
11# 3 1 0 0
12# 4 0 1 0
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。