前提・実現したいこと
各列に'性別', '年齢', '職業'…といった情報がそれぞれ記載されているcsvファイルがあります。
それをpandasで読み込み、一部の文字列を別のものに置き換えたい場合はどうすればいいかご教示いただけないでしょうか。
具体的には、「性別」列にある「非公表」と「不明」をNaNに置き換えたいと思っています。
発生している問題・エラーメッセージ
文字列の置き換えがうまくいきません。
該当のソースコード
Python
1import pandas as pd 2 3df = pd.read_csv("data.csv") 4 5status_cnt = df["性別"].value_counts() 6print(status_cnt) 7#男性 4323 8#女性 2950 9#非公表 62 10#不明 23 11#女児 1 12#Name: 性別, dtype: int64 13 14df_s = pd.Series([df['性別']])#ここから下のコードが間違っていると思うのですが、どう修正したら良いか分かりません 15print(df_s) 16#0 0 女性 17#1 男性 18#2 男性 19#3 男... 20#dtype: object 21 22df = df_s.str.replace('非公表', 'NaN') 23print(df) 24#0 NaN 25#dtype: float64
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/04/16 11:28