Python
1import pandas as pd 2import csv 3 4Tokyo=pd.read_csv("C:/Users/detec/desktop/Datascience/Info_corona/coronaTokyo.csv") 5Osaka=pd.read_csv("C:/Users/detec/desktop/Datascience/Info_corona/coronaOsaka.csv") 6Hyogo=pd.read_csv("C:/Users/detec/desktop/Datascience/Info_corona/coronaHyogo.csv") 7 8Osaka['age'] = Osaka['age'].map({'未就学児': 0,'就学児': 0,'10': 10,'20': 20,'30': 30,'40': 40,'50': 50,'60': 60,'70': 70,'80': 80}) 9Hyogo['age'] = Hyogo['age'].map({'年代':"",'10': 10,'20': 20,'30': 30,'40': 40,'50': 50,'60': 60,'70': 70,'80': 80,'90': 90}) 10Tokyo['age'] = Tokyo['age'].map({'不明': "",'調査中': "NaN",'10歳未満': 0,'10代': 10,'20代': 20,'30代': 30,'40代': 40,'50代': 50,'60代': 60,'70代': 70,'80代': 80,'90代': 90}) 11Tvc = Tokyo["age"].value_counts() 12print(Tvc)
Python
1#Tokyo 2<bound method NDFrame.head of Unnamed: 0 No published date address age sex symptoms 30 0 1 2020-01-24 湖北省武漢市 40代 男性 NaN 41 1 2 2020-01-25 湖北省武漢市 30代 女性 NaN 52 2 3 2020-01-30 湖南省長沙市 30代 女性 NaN 63 3 4 2020-02-13 都内 70代 男性 NaN 74 4 5 2020-02-14 都内 50代 女性 NaN 8... ... ... ... ... ... .. ... 91514 1514 1517 2020-04-09 NaN 40代 男性 NaN 101515 1515 1518 2020-04-09 NaN 30代 男性 NaN 111516 1516 1519 2020-04-09 NaN 30代 男性 NaN 121517 1517 1520 2020-04-09 NaN 40代 女性 NaN 131518 1518 1521 2020-04-09 NaN 40代 男性 NaN 14 15[1519 rows x 7 columns]>
Python
1#Osaka 2<bound method NDFrame.head of Unnamed: 0 published date age sex address symptoms 30 1 01月29日 40 女性 大阪市 ― 41 2 02月27日 40 男性 大阪市 ― 52 3 02月28日 40 女性 大阪市 軽症 63 4 02月28日 未就学児 女性 大阪市 ― 74 5 03月02日 50 男性 大阪市 ― 8.. ... ... ... .. ... ... 9519 520 04月08日 30 女性 守口市 軽症 10520 521 04月08日 60 男性 羽曳野市 軽症 11521 522 04月08日 40 男性 大阪狭山市 軽症 12522 523 04月08日 40 男性 堺市 軽症 13523 524 04月08日 70 男性 堺市 軽症 14 15[524 rows x 6 columns]>
Python
1#Hyogo 2<bound method NDFrame.head of Unnamed: 0 number age sex address published date 30 0 52 80 男性 神戸市 3月13日 41 1 51 30 男性 神戸市 3月13日 52 2 50 70 女性 神戸市 3月13日 63 3 49 70 男性 神戸市 3月13日 74 4 48 40 男性 神戸市 3月13日 8.. ... ... .. .. ... ... 9282 282 207 60 女性 神戸市 4月6日 10283 283 206 50 男性 神戸市 4月6日 11284 284 205 40 女性 神戸市 4月6日 12285 285 204 20 女性 神戸市 4月6日 13286 286 203 40 男性 姫路市 4月5日 14 15[287 rows x 6 columns]>
この三つのデータをヒストグラム化したいです。数字の部分はとりあえずそのままで、年代の不明なものを外れ値としてデータから省きたいです。
NaNに変えて、dropしようかと思ったのですができませんでした。どうしたらいいでしょうか?
あなたの回答
tips
プレビュー