あるデータの解析をしています。人々の興味のある職業です。一つだけを得らぶ人が進路を決めていると仮定し、複数選んでいる人がまだ自分が何をしたいか迷っていると判断したい。
mport pandas as pd df=pd.read_csv('https://raw.githubusercontent.com/freeCodeCamp/2017-new-coder-survey/master/clean-data/2017-fCC-New-Coders-Survey-Data.csv') freq_table=df['JobRoleInterest'].value_counts().reset_index().reset_index(drop=True) freq_table['# index'] = freq_table['index'].apply(lambda x: len(x.split(',')))
何%の人が一つだけ、何%の人が五つ以上の仕事に興味があるをみてみるために以下のコードを試したが、全部違う答えになる。正解をわかりませんしまだ統計の勉強中で正しのがどれかもわからない。
number_with_morethan_5_interests=freq_table['# index'].loc[5:].sum()/sum(freq_table['# index']) number_with_morethan_5_interests
答えは:99.96811224489796
from scipy.stats import percentileofscore percentileofscore(freq_table['# index'],5,kind='weak')
答えは: 68.90756302521008
percentage_morethan5_interest=100*len(freq_table[freq_table['# index'] >= 5])/len(freq_table) percentage_morethan5_interest
答えは:55.55555555555556
教えてください。ただし方法はどれでしょうか
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。