質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

2回答

1121閲覧

pandasで、カラム毎の合計値とその合計値が全体の何%になるかを知りたい

k-4

総合スコア11

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2020/05/10 04:35

編集2020/05/10 10:01

前提・実現したいこと

pandasで、下記のように、カラム毎の合計値とその合計値が全体の何%になるかをです。
python、初学者です。

count 割合

1 790 0.603514
2 235 0.179526
3 159 0.121467
4 43 0.032850
5 22 0.016807
6 25 0.019099
7 16 0.012223
8 8 0.006112
11 11 0.008403

発生している問題・エラーメッセージ

関数を作って、DataFrameに入れて結合すればできましたが、
pandas、numpyの機能などで、もっと簡単に表示する方法はないでしょうか?

該当のソースコード

def cal_variable(df, variable): count_df = pd.DataFrame(df[variable].value_counts()) mean_df = pd.DataFrame(df[variable].value_counts() / len(df[variable])) count_df.rename(columns={variable:'count'}, inplace=True) mean_df.rename(columns={variable:'割合'}, inplace=True) print(count_df.join(mean_df).sort_index())

サンプルデータ

index PassengerId Family
0 1 2
1 2 2
2 3 1
3 4 2
4 5 1

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2020/05/10 04:43

・コードは「コードの挿入」で記入してください。 ・データサンプルも提示してください。
k-4

2020/05/10 07:31

すみません。 修正しました。
guest

回答2

0

いろいろ試した結果、こうなりました。
やりたいことは、Pclassの要素ごとに何件あるか、それは全体の何割かです。

rule = train_df.groupby(["Pclass"],as_index=False).count().loc[:, ["Pclass","Survived"]].rename(columns={"Survived":"count"}) rule['all'] = train_df.shape[0] rule['Proportion'] = rule['count'] / rule['all'] rule.drop(columns=['all'], axis=1, inplace=True) print(rule)

結果
Pclass count Proportion
0 1 214 0.240720
1 2 184 0.206974
2 3 491 0.552306

投稿2020/05/19 05:18

k-4

総合スコア11

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

pandas.DataFrame.agg() をお使いください

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.agg.html

各列の sumcount を同時に出力したい場合はこうなります。

Python

1print(df.agg(['sum','count']))

ただし上記の方法では、質問でのデータ出力例とは行と列が入れ替わっておりますので、問題あるようでしたら転置してください。

Python

1print(df.agg(['sum','count']).T)

【質問を修正】

質問を完全に勘違いしてたようです。データフレームのカラム毎(PassengerId, Family 毎 )を同時に合計と平均を集計したいと思っておりました。

そうではなく PassengerId 毎に Family の集計をしたいということなのでしょうかね。
その場合は、pandas.DataFrame.groupby().agg() を使います。

https://pandas.pydata.org/pandas-docs/version/0.23.1/generated/pandas.core.groupby.DataFrameGroupBy.agg.html

Python

1con_df.groupby('PassengerId')['Family'].agg(['sum','mean'])

投稿2020/05/10 05:48

編集2020/05/10 09:00
magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

k-4

2020/05/10 07:36

ご回答ありがとうございます。 やってみた処、下記のような結果になりました。 カラムの値ごとに集計したかったので、イメージがちょっと違いますね。うーむ print(con_df['Family'].agg(['sum','count'])) → sum 2466 count 1309 Name: Family, dtype: int64 print(con_df['Family'].agg(['sum','count']).T) → sum 2466 count 1309 Name: Family, dtype: int64
magichan

2020/05/10 08:45

あー申し訳ありません、質問を勘違いしておりました。その場合は Series.groupby().agg() ですね。 回答を修正しますので、少しお待ち下さい。
k-4

2020/05/10 09:58

大変申し訳ありません。 meanと平均の言葉の意味を勘違いしておりました。 私がやりたかったのは、 pandasで、カラム毎の合計値と平均を一緒につくりたいではなく、 pandasで、カラム毎の合計値とその合計値が全体の何%を占めているか、でした まだ、始めたばかりで、知識が身についておらず、申し訳ありません タイトルと記事内容は修正しておきます
magichan

2020/05/10 10:35

うーん良くわからん。 まずは、「カラム毎の合計値」の部分の仕様を明確にしてください。 質問のデータの場合、 1回目の回答のようにカラム毎に「PassengerId」列毎の集計値、「Family」列毎の集計値をそれぞれ求めるtいうことですか?それとも2回めの回答のように「PassengerId」の値ごとの「Family」列の集計値を求めることですか?
k-4

2020/05/10 15:03

すみません。 わからなくなってきたので、少し整理させてください
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問