質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

2回答

6506閲覧

Pythonの2つのDataFrameの和をとる方法について

jimmypage0311

総合スコア22

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

2クリップ

投稿2017/01/31 05:03

編集2017/01/31 07:42

PythonでのDataFrameの操作についてです。

python

1df1 = pd.DataFrame({'name':['A', 'B'], 'age':[20, 30], 'sex':['f', 'm']}, columns=['name', 'age', 'sex'], index=[0, 1]) 2df2 = pd.DataFrame({'name':['C', 'A', 'B'], 'age':[10, 10, 30], 'sex':['m', 'f', 'm']}, columns=['name', 'age', 'sex'], index=[0, 1, 2])

という2つのDataFrameがあるとき, age列の数値を足し, name列に存在しなかった名前ついては追加するという操作を行い, 以下のDataFrameを作成するにはどのようにしたら良いでしょうか。

python

1df3 = pd.DataFrame({'name':['A', 'B', 'C'], 'age':[30, 60, 10], 'sex':['f', 'm', 'm']}, columns=['name', 'age', 'sex'], index=[0, 1, 2]) 2

よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

色々なやり方があるとは思いますが、df1とdf2をくっつけてからage列を足してみました。

python

1df3 = df1.combine_first(df2) 2age = (df1['age'] + df2['age']).dropna() 3df3.loc[age.index, 'age'] = age

投稿2017/01/31 06:15

driller

総合スコア720

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jimmypage0311

2017/01/31 07:42

質問文を変更いたしましたので、よろしければよろしくお願いいたします。
guest

0

自己解決

自分でコードを書き解決いたしました。
ライブラリで, 以下の計算ができる場合は教えていただけると助かります。

python

1df1 = pd.DataFrame({'name':['C', 'A', 'B'], 'age':[10, 10, 30], 'sex':['m', 'f', 'm']}, columns=['name', 'age', 'sex'], index=[0, 1, 2]) 2 3df2 = pd.DataFrame({'name':['A', 'B'], 'age':[20, 30], 'sex':['f', 'm']}, columns=['name', 'age', 'sex'], index=[0, 1]) 4 5def sum_age(df1, df2): 6 7 # df2の方が小さい場合 8 if len(df1['name']) > len(df2['name']): 9 # df1, df2に含まれていたものは合計する 10 # 短い方のDataFrameに合わせて, 値を合計する 11 for i in range(len(df1['name'])): 12 13 if df1['name'][i] in list(df2['name']): 14 df2['age'][list(df2['name']).index(df1['name'][i])] = df2['age'][list(df2['name']).index(df1['name'][i])] + df1['age'][i] 15 16 else: 17 df_temp = df1[df1.name == df1['name'][i]] 18 df2 = pd.concat([df2, df_temp], axis=0, ignore_index=True) 19 20 df = df2 21 else: 22 for i in range(len(df2['name'])): 23 # df1, df2に含まれていたものは合計する 24 # 短い方のDataFrameに合わせて, 値を合計する 25 if df2['name'][i] in list(df1['name']): 26 # print(list(df1['name']).index(df2['name'][i])) 27 # print(df1['age'][list(df1['name']).index(df2['name'][i])] + df2['age'][i]) 28 # list(df1['name']).index(df2['name'][i]) : ここでdf1とdf2に存在しているindexをlistから抜き出してきている 29 df1['age'][list(df1['name']).index(df2['name'][i])] = df1['age'][list(df1['name']).index(df2['name'][i])] + df2['age'][i] 30 31 # df1に含まれていないものは, df2の行をdf1にconcatする 32 else: 33 34 #print(df2[df2.name == 'C']) 35 df_temp = df2[df2.name == df2['name'][i]] 36 df1 = pd.concat([df1, df_temp], axis=0, ignore_index=True) 37 38 df = df1 39 40 return df

投稿2017/02/01 05:56

編集2017/02/02 01:08
jimmypage0311

総合スコア22

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問