🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

420閲覧

[python3] 既存のdataframeに対し、複数の配列(seriesでもよい)をまとめてセットする方法

siruku6

総合スコア1382

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2019/10/06 10:08

編集2019/10/07 12:12

以下のようなことがしたいと考えています。

python

1import pandas as pd 2sample_df = pd.DataFrame({'hoge': [1, 2, 3]}) 3 4# これならできる 5# sample_df['added1'] = [2, 3, 4] 6 7# しかしこれはできない(これがしたい) 8sample_df[['added1', 'added2']] = [2, 3, 4], [3, 4, 5] 9# => error

代替策1

※要件を満たさない

python

1import pandas as pd 2sample_df = pd.DataFrame({'hoge': [1, 2, 3]}) 3 4add_df = pd.DataFrame({'added1': [2, 3, 4], 'added2': [3, 4, 5]}) 5sample_df = pd.concat([sample_df, add_df], axis=1) 6# しかし求めているのはこれではない

なぜ代替策1ではだダメなのかというと、この方法ではDataFrameが新しく作られており、既存のDataFrameに列が追加されるわけではないからです。
やりたいのは、既存のDataFrameに複数の列をまとめて追加することです。

そこで、次のようなソースを書かざるを得ないのが現状です。

代替策2

※一応要件は満たす

python

1import pandas as pd 2sample_df = pd.DataFrame({'hoge': [1, 2, 3]}) 3 4sample_df['added1'] = [2, 3, 4] 5sample_df['added2'] = [3, 4, 5]

代替策2をスマートに行う方法があれば教えていただきたいのですが、そんな方法がないのであれば、ないということを教えていただけるだけでも構いません。
ドキュメントを調べようとしたものの、concatメソッドしか見つけることができませんでした。。。

何卒、宜しくお願いします。

追記 回答を受けて試したこと

python

1import pandas as pd 2sample_df = pd.DataFrame({'hoge': [1, 2, 3]}) 3 4pd.assign(added1=[1, 2, 3], added2=[3, 4, 5]) 5sample_df 6=> hoge の列しか存在しない 7 8# こうすればsample_dfは書き換わるが、それはconcatでも可能 9# sample_df = pd.assign(added1=[1, 2, 3], added2=[3, 4, 5])

本当にやりたいこと

python

1import pandas as pd 2 3def add_column(dataframe): 4 # ここで複数の配列やseriesをdataframeに列追加する 5 # 現状の代替策 6 # sample_df['added1'] = [2, 3, 4] 7 # sample_df['added2'] = [3, 4, 5] 8 9sample_df = pd.DataFrame({'hoge': [1, 2, 3]}) 10add_column(samlple_df) 11 12sample_df 13=> hoge以外の複数の列(added1など)が追加されたsample_dfを取得

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2019/10/06 10:34

DataFrameが新しく作られるのが何故駄目なのですか?(メモリ不足の問題ですか?)
siruku6

2019/10/06 10:45 編集

戻り値のないメソッドの中でDataFrameを更新したいためです。 単なるわがままでしかないので、我慢して戻り値を戻させれば済む話なのですが。。
guest

回答1

0

ベストアンサー

DataFrame.assign()は?

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.assign.html

Python

1import pandas as pd 2sample_df = pd.DataFrame({'hoge': [1, 2, 3]}) 3sample_df = sample_df.assign(added1=[2, 3, 4],added2=[3, 4, 5]) 4# hoge added1 added2 5#0 1 2 3 6#1 2 3 4 7#2 3 4 5

投稿2019/10/06 23:25

magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

siruku6

2019/10/07 09:45

ありがとうございます! 確認してみます
siruku6

2019/10/07 12:05

回答ありがとうございました! 残念ながら、assignもconcatと一緒で、元の変数に変更を加えずに、新しくdataframeを生成するメソッドでした...。 時間を見つけてmergeやjoinなんかも少し調べてみます。 パラメータにinplaceがあるメソッドなら期待が持てる気がかなりするのですが...
magichan

2019/10/09 02:33 編集

やっと行いたい内容を理解しました。 であれば、そのようなAPIは存在しません。(残念ながら) DataFrameの追加・結合系のAPIは全部で5種類あり、 append, assign, join, merge, update となりますが、append, assign, join, merge の4つは新たなDataFrameを返すAPIで自己破壊(自己更新)を行う inplace パラメータは使えません。 のこりの1つの update は自己破壊的なAPIですが、このAPIは値を更新するだけで新たに列を追加する機能はありませんので今回は使えないことになります。 他にも General Functionとして、pandas.concat, pandas.merge などもありますが、これらも全て(当然ですが) DataFrameを返すAPIとなりますので今回の要望には合致しないものとなります。
siruku6

2019/10/10 20:05

ありがとうございます。 ないということがわかるだけでも非常に助かります。 これからも各種メソッドを学んで、何ができるかできないかをすぐに判断できるようにしていきたいと思います!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問