質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.84%

  • Python 3.x

    4441questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • pandas

    374questions

    Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

pandas 複数の列からの条件付コピー

解決済

回答 2

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 81

horiegom

score 2

python 3.5
pandas 0.22.0において

A US JP
0 14 22
newyork 14 22
newyork 15 22
tokyo 15 23
london 15 23

という元のDataFrameがある場合に、
Aの列の値に応じて、C1列,C2列の値を参照して新たなX列を作りたい

つまり
AがnewyorkであればUS列の値をX列に
AがtokyoであればJP列の値をX列に
したいです。

A US JP X
0 14 22
newyork 14 22 14
newyork 15 22 15
tokyo 15 23 23
london 15 23

同様の質問は以下にもありますが、やや異なります。
https://teratail.com/questions/62152

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

checkベストアンサー

0

求めたい値を返す関数を定義し、.apply(関数, axis=1)で行毎に処理すればよいです。

import pandas as pd
df = pd.DataFrame({'A':['','newyork','newyork','tokyo','london'],'US':[14,14,15,15,15],'JP':[22,22,22,23,23]})
print(df)

def getX( df):
    if df['A'] == 'newyork':
        return df['US']
    elif df['A'] == 'tokyo':
        return df['JP']
    # 該当なしはNone(NaN)でいいかな

df['X'] = df.apply( getX, axis=1)
print(df)

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/06/01 18:09

    なるほど! ありがとうございます。求めていた動作が実現できそうです。
    月曜日に確認してBAにさせていただきます。

    キャンセル

0

一応書いて見ましたが、これでよいのでしょうか?

import pandas as pd
import io

data = """A,C1,C2
0,14,22
1,14,22
1,15,22
2,15,23
3,15,23
"""

df = pd.read_csv(io.StringIO(data))
df['X'] = df.apply(lambda r: r.get('C{}'.format(r.A)), axis=1)
print(df)
#   A  C1  C2     X
#0  0  14  22   NaN
#1  1  14  22  14.0
#2  1  15  22  15.0
#3  2  15  23  23.0
#4  3  15  23   NaN

【修正分】

import pandas as pd
import io

data = """A,US,JP
0,14,22
newyork,14,22
newyork,15,22
tokyo,15,23
london,15,23
"""

df = pd.read_csv(io.StringIO(data))
conv = {'newyork': 'US', 'tokyo': 'JP', 'London':'UK'}
df['X'] = df.apply(lambda r: r.get(conv.get(r.A)), axis=1)
print(df)
#         A  US  JP     X
#0        0  14  22   NaN
#1  newyork  14  22  14.0
#2  newyork  15  22  15.0
#3    tokyo  15  23  23.0
#4   london  15  23   NaN

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/06/01 17:17

    ご回答ありがとうございます。
    途中で内容を変えて申し訳ないのですが、簡略化して表記していましたが
    実際には1・2がそのままC1列、C2列に対応するものではないので変更させていただきました。

    この場合、
    r: r.get('C{}'.format(r.A)), axis=1
    をどのように記述すればよろしいでしょうか。

    キャンセル

  • 2018/06/01 17:17

    ん?質問変わってる?

    キャンセル

  • 2018/06/01 17:22

    修正を書きますので、ちょっとお待ちを

    キャンセル

  • 2018/06/01 17:35

    書きました。
    変換用のDictを準備するとよいかと思います。

    キャンセル

  • 2018/06/05 09:34

    ご回答ありがとうございました。 無事動作いたしました

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.84%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • Python 3.x

    4441questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • pandas

    374questions

    Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。