質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.47%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

置換

置換とは文字列中の特定の文字に対して、別の文字列に置き換えることを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

457閲覧

2つのpandasデータフレームを使った置換をしたい場合

退会済みユーザー

退会済みユーザー

総合スコア0

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

置換

置換とは文字列中の特定の文字に対して、別の文字列に置き換えることを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/01/20 06:47

編集2021/01/20 08:27

前提・実現したいこと

pandasで、以下のdf1とdf2があります。
df2にデータが存在する場合、df1のフラグを1に変更したいです。
(日付、時間、IDを条件にしたいです。)

df1
||日付|時間|ID|名前|金額|フラグ|
|:--|:--:|--:|
|1|20210101|00:00|0001|hanako|1000|0|
|2|20210102|00:00|0002|taro|1000|0|
|3|20210102|13:00|0002|taro|500|1|
|4|20210103|01:00|0003|mami|300|1|
|5|20210104|10:00|0004|aki|5000|0|
|6|20210105|00:30|0005|huyu|7000|0|

df2
||日付|時間|ID|名前|
|:--|:--:|--:|
|1|20210102|00:00|0002|taro
|2|20210105|00:30|0005|huyu

実現したいこと
||日付|時間|ID|名前|金額|フラグ|
|:--|:--:|--:|
|1|20210101|00:00|0001|hanako|1000|0|
|2|20210102|00:00|0002|taro|1000|1|
|3|20210102|13:00|0002|taro|500|1|
|4|20210103|01:00|0003|mami|300|1|
|5|20210104|10:00|0004|aki|5000|0|
|6|20210105|00:30|0005|huyu|7000|1|

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

2つのデータフレームの日付・時間・IDをインデックスに指定してから、df1.loc[df2.index, 'フラグ'] = 1すればいいのでは。

Python

1import pandas as pd 2import io 3 4txt1 = """ 5日付,時間,ID,名前,金額,フラグ 620210101,00:00,0001,hanako,1000,0 720210102,00:00,0002,taro,1000,0 820210102,13:00,0002,taro,500,1 920210103,01:00,0003,mami,300,1 1020210104,10:00,0004,aki,5000,0 1120210105,00:30,0005,huyu,7000,0 12""" 13txt2 = """ 14日付,時間,ID,名前 1520210102,00:00,0002,taro 1620210105,00:30,0005,huyu 17""" 18 19# 日本語ヘッダーのずれを防ぐ 20pd.set_option('display.unicode.east_asian_width', True) 21 22df1 = pd.read_csv(io.StringIO(txt1), dtype={'ID': str}) 23df2 = pd.read_csv(io.StringIO(txt2), dtype={'ID': str}) 24 25df1.set_index(['日付', '時間', 'ID'], inplace=True) 26df2.set_index(['日付', '時間', 'ID'], inplace=True) 27 28df1.loc[df2.index, 'フラグ'] = 1 29 30df1.reset_index(inplace=True) 31df2.reset_index(inplace=True) 32 33print(df1) 34

result

1 日付 時間 ID 名前 金額 フラグ 20 20210101 00:00 0001 hanako 1000 0 31 20210102 00:00 0002 taro 1000 1 42 20210102 13:00 0002 taro 500 1 53 20210103 01:00 0003 mami 300 1 64 20210104 10:00 0004 aki 5000 0 75 20210105 00:30 0005 huyu 7000 1

投稿2021/01/20 17:14

編集2021/01/21 00:32
Daregada

総合スコア11990

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2021/01/21 01:32

ありがとうございます。 思っていた挙動になりまし。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問