質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

データベース設計

データベース設計はデータベースの論理的や物理的な部分を特定する工程です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

2回答

267閲覧

Pandasでのデータの前処理で行に特定の文字が入っていれば、列を追加してOをつけたい

oobutamaru

総合スコア32

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

データベース設計

データベース設計はデータベースの論理的や物理的な部分を特定する工程です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2022/05/20 05:26

前提

ここに質問の内容を詳しく書いてください。
pandasでのデータ処理をしています。
以下の表があります。
イメージ説明

実現したいこと

ここに実現したいことを箇条書きで書いてください。
上の表のA~G列まで、ランダムな文字とNANが入っています。
その表からSACとGOLDを探し、あれば、それぞれに対応する列を追加してそこにOをつけたいです。

applyを使うとは思うのですが、どうにもうまくいきません。
ご教示お願いいたします。

該当のソースコード

Python

1df['SAC'] = df.apply(lambda x : 'O' if df.iloc[x].str.contains('SAC') else 'X') 2

こうだと思いましたが、うまくいきませんでした。
ご教示頂けると幸いです。

試したこと

ここに問題に対して試したことを記載してください。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

以下のように行毎(axis=1)にapplyすればよいです。

Python

1import pandas as pd 2from io import StringIO 3 4s = """A,B,C 5SAC,,SAC 6,, 7GOLD,a,b 8GOLD,SAC,a""" 9df = pd.read_csv(StringIO(s)) 10print(df) 11""" 12 A B C 130 SAC NaN SAC 141 NaN NaN NaN 152 GOLD a b 163 GOLD SAC a 17""" 18 19for s in ['SAC', 'GOLD']: 20 df[s] = df.apply(lambda row:'O' if row.str.contains(s).any() else 'X', axis=1) 21print(df) 22""" 23 A B C SAC GOLD 240 SAC NaN SAC O X 251 NaN NaN NaN X X 262 GOLD a b X O 273 GOLD SAC a O O 28"""

投稿2022/05/20 05:57

can110

総合スコア38266

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

oobutamaru

2022/05/20 06:08

出来ました。 ありがとうございます。 非常に助かりました。
guest

0

ベストアンサー

python

1import pandas as pd 2import numpy as np 3 4df = pd.DataFrame({ 5 'A': [ 'SAC', '4NC', '4VH', 'GOLD', 'SAC'], 6 'B': [ 'EE9', '16E', 'SAC', '99U', 'LDS'], 7 'C': ['GOLD', '7T8', 'GN7', 'XAX', 'QCG'], 8 'D': ['GOLD', np.nan, 'CDF', 'JI8', 'MRT'], 9 'E': [np.nan, 'P1E', np.nan, np.nan, np.nan], 10 'F': [np.nan, np.nan, 'C8B', np.nan, np.nan], 11 'G': [np.nan, 'RCJ', 'DTW', np.nan, np.nan], 12}) 13 14# 15df['SAC'] = df.apply(lambda x: 'O' if x.str.contains('SAC').any() else 'X', axis=1) 16df['GOLD'] = df.apply(lambda x: 'O' if x.str.contains('GOLD').any() else 'X', axis=1) 17print(df.to_markdown(index=False))
ABCDEFGSACGOLD
SACEE9GOLDGOLDnannannanOO
4NC16E7T8nanP1EnanRCJXX
4VHSACGN7CDFnanC8BDTWOX
GOLD99UXAXJI8nannannanXO
SACLDSQCGMRTnannannanOX

投稿2022/05/20 05:55

melian

総合スコア19798

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

oobutamaru

2022/05/20 06:07

回答ありがとうございます。 出来ました。 いつも助かります。 df.applyのlambda関数のxというのは、行のことなのでしょうか? 宜しければご教示お願いいたします。
melian

2022/05/20 06:11

はい、axis=1 の場合は行に、axis=0(デフォルト)の場合は列になります。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問