質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.50%

  • Python 3.x

    9816questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • pandas

    894questions

    Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

pandasで指定の行のみ値を計算する方法

受付中

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 76

essa

score 30

お世話になります。質問させていただきます。

pandasをつかって、指定の行のみ計算したいです。

やりたいことは
こちらに書いてある「loc, ilocでブールインデックス参照」
もしくは
こちらに書いてあるstr.contains()
を組合せるのかなとおもっております。

やりたいことは

AAA AAC BBB
0 1 5
-5 -7 -2
0.5 7 0.1

というデータがあったとき、AA*のカラム名(AAAとAAC)の値のみ調べ、
値が0以下だった場合は-100とし、値が0以上だったら100とするような
ことをしたいです。

そこで、

df.loc[df.columns.str.contains('AA') < 0, df.columns.str.contains('AA') )] = -100


としてみましたが、何も変化はありませんでした。

どなたか教えていただけますとありがたいです。

どうぞよろしくお願い致します。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

0

自己解決できました。

1.pandasでcsvファイルを読み込む
2.カラム名のみ抽出
3.カラム名の中でほしい文字列のもののみ抽出してリストにする
4.リストにしたものをloc, ilocでブールインデックス参照を使って処理する。

上記のやり方で解決しました。

下記コードです。

import pandas as pd

df = pd.read_csv('hogehoge.csv',encoding='shift-jis',engine='python')

cols_list = list(df.columns)
focus_list = [s for s in cols_list if 'hogehoge(※抽出したカラム名に含まれている文字列)' in s]

for i in focus_list:
    df.loc[df[i] > 0, i] = 100
    df.loc[~(df[i] > 0) , i]=-100

df.to_csv('result.csv')

もっといい方法があれば教えていただけると嬉しいです。
どうぞよろしくお願いします。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

ループを使う方法

for col in df.columns[df.columns.str.match('AA.')]:
    df[col] = df[col].apply(lambda d:100 if d>0 else -100)
print(df)

dataframe.update()を使う方法

tmp = df.applymap(lambda d:100 if d>0 else -100)
df.loc[:, df.columns.str.match('AA.')] = np.nan
df.update(tmp, overwrite=False)
print(df)

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

同じタグがついた質問を見る

  • Python 3.x

    9816questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • pandas

    894questions

    Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。