質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

2回答

6531閲覧

pandasのデータフレームの特定の列の値の更新

papi_tokei

総合スコア106

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2017/07/18 17:12

###前提・実現したいこと
pandasでデータフレームを作成したのち、特定の列の値を指定した条件で修正したいです。
例えば、以下のようなソースコードを実行します。

python

1>>>matrix = np.random.randn(6,4) 2>>>df2 = pd.DataFrame(matrix, columns=list('ABCD')) 3>>>df2 4 A B C D 50 -0.626133 -0.184019 0.362304 0.253855 61 -0.527758 -1.040019 -0.709188 -0.424033 72 0.663809 1.546478 -0.883667 -0.254074 83 0.901323 -0.743994 -2.418544 0.018828 94 -0.095488 0.593971 -0.769612 -0.895023 105 0.219455 -1.219031 -1.748459 1.993419

上記のソースでCの列の内容全てを、負の値なら-1に正の値なら1になるように修正したいです。

※上記のソースコードは以下のサイトを引用させて頂きました。

Pythonでデータサイエンス Pandasでデータフレームを作ってみよう
http://pythondatascience.plavox.info/pandas/pandas%E3%81%A7%E3%83%87%E3%83%BC%E3%82%BF%E3%83%95%E3%83%AC%E3%83%BC%E3%83%A0%E3%82%92%E4%BD%9C%E3%81%A3%E3%81%A6%E3%81%BF%E3%82%88%E3%81%86

###試したこと
for eachで一行ずつ取り出して値を修正できるのか試しましたが、
for eachではstring型で取り出されるため、更新ができませんでした。

どのようにすれば、特定の列の値を指定した条件で更新することが出来るのでしょうか?
ご教授頂ければ幸いです。
よろしくお願いします。
###補足情報(言語/FW/ツール等のバージョンなど)
Python3

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

numpy.where() を使うのが簡単かと思います。

Python

1df2['C'] = np.where(df2['C']>=0, 1, -1)

投稿2017/07/18 23:12

magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

papi_tokei

2017/07/19 05:25

回答いただきありがとうございます. whereという関数が存在したのですね. また,三項演算子のような使い方が出来ることも,勉強になりました.
guest

0

ベストアンサー

Python

1import pandas as pd 2df = pd.read_csv("test2.csv") 3df 4 5 A B C D 60 -0.626133 -0.184019 0.362304 0.253855 71 -0.527758 -1.040019 -0.709188 -0.424033 82 0.663809 1.546478 -0.883667 -0.254074 93 0.901323 -0.743994 -2.418544 0.018828 104 -0.095488 0.593971 -0.769612 -0.895023 115 0.219455 -1.219031 -1.748459 1.993419 12 13df["C"].loc[df["C"] >= 0] = 1 14df["C"].loc[df["C"] < 0] = -1 15df 16 17 A B C D 180 -0.626133 -0.184019 1.0 0.253855 191 -0.527758 -1.040019 -1.0 -0.424033 202 0.663809 1.546478 -1.0 -0.254074 213 0.901323 -0.743994 -1.0 0.018828 224 -0.095488 0.593971 -1.0 -0.895023 235 0.219455 -1.219031 -1.0 1.993419

投稿2017/07/18 22:32

編集2017/07/18 22:34
MasashiKimura

総合スコア1150

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

papi_tokei

2017/07/19 05:29

回答いただきありがとうございます. 入れ子のような構造ですが,この方法でも修正可能だと勉強になりました. 少し複雑なので,がんばって理解します.
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問