質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
関数型プログラミング

関数型プログラミングとは、関数を用いて演算子を構築し、算出し、コンピュータプログラムを構成する枠組みです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

1645閲覧

一度cut関数で区分けをしたカラムに対して別条件で追加で区分けを行いたい。

hachiroku

総合スコア21

関数型プログラミング

関数型プログラミングとは、関数を用いて演算子を構築し、算出し、コンピュータプログラムを構成する枠組みです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2020/07/31 11:01

編集2020/07/31 18:44

一度指定条件で区分けを行ったカラムに対して追加で区分けを行いたい

ABC
105001000
406002000
8030003000
9035002500
9535005000

python

1labels=[A, B, C, D, E] 2df['D'] = pd.cut(df[df['C'] >= 3000]['A'], [0,20, 40, 60, 80, 100], labels=labels ,right=False) 3
ABCD
105001000NaN
406002000NaN
8030003000E
9035002500NaN
9535005000E
```python
labels=[A, B, C, D]
df.loc[(df['C'] >= 2000) & (df['C'] < 3000),'D'] = pd.cut(df[(df['C'] >= 2000) & (df['C'] < 3000)]['D'], [0, 25,50,75, 100], labels=labels ,right=False)
|A|B|C|D| |:--|:--:|:--:|--:| |10|500|1000|NaN| |40|600|2000|B| |80|3000|3000|E| |90|3500|2500|NaN| |95|3500|5000|E| としたい 発生しているエラー ```python ValueError: Cannot set a Categorical with another, without identical categories

区分けの条件を変えて追加で?区分けする方法はありますでしょうか?
また別の手段があれば教えていただきたいです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

一回目の処理でD列全てに区分けしているので、二回目がはじかれているようです。
NaN列としてDを作って、一回目も必要なところだけ区分けしてみました。

python3

1# テスト用テーブルデータ作成 2import pandas as pd 3import numpy as np 4import io 5table = """ 6A B C 710 500 1000 840 600 2000 980 3000 3000 1090 3500 2500 1195 3500 5000 12""" 13df = pd.read_table(io.StringIO(table), delimiter="\t") 14 15# ここから処理 16labels=["A", "B", "C", "D", "E"] 17df['D'] = np.nan 18df.loc[df['C'] >= 3000,'D'] = pd.cut(df[df['C'] >= 3000]['A'], [0,20, 40, 60, 80, 100], labels=labels ,right=False) 19labels=["A", "B", "C", "D"] 20df.loc[(df['C'] >= 2000) & (df['C'] < 3000),'D'] = pd.cut(df[(df['C'] >= 2000) & (df['C'] < 3000)]['A'], [0, 25,50,75, 100], labels=labels ,right=False) 21print(df) 22""" 23 A B C D 240 10 500 1000 NaN 251 40 600 2000 B 262 80 3000 3000 E 273 90 3500 2500 D 284 95 3500 5000 E 29"""

投稿2020/08/01 05:22

jeanbiego

総合スコア3966

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hachiroku

2020/08/01 08:48

解決できました。ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問