回答率: 85.29%

質問するログイン新規登録

トップ Pythonに関する質問 Pandasのビン分割

編集履歴

回答編集履歴

1

補足を追加

2019/05/09 03:23

投稿

スコア15898

answer CHANGED Viewed

@@ -17,7 +17,7 @@
 > ``pandas.cut()``のデフォルト動作としては右側の値（大きい方の値）を**含む**ようにカテゴリー分けします。右側の値を**含まない** ようにカテゴリー分けしたい場合は ``right=False`` パラメータを設定してください。
-ただ、これらの表記は「このカテゴリーは何なのか」を示す**単なる表記** ですのでそれほど気にする必要はないのかなと個人的には思います。単にカテゴリ分けした結果だけが欲しい場合は``pandas.cut()``のパラメータに ``labels=False`` を渡してください。１つ目のカテゴリーに属する場合は``0``を、１つ目のカテゴリーに属する場合は``1``を返すようになります。
+~~ただ、これらの表記は「このカテゴリーは何なのか」を示す**単なる表記** ですのでそれほど気にする必要はないのかなと個人的には思います。~~ 単にカテゴリ分けした結果だけが欲しい場合は``pandas.cut()``のパラメータに ``labels=False`` を渡してください。１つ目のカテゴリーに属する場合は``0``を、１つ目のカテゴリーに属する場合は``1``を返すようになります。
 またここで、１つ目のカテゴリーの左側の値（小さい方の値）が ``99.987`` となっているのは、IDの最小値``100`` を１つ目のカテゴリーとして扱う為に設定されている（pandas内部で何かしらの計算で自動的に算出された）値ですので、こちらもあまり気にする必用はありません。
@@ -26,4 +26,16 @@
 - 0より大きく108以下の場合 : １つ目のカテゴリー
 - 108より大きく200以下の場合 : ２つ目のカテゴリー
-として分割したい場合は、``pandas.cut(bins=[0,108,200])`` などと書きます。この場合どちらにも属さないIDがあった場合``NaN``を返しますのでご注意ください。
+として分割したい場合は、``pandas.cut(bins=[0,108,200])`` などと書きます。この場合どちらにも属さないIDがあった場合``NaN``を返しますのでご注意ください。
+---
+**【補足】**
+不正確な記述をしていたので補足
+pandas には ``pandas.interval``という区間を表すオブジェクトがあるようです。
+[https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Interval.html](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Interval.html)
+で、``pandas.cut()``はどの intervalオブジェクトに属しているかでカテゴリー分けしているようです
+ですので、``(99.987, 106.5]`` のような記述は **「単なる表記」** ではなく、**「どのintervalオブジェクトに属しているか」**という意味合いになりますね。