defで関数を作成しようとした際のValue Error

前提・実現したいこと

ある通販サイトの購買データを使って
RFM分析をしたいと考えております。

実データの加工を終え、
できた商品合計金額、最後に購入してからの日数、購入回数の
カラムでできたdataframeを作ったため、
そこから各項目の数値を条件に応じてランク分けしたいです。

発生している問題・エラーメッセージ

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-15-e7bf5ddc856d> in <module>
     13         return 5
     14 
---> 15 rfm['金額ランク'] = rfm['合計金額'].apply(money)
     16 rfm.head()

c:\users\lib\site-packages\pandas\core\frame.py in apply(self, func, axis, raw, result_type, args, **kwds)
   7766             kwds=kwds,
   7767         )
-> 7768         return op.get_result()
   7769 
   7770     def applymap(self, func, na_action: Optional[str] = None) -> DataFrame:

c:\users\lib\site-packages\pandas\core\apply.py in get_result(self)
    183             return self.apply_raw()
    184 
--> 185         return self.apply_standard()
    186 
    187     def apply_empty_result(self):

c:\users\lib\site-packages\pandas\core\apply.py in apply_standard(self)
    274 
    275     def apply_standard(self):
--> 276         results, res_index = self.apply_series_generator()
    277 
    278         # wrap results

c:\users\lib\site-packages\pandas\core\apply.py in apply_series_generator(self)
    288             for i, v in enumerate(series_gen):
    289                 # ignore SettingWithCopy here in case the user mutates
--> 290                 results[i] = self.f(v)
    291                 if isinstance(results[i], ABCSeries):
    292                     # If we have a view on v, we need to make a copy because

<ipython-input-15-e7bf5ddc856d> in money(a)
      1 def money(a):
----> 2     if a < 1000:
      3         return 0
      4     if (1000 <= a) & (a < 2000):
      5         return 1

c:\users\lib\site-packages\pandas\core\generic.py in __nonzero__(self)
   1440     @final
   1441     def __nonzero__(self):
-> 1442         raise ValueError(
   1443             f"The truth value of a {type(self).__name__} is ambiguous. "
   1444             "Use a.empty, a.bool(), a.item(), a.any() or a.all()."

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

データの中身

	合計金額	最後に購入してからの日数	購入回数
sum	<lambda>	len
会員ID			
100	2674	169 days	1
101	19760	98 days	3
103	2674	167 days	1
109	7904	56 days	3
11	2674	211 days	1

<class 'pandas.core.frame.DataFrame'>
Index: 290 entries, 100 to 99
Data columns (total 3 columns):
 #   Column            Non-Null Count  Dtype          
---  ------            --------------  -----          
 0   (合計金額, sum)     290 non-null    int64          
 1   (最後に購入してからの日数, <lambda>)  290 non-null    timedelta64[ns]
 2   (購入回数, len)   290 non-null    int64          
dtypes: int64(2), timedelta64[ns](1)
memory usage: 9.1+ KB

該当のソースコード

Python
1def money(a):
2    if a < 1000:
3        return 0
4    if (1000 <= a) & (a < 2000):
5        return 1
6    if (2000 <= a) & (a < 3000):
7        return 2
8    if (3000 <= a) & (a < 4000):
9        return 3
10    if (4000 <= a) & (a < 5000):
11        return 4
12    if a >= 5000:
13        return 5
14    
15rfm['金額ランク'] = rfm['合計金額'].apply(money)

試したこと

こちらのサイトを参考にカッコ等を試してみましたが、
全て同じエラーが返ってきました。。
https://qiita.com/stokes/items/157f7ab737c5ded26832

助言を頂けますと幸いでございます。

何卒宜しくお願い致します。

行動規範の内容に同意します

回答1件

ベストアンサー

rfmというデータフレームをどうやって作ったかは書かれていませんが、カラムがMultiIndexになっているように見えます。

そのため、rfm['合計金額']はSeriesではなくDataFrameになるので、DataFrame.applyが呼ばれることになり、money()には単一の値ではなくSeriesが渡されて、想定外の動作になっています。

やりたいことはこうではないでしょうか。

python
1rfm['金額ランク'] = rfm[('合計金額', 'sum')].apply(money)

もしくは

python
1rfm.columns = rfm.columns.droplevel(1)
2rfm['金額ランク'] = rfm['合計金額'].apply(money)

とかで、MultiIndexを解除して実行しましょう。

上記回答とは直接関係ないですが、money()の中で、

&はandが正しいです。(&はビット演算)
順番にreturnしているので、2番目以降のifの1000 <= aとか2000 <= aは不要。

投稿2021/04/13 05:55

編集2021/04/13 05:57

bsdfan

総合スコア4794

Pablito

2021/04/13 06:05

bsdfanさまご回答ありがとうございます！見事に解決致しました。そもそもMultiIndexだったことが問題だったんですね。。演算子の使い方なども参考になりました。誠にありがとうございます。

bsdfan

2021/04/13 06:38

ややこしいですが、booleanのSeriesやDataFrameの論理演算では&や|を使います。このあたりは使いながら理解してください。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

defで関数を作成しようとした際のValue Error

前提・実現したいこと

発生している問題・エラーメッセージ

該当のソースコード

試したこと

関連した質問