以下のデータに関してpandas-profilingを利用してデータ解析を行おうとしています。
![
python
1df.profile_report()
こちらは問題なく動作しました。
しかし、以下のように試しに外れ値を除外してprofile_report()を実行するとブロードキャストエラーになりました。
python
1df = df[df['BMI'] > 1.0] 2df.profile_report() 3 4----- 5Summarize dataset: 71% 617/24 [00:00<00:00, 56.08it/s, Get scatter matrix] 7--------------------------------------------------------------------------- 8ValueError Traceback (most recent call last) 9~/opt/anaconda3/lib/python3.7/site-packages/IPython/core/formatters.py in __call__(self, obj) 10 343 method = get_real_method(obj, self.print_method) 11 344 if method is not None: 12--> 345 return method() 13 346 return None 14 347 else: 15 16... 17 18~/opt/anaconda3/lib/python3.7/site-packages/matplotlib/axes/_axes.py in hexbin(self, x, y, C, gridsize, bins, xscale, yscale, extent, cmap, norm, vmin, vmax, alpha, linewidths, edgecolors, reduce_C_function, mincnt, marginals, **kwargs) 19 4716 n = nx1 * ny1 + nx2 * ny2 20 4717 21-> 4718 d1 = (x - ix1) ** 2 + 3.0 * (y - iy1) ** 2 22 4719 d2 = (x - ix2 - 0.5) ** 2 + 3.0 * (y - iy2 - 0.5) ** 2 23 4720 bdist = (d1 < d2) 24 25ValueError: operands could not be broadcast together with shapes (2966,2) (2966,)
pandas-profilingの内部的な処理でエラーだと思うのでエラーの解析にも戸惑っています。
知見がある方よろしくお願いいたします。
バージョン
$ pip show pandas-profiling Name: pandas-profiling Version: 2.11.0 Summary: Generate profile report for pandas DataFrame Home-page: https://github.com/pandas-profiling/pandas-profiling Author: Simon Brugman Author-email: pandasprofiling@gmail.com License: MIT Location: /Users/xxx/opt/anaconda3/lib/python3.7/site-packages Requires: seaborn, tangled-up-in-unicode, visions, jinja2, pandas, htmlmin, scipy, ipywidgets, joblib, phik, missingno, requests, confuse, numpy, tqdm, attrs, matplotlib Required-by:
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。