質問を拝見いただき、ありがとうございます。
プログラミングの勉強をしている学生です。
今、作成したデータフレームから箱ひげ図を作ろうとしています。
例えば、下記のようなデータフレームdfがあるとします。
A | B | C |
---|---|---|
1 | 2 | 3 |
5 | 3 | 1 |
… | … | … |
9 | 12 | NaN |
12 | NaN | NaN |
このデータフレームを元に、下記のような箱ひげ図を作成しました。
ここで質問があります。
①上のdfではNaNが含まれており、下のプログラムのように箱ひげ図で表した場合、NaNはどのように処理されているのでしょうか。できればNaNは無視してNaN以外の数値でそれぞれの箱ひげ図を作り、一つの表にまとめたいです。
②下記画像は実際の出力結果なのですが、外れ値が多く存在します。これを取り除く方法はあるのでしょうか。
お手数をおかけしますが、回答宜しくお願い致します。
環境
windows10
python3.7
python
1df.plot.box() 2plt.show()
回答2件
あなたの回答
tips
プレビュー