困っていること
dataframe全体がobjectになっていて、各カラムには”見た目”として「文字列+NaN」、「数字+NaN」が存在しています。
このdataframeに対して、カラムが「文字列+NaN」の場合には、NaNを削除して「文字列」だけのリストを生成し、カラムが「数字+NaN」であればNaNを削除して「数字」だけをfloat型でnumpy arrayにしたいと考えています。
ただ、そもそも、各カラムが「文字列+NaN」なのか、それとも「数字+NaN」なのか、区別する方法が思いつきません。
dtype()でやるのかと思うのですが、dataframe全体に適用するとエラーが出ますし、、、解決できずに困っています。
どなたかご教示願えないでしょうか?お手数ですがよろしくお願いします。
Dataframeの中身
A列 B列 C列 D列 0 T26-2 0.1 NaN 10 1 T13126-3 0.1 NaN 5 2 T93126 0.1 NaN NaN 3 T1126-5 15 JUNC 10 4 T1326 0.1 MUI 15 5 NaN 0.1 NaN 10 6 T3126 0.8 NaN NaN 7 T17726 0.1 X 10.4 8 T1326 0.1 NaN 5.3 9 T1312 0.001 W 5.2 10 T112987 0.1 NaN NaN 11 X1126 0.1 NaN 7 12 NaN NaN JRF 8 13 TH1075-1 0.1 NaN 5 14 T14075-2 0.1 NaN 1.6 15 T1075-3 0.1 KIL 5.1 16 Z0075 0.02 NaN 11.7 17 T14075-5 0.1 MWR 13 18 NaN 0.1 NaN NaN 19 T14075-5 0.8 NaN 13 20 T14075-6 0.1 NaN 0.8
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。