Pandasでカンマ区切りcsvデータを読み込み、数値の列を抽出してクラスタリングをしようとしております。ところが、csvデータの数値の列の中で負の符号(例えば-36180など)が有る箇所が、df.head()で見ますとなぜか(36180) の様な()付きの文字列になってしまっており、そのためかクラスタリング実行時にエラーになってしまいます。
【エラー】could not convert string to float: '(36180.00)'
どのようにすれば、-36180 の様に数値のままデータフレームにできますでしょうか。ご教示いただけますと幸いです。
なお、読み込み時のコードは以下です(なぜかエンコーディングエラーが多発するファイルのため、ネットを参照して以下の様にして読み込みました。):
Python3
1import codecs 2import pandas as pd 3 4pd.set_option('display.max_columns', 1000) 5 6with codecs.open('Agent3.csv', "r", "Shift-JIS", "ignore") as file: 7 df = pd.read_table(file, delimiter=",") 8 display(df.head())

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/08/22 01:33
退会済みユーザー
2019/08/22 02:01
2019/08/22 03:20