Pandasでcsvデータ(数値データ)を読み込むと、負の数値が文字列になってしまう

Pandasでカンマ区切りcsvデータを読み込み、数値の列を抽出してクラスタリングをしようとしております。ところが、csvデータの数値の列の中で負の符号(例えば-36180など)が有る箇所が、df.head()で見ますとなぜか(36180)　の様な()付きの文字列になってしまっており、そのためかクラスタリング実行時にエラーになってしまいます。
【エラー】could not convert string to float: '(36180.00)'

どのようにすれば、-36180　の様に数値のままデータフレームにできますでしょうか。ご教示いただけますと幸いです。

なお、読み込み時のコードは以下です（なぜかエンコーディングエラーが多発するファイルのため、ネットを参照して以下の様にして読み込みました。）：

Python3
1import codecs
2import pandas as pd 
3
4pd.set_option('display.max_columns', 1000)
5
6with codecs.open('Agent3.csv', "r", "Shift-JIS", "ignore") as file:
7    df = pd.read_table(file, delimiter=",")
8    display(df.head())

行動規範の内容に同意します

回答1件

ベストアンサー

python
1df = pd.read_table(file, delimiter=",").astype(float)

こうすれば一回文字列として読み込んだとしてもfloat型に変えられますよ

投稿2019/08/22 01:28

退会済みユーザー

総合スコア0

_hh

2019/08/22 01:33

有難うございます。しかし、読み込みの時点で以下の様なエラーが出力されるようになってしまいました。。 could not convert string to float: '(592020.00)'

退会済みユーザー

2019/08/22 02:01

そうしたらエンコードが多発しないようにどうにかして普通に pd.read_csv() をするのが一番だと思います

_hh

2019/08/22 03:20

有難うございます。Excelでファイルを開き、エンコーディングエラーの原因と思しき列を手作業で全て削除し、普通のカンマ区切りcsvにしてpd.read_csvするようにしたところ、問題は解消しました。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.30%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問