質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.49%
pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

2767閲覧

Pandasでcsvデータ(数値データ)を読み込むと、負の数値が文字列になってしまう

_hh

総合スコア79

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2019/08/22 01:20

編集2019/08/22 01:22

Pandasでカンマ区切りcsvデータを読み込み、数値の列を抽出してクラスタリングをしようとしております。ところが、csvデータの数値の列の中で負の符号(例えば-36180など)が有る箇所が、df.head()で見ますとなぜか(36180) の様な()付きの文字列になってしまっており、そのためかクラスタリング実行時にエラーになってしまいます。
【エラー】could not convert string to float: '(36180.00)'

どのようにすれば、-36180 の様に数値のままデータフレームにできますでしょうか。ご教示いただけますと幸いです。

なお、読み込み時のコードは以下です(なぜかエンコーディングエラーが多発するファイルのため、ネットを参照して以下の様にして読み込みました。):

Python3

1import codecs 2import pandas as pd 3 4pd.set_option('display.max_columns', 1000) 5 6with codecs.open('Agent3.csv', "r", "Shift-JIS", "ignore") as file: 7 df = pd.read_table(file, delimiter=",") 8 display(df.head())

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

python

1df = pd.read_table(file, delimiter=",").astype(float)

こうすれば一回文字列として読み込んだとしてもfloat型に変えられますよ

投稿2019/08/22 01:28

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

_hh

2019/08/22 01:33

有難うございます。しかし、読み込みの時点で以下の様なエラーが出力されるようになってしまいました。。 could not convert string to float: '(592020.00)'
退会済みユーザー

退会済みユーザー

2019/08/22 02:01

そうしたらエンコードが多発しないようにどうにかして 普通に pd.read_csv() をするのが一番だと思います
_hh

2019/08/22 03:20

有難うございます。Excelでファイルを開き、エンコーディングエラーの原因と思しき列を手作業で全て削除し、普通のカンマ区切りcsvにしてpd.read_csvするようにしたところ、問題は解消しました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.49%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問