質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Jupyter

Jupyter (旧IPython notebook)は、Notebook形式でドキュメント作成し、プログラムの記述・実行、その実行結果を記録するツールです。メモの作成や保存、共有、確認などもブラウザ上で行うことができます。

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

3回答

5661閲覧

空白部分をfloat,int変換することができない。

megueibe

総合スコア0

Jupyter

Jupyter (旧IPython notebook)は、Notebook形式でドキュメント作成し、プログラムの記述・実行、その実行結果を記録するツールです。メモの作成や保存、共有、確認などもブラウザ上で行うことができます。

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2020/10/10 18:45

前提・実現したいこと

機械学習(データ処理)を試してみています。
学習のため、データを数値化しようといるところでのエラーになります。

発生している問題・エラーメッセージ

replaceで----を''(ブランク)に変換して、データ型をfloatにする際に発生したエラーです。
csvファイルに出力して確認もしましたが、空白にも関わらずこの部分のみ引っ掛かります。
replaceを使用せず、もともとある空白部分にはエラーは発生しません。
いろいろと調べましたが、お手上げです。改善方法があれば、お願いいたします。

ValueError: could not convert string to float: ''

該当のソースコード

import pandas as pd import numpy as np train = pd.read_csv("C:~~",encoding='cp932') train['time'].replace('----','',inplace=True) train['time'] = train['time'].astype(float)

試したこと

replaceで数値(800のような)でテストした場合は、問題なく動作しました。
stripを使って----を消そうともしましたが、なぜか消えないためreplaceを使用しています。

補足情報(FW/ツールのバージョンなど)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

欠損値を----で表わしたCSVファイルを読もうとしているのですよね?

''に置換するのではなく、Numpyで欠損値を示すnp.nanに置換すれば、astypeでもエラーは出なくなります……が。

read_csvには、欠損値として扱う値を追加するオプション引数na_valuesが用意されているので、これに'----'という文字列を設定するのがもっとも簡単です。読み込む際に、'----'を自動的にnp.nanに置換してくれます。不要になったreplaceastypeしている行は削除してください。

Diff

1train = pd.read_csv("C:~~", encoding='cp932', na_values='----')

投稿2020/10/10 22:57

編集2020/10/11 03:11
Daregada

総合スコア11990

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

私の場合はエクセルデータで、空白文字列でしたが、

train['time'].replace('----','',inplace=True) の後に

train["time"].replace("", np.nan, inplace=True)

を書いたら、空白がすべてNaNになって変換できました。

投稿2021/10/13 04:40

Pfele

総合スコア17

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

エラーメッセージはちゃんと読みましょう。

ValueError: could not convert string to float: ''

空白は数値ではないから、could not convert string to float って怒られているだけです。

投稿2020/10/10 18:57

Orlofsky

総合スコア16417

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問