ValueError: could not convert string to float: の対処法

前提・実現したいこと

"parts-file03.csv"というファイルを読み込んだときに、以下のようなエラーメッセージが出てしまい、プログラムを実行することができません。
もしわかる方がいれば教えてください。

なお、ファイルの中身は
num1 num2 pass A_a A_b
0 100 1005 2 1
1 101 1051 2 2
2 102 1038 1 3
3 103 1046 2 4

のようになっていて、約１０００＊１０００の行列となっています

発生している問題・エラーメッセージ

エラーメッセージ
ValueError                                Traceback (most recent call last)
<ipython-input-6-78ed4c1e5e32> in <module>()
      2 from sklearn.linear_model import LogisticRegression
      3 
----> 4 ar2d_data = np.loadtxt(fname = "parts-file03.csv", dtype= "float", delimiter = ",")
      5 array_x = ar2d_data[:, 5]
      6 array_y = ar2d_data[:, 6]

3 frames
/usr/local/lib/python3.6/dist-packages/numpy/lib/npyio.py in floatconv(x)
    792         if '0x' in x:
    793             return float.fromhex(x)
--> 794         return float(x)
    795 
    796     typ = dtype.type

ValueError: could not convert string to float:

該当のソースコード

Python
1ソースコード
2import numpy as np
3from sklearn.linear_model import LogisticRegression
4
5ar2d_data = np.loadtxt(fname = "parts-file03.csv", dtype= "float", delimiter = ",")
6array_x = ar2d_data[:, 5]
7array_y = ar2d_data[:, 6]
8list2d_X = []
9
10for x in array_x:
11    list2d_X += [[x, x**2, x**3]]
12
13array2d_X = np.array(list2d_X)
14reg = LogisticRegression()
15reg.fit(array2d_X, array_y)
16
17print('{0:.2f}'.format(reg.coef_[0]))

試したこと

ここに問題に対して試したことを記載してください。

補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。

toast-uz

2020/10/18 05:42

parts-file03.csvの中に文字列が含まれており、dtype= "float" というオプションをつけたままでは、np.loadtxtが実行できない、というエラーです。対策はparts-file03.csvがどうなっているのかに依存します。

toast-uz

2020/10/18 05:49

ということで、parts-file03.csvがどうなっているのか、を質問文に追記ください。可能であれば、中身を数行掲載ください。

SoccerBooks

2020/10/18 05:58 編集

ご回答ありがとうございます。 parts-file03.csvの中身は以下のようになっていて、行と列が同じように続きます。 ABC DEF GHI JKL 0 10 19 2 1 11 18 2 2 12 17 1

行動規範の内容に同意します

回答1件

ベストアンサー

以下のようにしてください。

ヘッダ行はndarrayにとって意味はありませんのでskiprows = 1でスキップします。
デリミタを,としていますが、実際のファイルはタブでしょうか？追記修正に貼っていただいた形と質問に貼っていただいた形（空白の数）が異なるのでタブとみました。よって、delimiter = "\t"としています。
元々書かれていたdtype= "float"はデフォルト値ですので不要です。

Python
1ar2d_data = np.loadtxt(fname = "parts-file03.csv", skiprows=1, delimiter = "\t")

投稿2020/10/18 06:34

toast-uz

総合スコア3266

SoccerBooks

2020/10/18 07:21

いろいろありがとうございました！なんとか修正することができました。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

ValueError: could not convert string to float: の対処法

前提・実現したいこと

発生している問題・エラーメッセージ

該当のソースコード

試したこと

補足情報（FW/ツールのバージョンなど）

関連した質問