auto-mpgがcsvファイルとして読み込めない

jupyter noteでは全く同じコードで上手くいきました。

経緯

Get started with using TensorFlow to solve for regression problems (Coding TensorFlow)
を見てauto-mpgというデータセットを読み込もうとしていたのですが、↓の通り値がNaNになっているので上手く読み込めていません。

Get started with using TensorFlow to solve for regression problems (Coding TensorFlow)
ではすんなり読み込めて
↓のように表示されていました。

pathは
'/root/.keras/datasets/auto-mpg.data'だったのですが、google colabを使用しているので、調べましたがcolabの隠しフォルダを表示する方法が分からずauto-mpg.dataの中身を見ることはできませんでした。また、print(dataset[:5]) print(dataset[157:])してみると

のようになっていたので、何か読み込んだデータ自体がおかしいのかと思ったのですが、先述したようにファイルを閲覧することができないので詰まってしまいました。➀どなたか原因をご教示くださいませんか。

➁また、本筋ではありませんが、

カンマ区切り値（csv）ファイルをDataFrameに読み込みます。(pandas.read_csvのドキュメントより)

とあるので、なぜ.dataファイルがcsvファイルとして読み込るのかも教えていただけないでしょうか。また、2:50~
ではデータセットが397行あることがうかがえるのでデータセットのダウンロードに失敗しているのかもしれません。

リンク内容
URL指定するときはこのURLからauto-mpg.dataの文字を右クリックしてリンクのアドレスをコピー(E)を押してURLを取得しました。

!pip install seaborn
from __future__ import absolute_import, division, print_function

import pathlib

import pandas as pd
import seaborn as sns
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

print(tf.__version__)

dataset_path = keras.utils.get_file('auto-mpg.data', 'https://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data')
dataset_path

column_names = ['MPG', 'Cylinders', 'Displacement', 'Horsepower', 'Weight',
                'Acceleration', 'Model Year', 'Origin']

raw_dataset = pd.read_csv(dataset_path, names=column_names, na_values = '?',
                          comment='\t', sep=" ", skipinitialspace=True)
dataset = raw_dataset.copy()
dataset.tail()

行動規範の内容に同意します

回答1件

ベストアンサー

１．Colaborattoryで下記コードで動作しました。

Python
1from tensorflow import keras
2import pandas as pd
3
4dataset_path = keras.utils.get_file('auto-mpg.data', 'https://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data')
5
6column_names = ['MPG', 'Cylinders', 'Displacement', 'Horsepower', 'Weight',
7                'Acceleration', 'Model Year', 'Origin']
8
9raw_dataset = pd.read_csv(dataset_path, names=column_names, na_values = '?',
10                          comment='\t', sep=" ", skipinitialspace=True)
11dataset = raw_dataset.copy()
12dataset.tail()

２．'/root/.keras/datasets/auto-mpg.data'は```!cat /root/.keras/datasets/auto-mpg.data

投稿2020/03/11 11:44

meg_

総合スコア10580

esklia

2020/03/11 12:17 編集

ご回答くださりありがとうございます。 > １．Colaborattoryで下記コードで動作しました。わたしも同様のコードで試したのですが、keras.utils.get_fileはを使用する時最初に間違ったURLを指定してしまった記憶があります。このことが原因で '/root/.keras/datasets/auto-mpg.dataに誤ったデータが保存されてしまったとは考えられるでしょうか？ > ２．'/root/.keras/datasets/auto-mpg.data'は!cat /root/.keras/datasets/auto-mpg.data で見られます。こちらも試したのですが、データが正常に読み込めていないとエラーが出てコマンドが正常に処理されませんでした。新しくファイル作成してmegさんのコードを転記すると無事にみることができました。