jupyter noteでは全く同じコードで上手くいきました。
経緯
Get started with using TensorFlow to solve for regression problems (Coding TensorFlow)
を見てauto-mpgというデータセットを読み込もうとしていたのですが、↓の通り値がNaNになっているので上手く読み込めていません。
Get started with using TensorFlow to solve for regression problems (Coding TensorFlow)
ではすんなり読み込めて
↓のように表示されていました。
pathは
'/root/.keras/datasets/auto-mpg.data'
だったのですが、google colabを使用しているので、調べましたがcolabの隠しフォルダを表示する方法が分からずauto-mpg.data
の中身を見ることはできませんでした。また、print(dataset[:5])
print(dataset[157:])
してみると
のようになっていたので、何か読み込んだデータ自体がおかしいのかと思ったのですが、先述したようにファイルを閲覧することができないので詰まってしまいました。➀どなたか原因をご教示くださいませんか。
➁また、本筋ではありませんが、
カンマ区切り値(csv)ファイルをDataFrameに読み込みます。(pandas.read_csvのドキュメントより)
とあるので、なぜ.dataファイルがcsvファイルとして読み込るのかも教えていただけないでしょうか。また、2:50~
ではデータセットが397行あることがうかがえるのでデータセットのダウンロードに失敗しているのかもしれません。
- リンク内容
- URL指定するときはこのURLからauto-mpg.dataの文字を右クリックしてリンクのアドレスをコピー(E)を押してURLを取得しました。
!pip install seaborn from __future__ import absolute_import, division, print_function import pathlib import pandas as pd import seaborn as sns import tensorflow as tf from tensorflow import keras from tensorflow.keras import layers print(tf.__version__)
dataset_path = keras.utils.get_file('auto-mpg.data', 'https://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data') dataset_path column_names = ['MPG', 'Cylinders', 'Displacement', 'Horsepower', 'Weight', 'Acceleration', 'Model Year', 'Origin'] raw_dataset = pd.read_csv(dataset_path, names=column_names, na_values = '?', comment='\t', sep=" ", skipinitialspace=True) dataset = raw_dataset.copy() dataset.tail()
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/03/11 12:17 編集
2020/03/11 12:22
2020/03/11 13:23