質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

91.11%

  • Python

    4529questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • 機械学習

    344questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

機械学習の訓練とテストのそれぞれの役割を教えてください。

受付中

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 69

tomokazu

score 0

O'Reilly Japan出版の - ゼロから作るDeep Learningを今読んでいるのですが、分からない点があるので質問があります。

コードの14行目(x_train, t_train), (x_test, t_test) のそれぞれxとyの訓練とテストの役割がイメージできないので教えてください。

import sys, os
sys.path.append(os.pardir)  # 親ディレクトリのファイルをインポートするための設定
import numpy as np
from dataset.mnist import load_mnist
from PIL import Image


def img_show(img):
    pil_img = Image.fromarray(np.uint8(img))
    pil_img.show()

(x_train, t_train), (x_test, t_test) = load_mnist(flatten=True, normalize=False)

img = x_train[0]
label = t_train[0]
print(label)  # 5

print(img.shape)  # (784,)
img = img.reshape(20, 20)  # 形状を元の画像サイズに変形
print(img.shape)  # (28, 28)

img_show(img)
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

+3

ざっくりと言うと、trainデータはモデルのパラメータ(Wやbなど)を更新するために使うデータです。学習用データ、訓練データなどとも呼ばれます。

testデータ訓練後のモデルの性能を確認するためのデータです。学習後のモデルに未知のデータを入力して、初めて見るサンプルに対してどのくらい正解できるかに注目します。

ちなみに、訓練データに対しては精度が良くても、テストデータでは精度が悪いことがあります。一般的にこの状態は過学習と呼ばれているそうです。一方で、訓練データへの学習が進まない場合もあります。その書籍は読んだことありませんが、おそらく進めて行けば出てくる話題のはずですよ。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/02/14 00:47

    > 出てくる話題のはず
    おっしゃるとおり、書籍では4.1.2 訓練データとテストデータ (86頁) に同様の説明があります。

    キャンセル

  • 2018/02/14 00:57

    ありがとうございます!

    キャンセル

  • 2018/02/14 20:37

    過学習については6.4.1 過学習(P.190~)で説明されていますね。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

ただいまの回答率

91.11%

関連した質問

  • 解決済

    Rにて手書き数字MNISTをnnetで学習させたい

    前提・実現したいこと Rにて手書き数字データMNISTをnnetで学習させたいと考えています。 サイトを参考に実行してみましたが、エラーが出てしまいうまくいきません。 発

  • 受付中

    Pythonでラベリングし、色付けする方法

    前提・実現したいこと pythonで二値画像のラベリングを行い、一番面積の大きいラベル以外を黒く塗りつぶしたいのですが、方法が分からず困っています。 画像の真ん中の白い部分だけ

  • 解決済

    TensorFlowでの訓練データについて(自然言語処理)

    Neural networkで何か作ってみたいと思い、チュートリアルを参考にして、自分で実装しようと思いました。 チュートリアルと同じことをやっても嫌だなと思ったので固有抽出表現

  • 受付中

    Kerasを用いたCNN3によるcifar10の画像認識

    Keras初心者です。 CNNを理解するためにKerasでモデルを作り、cifar10のデータを元にモデルの認識精度を出力しようとしています。 以下のプログラムに対するエラーの

  • 解決済

    Tensorflowのfully_connected_feedの実行にエラーが続く

    tensoflowのfully_connected_feed.pyを実行しようとしているのですが、どう試行錯誤してもエラーが続きます。 tensorflowのインストールの仕方、

  • 解決済

    wxPythonにおいて、USBカメラの画像表示をしたい

    前提・実現したいこと ここ一週間くらい、teratailの皆様の力を借りながら、python上で動く動画や画像を表示できるGUIを作っています。画像は何とか表示でき、画像とパネル

  • 解決済

    pythonの画像の読み込みについて

    pythonの勉強をしています。ある画像を読み込み、それを配列化してテキストデータとしてファイルに保存したいです。 下記のようなコードを描いたのですが、これが正しく出力がされ

  • 解決済

    hyperoptを使ってdeep learning(keras)のhyper parameterをt...

    Hyperoptというpythonのライブラリーがあります。 これは、機械学習において、hyper parameterを自動的に最適化する優れものです。 また、tensolfl

同じタグがついた質問を見る

  • Python

    4529questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • 機械学習

    344questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。