質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.84%

  • Python

    6388questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • Python 3.x

    4872questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

python:k 近傍法の実装の正解率の結果を元に混同行列を作成

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 316

ponn

score 13

前提・実現したいこと

・mnistデータでk 近傍法の実装の正解率の結果を元に混同行列を作成したいのですがどうすればいいのか。

・今の状態だとK=1の時でしか混合行列がわからないのでKが1以外の時を指定して表示させるにはどうすればいいですか

該当のソースコード

from collections import Counter
from matplotlib import pyplot as plt
from sklearn import datasets, model_selection, metrics
from sklearn.metrics import accuracy_score, confusion_matrix
from sklearn.neighbors import KNeighborsClassifier
import sklearn.datasets as datasets
import numpy as np
import pandas as pd
import time
state = np.random.RandomState(1)

mnist = datasets.fetch_mldata('MNIST original', data_home='data/src/download/')

def main():

    # 特徴データとラベルデータを取り出す
    features = mnist.data
    targets = mnist.target

    #データを分割
    train_dataX, test_dataX, train_dataY, test_dataY = model_selection.train_test_split(features,targets,test_size=0.3)

    # 検証する近傍数
    K = 1
    ks = range(1, K + 1)

    for k in ks:
        predicted_labels = []

        # モデルを学習 
        model = KNeighborsClassifier(n_neighbors=1, metric='euclidean')
        model.fit(train_dataX,train_dataY)

        # 一つだけ取り除いたテストデータを識別
        predicted_label = model.predict(test_dataX)
        predicted_labels.append(predicted_label)

    # 正解率を計算
    score = accuracy_score(test_dataY, predicted_label)
    print("正解率:{}".format(score))

    # 混合行列を表示
    cm = confusion_matrix(test_dataY, predicted_label)
    print(cm)

if __name__ == '__main__':
    main()

補足情報(言語/FW/ツール等のバージョンなど)

Anaconda

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

+1

とりあえず、全ての結果が表示されるよう、修正してみました

from collections import Counter
from matplotlib import pyplot as plt
from sklearn import datasets, model_selection, metrics
from sklearn.metrics import accuracy_score, confusion_matrix
from sklearn.neighbors import KNeighborsClassifier
import sklearn.datasets as datasets
import numpy as np
import pandas as pd
import time
state = np.random.RandomState(1)

mnist = datasets.fetch_mldata('MNIST original', data_home='./data')

def main():

    # 特徴データとラベルデータを取り出す
    features = mnist.data
    targets = mnist.target

    #データを分割
    train_dataX, test_dataX, train_dataY, test_dataY = model_selection.train_test_split(features,targets,test_size=0.3)

    # 検証する近傍数
    K = 5
    ks = range(1, K + 1)

    predicted_labels = np.empty((0, test_dataY.shape[0]), np.int8)
    for k in ks:
        # モデルを学習
        model = KNeighborsClassifier(n_neighbors=k, metric='euclidean')
        model.fit(train_dataX,train_dataY)

        # 一つだけ取り除いたテストデータを識別
        predicted_label = model.predict(test_dataX)
        predicted_labels = np.vstack([predicted_labels, predicted_label])

    # 正解率を計算
    for i, k in enumerate(ks):
        print("K = {}".format(k))
        score = accuracy_score(test_dataY, predicted_labels[i])
        print("正解率:{}".format(score))

        # 混合行列を表示
        cm = confusion_matrix(test_dataY, predicted_labels[i])
        print(cm)

if __name__ == '__main__':
    main()

変更項目としては大きく

  • predicted_labelsをリストから配列に変更して、全て結果をこの配列に格納するように修正
  • 最後にloopを回して、各パラメータ毎の正解率・混合行列を表示するように修正

の2つです。
こんな感じでよろしいのでしょうか?

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/12/12 15:41

    出来ました!ありがとうございました。

    キャンセル

  • 2017/12/12 16:48

    ちなみに処理時間はどれくらいかかりましたか?

    キャンセル

  • 2017/12/12 17:13

    申し訳ありませんが、とりあえずの動作の確認は
    model_selection.train_test_split(features,targets,test_size=0.0002)
    test_size、極端に小さくして実験しておりましたので、実際の動作時間はわかりません。

    キャンセル

  • 2017/12/12 20:32

    この混同行列 model_selection.train_test_split(features,targets,test_size=0.3)で実行してみたところ
    1つあたり約20分かかりました。
    この混同行列は 縦=正解、横=予測という考え方でよろしいですか?

    キャンセル

  • 2017/12/12 20:58

    混合行列の縦軸・横軸はそれで間違いないかと思います。

    キャンセル

  • 2017/12/12 21:07

    ありがとうございます。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.84%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

  • 解決済

    Rにて手書き数字MNISTをnnetで学習させたい

    前提・実現したいこと Rにて手書き数字データMNISTをnnetで学習させたいと考えています。 サイトを参考に実行してみましたが、エラーが出てしまいうまくいきません。 発

  • 受付中

    Kerasを用いたCNN3によるcifar10の画像認識

    Keras初心者です。 CNNを理解するためにKerasでモデルを作り、cifar10のデータを元にモデルの認識精度を出力しようとしています。 以下のプログラムに対するエラーの

  • 解決済

    Tensorflowのfully_connected_feedの実行にエラーが続く

    tensoflowのfully_connected_feed.pyを実行しようとしているのですが、どう試行錯誤してもエラーが続きます。 tensorflowのインストールの仕方、

  • 解決済

    hyperoptを使ってdeep learning(keras)のhyper parameterをt...

    Hyperoptというpythonのライブラリーがあります。 これは、機械学習において、hyper parameterを自動的に最適化する優れものです。 また、tensolfl

  • 解決済

    Pyhon : k 近傍の混同行列

    前提・実現したいこと k 近傍法の実装の正解率の結果を元に混同行列を作成したいのですがどうすればいいのか。(kの大きさごとに混合行列を作成したいため) 該当のソースコード fr

  • 解決済

    python:mnistデータとDigitsデータ

    現したいこと digitsデータでk近傍法 ~マンハッタン距離~を行って使う近傍数ごとの正解率を折れ線グラフを作成したところ以下のようなジグザグな図形になりました。 mnistデー

  • 解決済

    python:mnistデータで各数字の割合を知るには

    前提・実現したいこと pythonで使うこの mnist = datasets.fetch_mldata('MNIST original', data_home='data/src

  • 解決済

    chainerサンプルコードtrain_mnist.pyのエラー

    前提・実現したいこと githubから以下の公式chainerファイルをクローンし サンプルコードtest_mnist.py を実行したらエラーが返ってきました どなたか解決方法を

同じタグがついた質問を見る

  • Python

    6388questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • Python 3.x

    4872questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。