質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.98%

  • Python 3.x

    4129questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • 機械学習

    486questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Pythonによる機械学習入門 6.2.2

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 206

X-TALON

score 1

前提・実現したいこと

ここに質問したいことを詳細に書いてください
Pythonによる機械学習入門を読み進めています。
P119 6.2.2学習の実施で
trial_handsign_SVM.py を実行したところ
以下のエラーメッセージが発生しました。

発生している問題・エラーメッセージ

Traceback (most recent call last):
File "handsign/trial_handsign_SVM.py", line 50, in <module>
train_path = argvs[1]
IndexError: list index out of range

P121の最終にある以下のものが関係あるのでしょうか。

本スクリプトの引数は以下の通りです。
python trial_handsign_SVM.py <dir_learn><>dir_test>
dir_learn    学習用画像のディレクトリ
dir_test     テスト用画像のディレクトリ

teratailを使用するのも初めてです。
どうぞよろしくお願いいたします。

該当のソースコード

ここから(サンプルコードにハッシュタグが入ってるのはそのまま。プレビューで見づらくなりますね。)

# -*- coding: utf-8 -*-
import os
import sys
import glob
import numpy as np
from skimage import io
from sklearn import datasets

IMAGE_SIZE = 40
COLOR_BYTE = 3
CATEGORY_NUM = 6

## ラベル名(0~)を付けたディレクトリに分類されたイメージファイルを読み込む
## 入力パスはラベル名の上位のディレクトリ
def load_handimage(path):

    # ファイル一覧を取得
    files = glob.glob(os.path.join(handsign/data/mylearn_8, '*/*.png'))

    # イメージとラベル領域を確保
    images = np.ndarray((len(files), IMAGE_SIZE, IMAGE_SIZE,
                            COLOR_BYTE), dtype = np.uint8)
    labels = np.ndarray(len(files), dtype=np.int)

    # イメージとラベルを読み込み
    for idx, file in enumerate(files):
       # イメージ読み込み
       image = io.imread(file)
       images[idx] = image

       # ディレクトリ名よりラベルを取得
       label = os.path.split(os.path.dirname(file))[-1]
       labels[idx] = int(label)

    # scikit-learn の他のデータセットの形式に合わせる
    flat_data = images.reshape((-1, IMAGE_SIZE * IMAGE_SIZE * COLOR_BYTE))
    images = flat_data.view()
    return datasets.base.Bunch(data=flat_data,
                 target=labels.astype(np.int),
                 target_names=np.arange(CATEGORY_NUM),
                 images=images,
                 DESCR=None)

#####################################
from sklearn import svm, metrics

## 学習データのディレクトリ、テストデータのディレクトリを指定する
if __name__ == '__main__':
    argvs  = sys.argv
    train_path = argvs[1]
    test_path = argvs[2]

    # 学習データの読み込み
    train = load_handimage(train_path)

    # 手法:線形SVM
    classifier = svm.LinearSVC()

    # 学習
    classifier.fit(train.data, train.target)

    # テストデータの読み込み
    test = load_handimage(test_path)

    # テスト
    predicted = classifier.predict(test.data)

    # 結果表示
    print("Accuracy:\n%s" % metrics.accuracy_score(test.target, predicted))


ここまでがソースです。

試したこと

現状、書き写しと実行でするまでの知識しかありません。
一旦、別の初心者ほんに行って帰ってきたところです。

補足情報(言語/FW/ツール等のバージョンなど)

より詳細な情報ハッシュタグ

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • karamarimo

    2017/10/15 16:38

    ソースコードは```で囲ってください。

    キャンセル

  • X-TALON

    2017/10/16 10:10

    karamarimo様 ご指摘ありがとうございます。基本的な質問方法を理解せず申し訳ありません。

    キャンセル

回答 1

checkベストアンサー

+3

Traceback (most recent call last):
File "handsign/trial_handsign_SVM.py", line 50, in <module>
train_path = argvs[1]
IndexError: list index out of range

エラーの言わんとするところは、train_path = argvs[1]をしたときに、リストインデックス(この場合1)がリスト外の数値だった、ということです。

Pythonでは、他の言語と同じように、リストのインデックスは0,1,2...とゼロから数え始めます。つまり、この場合、インデックス1の要素がないということは、2つ目の要素が空っぽだったよ、という意味ですね。

ここでソースを見ると、

if name == 'main':
    argvs  = sys.argv
    train_path = argvs[1]
    test_path = argvs[2]

train_path = argvs[1]の中身はargvsの[1]つまり、argvsの2つ目の要素、ということです。もう一つ戻ると、argvs  = sys.argvとあるので、sys.argvの2つ目の要素がないということですね。

sys.argvが何かというと、pythonの引数を拾う関数です。


もうわかりましたね。
python trial_handsign_SVM.py <dir_learn><dir_test>の引数がちゃんと指定されていないというのが最も有力です。
コマンドプロンプトで、python trial_handsign_SVM.py c:\learn\ c:\test\とかこんな感じで引数を指定しないと、引数が足りないよエラーが起きてしまいます。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/10/16 23:12

    slash様
    返信が遅くなり、申し訳ございません。
    丁寧な解説をいただき、ありがとうございました。
    後から別の本も当たって見ましたが、「引数を忘れないように」ぐらいは書いてあるのですが、
    じゃあどうすればいいの?と思うこともしばしば。
    特に最後の2行のお心遣い、初心者には大変ありがたく、久々に腑に落ちる説明に出会えました。

    キャンセル

  • 2017/10/16 23:25

    教えていただいたことで、一つ前に進んだ気がします。
    まだもう一つエラーとなり、足踏みをしています。
    ```
    python trial_handsign_SVM.py ./data/my_learn8/ ./data/my_test2/
    Traceback (most recent call last):
    File "trial_handsign_SVM.py", line 54, in <module>
    train = load_handimage(handsign/data/my_learn8)
    NameError: name 'handsign' is not defined
    ```
    こちらも調べて見たところ、名前の定義がされていないや
    クラスでself忘れの場合が多いとあったのですが、じゃあ、何だろうと
    止まってしましました。
    ご無理でなければ、ご教示いただけると助かります。

    キャンセル

  • 2017/10/17 01:32

    恐らくコメント欄では質問も回答も長くなると思いますので、pythonタグをつけてもう一つ質問を起こされるのが良いと思います。

    キャンセル

  • 2017/10/17 01:47

    横から失礼します。
    train = load_handimage('handsign/data/my_learn8')
    文字列指定していないので、割り算だと勘違いされているのでは。
    ここを修正してまたエラーが出るようなら、slashさんのおっしゃるように別質問を立てるのがよいかと思います。

    キャンセル

  • 2017/10/17 16:30

    slash様、LouiS0616様 コメントありがとうございます。
    せっかく、コメントをいただいたのに、ここでは評価として御礼ができないことも後から気がつきました。
    申し訳ありません。
    あらためて仕切りなおしをさせていただきます。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.98%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • Python 3.x

    4129questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • 機械学習

    486questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。