list index out of range のエラー修正

コード
import numpy as np
import chainer
from chainer import cuda,Function,report,training,utils,Variable
from chainer import datasets,iterators,optimizers,serializers
from chainer import Link,Chain,ChainList
import chainer.links as L
import chainer.functions as F
xp = cuda.cupy

import math
import sys
argvs = sys.argv

vocab = {}

def load_data(filename):
    global vocab
    words = open(filename).read().replace('\n','<eos>').strip().split()
    dataset = xp.ndarray((len(words),),dtype=xp.int32)
    for i, word in enumerate(words):
        if word not in vocab:
            vocab[word] = len(vocab)
        dataset[i] = vocab[word]
    return dataset

class MyRNN(chainer.Chain):
    def __init__(self,v,k):
        super(MyRNN,self).__init__(embed = L.EmbedID(v,k),
                                   H = L.Linear(k,k),
                                   W = L.Linear(k,v),
        )
    def __call__(self,s):
        accum_loss = None
        v,k = self.embed.W.data.shape
        h = Variable(xp.zeros((1,k),dtype=xp.float32))
        for i in range(len(s)):
            next_w_id = eos_id if (i == len(s) - 1) else s[i+1]
            tx = Variable(xp.array([next_w_id],dtype = xp.int32))
            x_k = self.embed(Variable(xp.array([s[i]],dtype=xp.int32)))
            h = F.tanh(x_k + self.H(h))
            loss = F.softmax_cross_entropy(self.W(h),tx)
            accum_loss = loss if accum_loss is None else accum_loss + loss
        return accum_loss

train_data = load_data('ptb.train.txt')    
        
demb = 100
def cal_ps(model,s):
    h = Variable(xp.zeros((1,demb), dtype=xp.float32))
    sum = 0.0
    for i in range(1,len(s)):
        w1, w2 = s[i-1], s[i]
        x_k = model.embed(Variable(xp.array([w1], dtype=xp.int32)))
        h = F.tanh(x_k + model.H(h))
        yv = F.softmax(model.W(h))
        pi = yv.data[0][w2]
        sum -= math.log(pi, 2)
    return sum
    
eos_id = vocab['<eos>']
max_id = len(vocab)
test_data = load_data('ptb.test.txt')
test_data = test_data[0:1000]

model = MyRNN(len(vocab), demb)
cuda.get_device(0).use()
model.to_gpu()
#optimizer = optimizers.Adam()
#optimizer.setup(model)
serializers.load_npz(argvs[1], model)

sum = 0.0
wnum = 0
s = []
unk_word = 0

for pos in range(len(test_data)):
    id = test_data[pos]
    s.append(id)
    if (id > max_id):
        unk_word = 1
    if (id == eos_id):
        if(unk_word != 1):
            ps = cal_ps(model,s)
            sum += ps
            wnum += len(s) - 1
        else:
            unk_word = 0
        s = []
print (math.pow(2, sum / wnum))

chainrでeval-rnnのサンプルコードを動かしてみたのですが、以下のエラーが出てしまいました。
出力として言語モデルの評価値をだそうとしています。
serializers.load_npz(argvs[1], model)
Error: list index out of range
どの部分がおかしいのでしょうか。

行動規範の内容に同意します

回答1件

ベストアンサー

実行の仕方を間違えているのだと思います。
コマンドライン引数を正しく指定してください。

Chainerのリファレンスを見ると、次のように書いてありますね。

chainer.serializers.load_npz(filename, obj, path='', strict=True)
Loads an object from the file in NPZ format.

(中略)

Parameters:
・ filename (str) – Name of the file to be loaded.

ついでに、実験コードを置いときます。

hoge.py

Python
1import sys
2print(sys.argv[1])

>python hoge.py
Traceback (most recent call last):
  File "hoge.py", line 2, in <module>
    print(sys.argv[1])
IndexError: list index out of range

>python hoge.py nishiko
nishiko

投稿2017/10/22 10:47

編集2017/10/22 11:03