__getitem__のidが0しか取れない

回答率: 85.48%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.48%

トップ Pythonに関する質問

Q&A

解決済

1回答

1353閲覧

getitemのidが0しか取れない

総合スコア170

0グッド

0クリップ

投稿2018/11/17 08:32

編集2018/11/18 02:20

0

0

__getitem__のidが0しか取れないです。

data_li =[]
label_li = []
class Dataset():
    def __init__(self, csv_file_path, root_dir, small=False):
        self.df = pd.read_csv(root_dir + csv_file_path)

    def __len__(self):
        return len(self.df)

    def __getitem__(self, id):
　　　　　#idが０しか取れない
        seq = self.df["Rank"][id]
        label = self.df.values[id][1]
        data_li.append(seq.tolist())
        label_li.append(label)
        return data_li, label_li

とコードを書いたのですが、__getitem__のidが0しか取れません。
self.dfのdfは１００００ぐらいあるので、１００００まで取れるように作りたいのですが、それができません。どう修正すればいいでしょうか？
csvは

　　　　　Rank  Index
0        20     1
1        10     1
2        30     1
3        15     1
4        20     0
5        35     0
6        20     0
7        40     0
8        10     0
9        20     0
10       15     0

・
・
・

のようになっています。

2018/11/17 09:42

0しか取れない、とはどのような状況でしょうか。また、csvはどんなデータですか？

2018/11/17 10:01

def __getitem__(self, id): で取得するidが０のみということです。

2018/11/17 10:03

csvの情報を追加しました。

2018/11/17 10:10

そのまま検証できるように、csvは生のテキストデータの先頭10行くらいを直接貼ってください（データ内容はダミーにしても構いません）

2018/11/17 10:18 編集

まだ状況がよくわからないので、実際の動作例（indexingした際の入出力など）をいくつか示していただけると回答しやすいと思います。

2018/11/18 02:18

情報を追加しました。

2018/11/18 02:21 編集

seq = self.df["Rank"][id] でcsvの先頭の20しか取れません。

2018/11/18 02:21

もしご存知ならよろしくお願いします

2018/11/18 02:21

その取っているコードを実際に記載してください

2018/11/18 02:37

取っているコードはDatasetクラスですが・・・。違いますか？

2018/11/18 02:56 編集

Datasetクラスをインスタンス化してindexingでアクセスして、というコードがあると思いますが・・・その部分でたとえば<Datasetのインスタンス>[0]とするとどうなって<Datasetのインスタンス>[1]とするとどうなるのか、どういう部分で期待と違う動作になっているのか・・・（0でも1でも2でも100でも何を入れても先頭のが返ってきちゃうとかかもしれないし、あるいは1以上では例外を吐いて落ちるのかもしれない）・・・ということすら現状では私には伝わっていません。なので、全体像と問題点がはっきりわかるように書いてもらえないと回答できません、というコメントをしています。

2018/11/18 02:58

<Datasetのインスタンス>[数字]と手打ちで指定すると、存在するインデックスの数字ならそのデータが取得できます。問題は、__getitem__のidがなぜか0しか取れないことです。

2018/11/18 03:00

手打ちで指定と書いたところは、seq = self.df["Rank"][100]　のように書いて試しました。

2018/11/18 03:10

回答欄に私から聞きたいことを書いたので、御覧ください

行動規範の内容に同意します

回答1件

0

ベストアンサー

まずは、以下のコードを実行してどんなものが出力されるか教えてください。

python
1data_li =[]
2label_li = []
3class Dataset():
4    def __init__(self, csv_file_path, root_dir, small=False):
5        self.df = pd.read_csv(root_dir + csv_file_path)
6
7    def __len__(self):
8        return len(self.df)
9
10    def __getitem__(self, id):
11　　　　　#idが０しか取れない
12        seq = self.df["Rank"][id]
13        label = self.df.values[id][1]
14        data_li.append(seq.tolist())
15        label_li.append(label)
16        return data_li, label_li
17
18dataset = Dataset(然るべきパス, 然るべきパス)  #  パスをそれぞれ正しく設定
19
20print("dataset[0]")
21print(dataset[0])
22
23print("dataset[1]")
24print(dataset[1])
25
26print("dataset[2]")
27print(dataset[2])
28

投稿2018/11/18 03:10

編集2018/11/18 03:12

総合スコア30933

2018/11/18 04:47

ありがとうございます。

2018/11/18 04:48

print(dataset[0])　ではindexが0と１のもののデータがいっぺんにとれ、print(dataset[1])ではindexが0と１と２のもののデータがいっぺんにとれ、print(dataset[2])ではindexが0と１と２と３のもののデータがいっぺんに取れます。

2018/11/18 04:53 編集

出力される結果は以下と同じですか？ dataset[0] ([20], [1]) dataset[1] ([20, 10], [1, 1]) dataset[2] ([20, 10, 30], [1, 1, 1])

2018/11/18 06:21

はい、そうです

2018/11/18 06:24

期待している結果はどのようなものですか？　逆に、どういった点で期待通り動作していないのですか？

2018/11/18 06:27

dataset = Dataset(然るべきパス, 然るべきパス) 　のdatasetで全部のデータが取れる（([20, 10, 30・・・40], [1, 1, 1・・・0])のように全部のデータを取りたいです。

2018/11/18 06:31

一発でself.df.values.tolist()の結果がほしいということですか？

2018/11/18 06:35

はい、そうです。一発で、([Rankの全データのリスト],[Indexの全データのリスト])という全データが欲しいです。

2018/11/18 06:39

それなら__getitem__も不要です（そういう使い方をするメソッドではありません）。というか、私が書くならラッパークラスすら作らないと思います。でもまあ、いろいろな操作をするのでラッパークラスを作りたいというのなら、__init__で self.all_data = self.df.values.tolist() とか書いておけば、後は dataset = Dataset(...) dataset.all_data でアクセスできるんじゃないですかね。一番安直な設計はそれです。

2018/11/18 06:51

ありがとうございます！できました！！ちなみに、__getitem__はどういうケースに使うべきなのでしょうか？

2018/11/18 06:55 編集

l = [20,18,11,18] があったとして print(l[0]) とするときとか、 d = {"a":"hoge", "b":"fuga"} があったとして print(d["a"]) するときとかのl[0]やd["a"]の[]の操作で内部的に呼ばれるのが__getitem__だと思ってください。l[0]はl.__getitem__(0)と等しく、d["a"]はd.__getitem__("a")と等しいという仕組みです。このように、添え字表記が使われた際の挙動を実装したいときに__getitem__を使います。今回は全く必要ないケースでした（私はそれに気づくのが遅れました・・・）。

2018/11/18 07:05

わかりました！本当にありがとうございました！！

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ Pythonに関する質問

__getitem__のidが0しか取れない

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【サポート業務のお知らせ】ゴールデンウィーク休業につき下記の日程で、お問い合わせ等のサポート業務をお休みいたします。 2024/04/27(土)~2024/04/29(月) 2024/05/03(金)〜2024/05/06(月) なお期間中もサポートへのお問い合わせは受け付けております。

【重要なお知らせ】いつもteratailをご利用いただきありがとうございます。現在、認証システムの修正により、一部のユーザーが強制的にログアウトされる可能性がございます。お手数おかけしますが、再度ログインを行なっていただきますよう宜しくお願いいたします。ご不便をおかけし申し訳ございません。

過去のお知らせを見る