質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Ubuntu

Ubuntuは、Debian GNU/Linuxを基盤としたフリーのオペレーティングシステムです。

Q&A

解決済

1回答

718閲覧

リストのリストが作成できない

aoisj

総合スコア27

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Ubuntu

Ubuntuは、Debian GNU/Linuxを基盤としたフリーのオペレーティングシステムです。

0グッド

2クリップ

投稿2017/12/22 08:27

#やりたいこと
LDAモデルを使って文書のカテゴリを分類したいです。
学習データカテゴリとLDAモデル作成によって得られた学習データのトピック分布から
[[トピック0が最大トピックだった学習データのファイル番号一覧],
[トピック1が最大トピックだった学習データのファイル番号一覧],
‥‥‥‥]
といったリスト(のリスト)を作成したいのですが、実装してみた以下のコードでは
このように全て同じ値が入ってしまいます。
(中身は多分、どれか1つのトピックのファイル一覧だと思っているのですが・・・)

python

1a = [[4, 34, 35, 5, 9, 13, 25, 36, 37, 41, 71, 22, 26, 30, 33, 39, 42, 44, 48, 52, 54, 60, 62, 0, 23, 29, 31, 32, 50, 64, 66, 68, 2, 3, 11, 38, 45, 69, 8, 15, 21, 24, 40, 46, 47, 49, 70, 16, 28, 51, 56, 63, 10, 12, 14, 18, 19, 20, 43, 59, 65, 1, 55, 57, 61, 6, 7, 17, 27, 53, 58, 67], 2 [4, 34, 35, 5, 9, 13, 25, 36, 37, 41, 71, 22, 26, 30, 33, 39, 42, 44, 48, 52, 54, 60, 62, 0, 23, 29, 31, 32, 50, 64, 66, 68, 2, 3, 11, 38, 45, 69, 8, 15, 21, 24, 40, 46, 47, 49, 70, 16, 28, 51, 56, 63, 10, 12, 14, 18, 19, 20, 43, 59, 65, 1, 55, 57, 61, 6, 7, 17, 27, 53, 58, 67], 3 [4, 34, 35, 5, 9, 13, 25, 36, 37, 41, 71, 22, 26, 30, 33, 39, 42, 44, 48, 52, 54, 60, 62, 0, 23, 29, 31, 32, 50, 64, 66, 68, 2, 3, 11, 38, 45, 69, 8, 15, 21, 24, 40, 46, 47, 49, 70, 16, 28, 51, 56, 63, 10, 12, 14, 18, 19, 20, 43, 59, 65, 1, 55, 57, 61, 6, 7, 17, 27, 53, 58, 67], 4 [4, 34, 35, 5, 9, 13, 25, 36, 37, 41, 71, 22, 26, 30, 33, 39, 42, 44, 48, 52, 54, 60, 62, 0, 23, 29, 31, 32, 50, 64, 66, 68, 2, 3, 11, 38, 45, 69, 8, 15, 21, 24, 40, 46, 47, 49, 70, 16, 28, 51, 56, 63, 10, 12, 14, 18, 19, 20, 43, 59, 65, 1, 55, 57, 61, 6, 7, 17, 27, 53, 58, 67], 5 [4, 34, 35, 5, 9, 13, 25, 36, 37, 41, 71, 22, 26, 30, 33, 39, 42, 44, 48, 52, 54, 60, 62, 0, 23, 29, 31, 32, 50, 64, 66, 68, 2, 3, 11, 38, 45, 69, 8, 15, 21, 24, 40, 46, 47, 49, 70, 16, 28, 51, 56, 63, 10, 12, 14, 18, 19, 20, 43, 59, 65, 1, 55, 57, 61, 6, 7, 17, 27, 53, 58, 67], 6 [4, 34, 35, 5, 9, 13, 25, 36, 37, 41, 71, 22, 26, 30, 33, 39, 42, 44, 48, 52, 54, 60, 62, 0, 23, 29, 31, 32, 50, 64, 66, 68, 2, 3, 11, 38, 45, 69, 8, 15, 21, 24, 40, 46, 47, 49, 70, 16, 28, 51, 56, 63, 10, 12, 14, 18, 19, 20, 43, 59, 65, 1, 55, 57, 61, 6, 7, 17, 27, 53, 58, 67], 7 [4, 34, 35, 5, 9, 13, 25, 36, 37, 41, 71, 22, 26, 30, 33, 39, 42, 44, 48, 52, 54, 60, 62, 0, 23, 29, 31, 32, 50, 64, 66, 68, 2, 3, 11, 38, 45, 69, 8, 15, 21, 24, 40, 46, 47, 49, 70, 16, 28, 51, 56, 63, 10, 12, 14, 18, 19, 20, 43, 59, 65, 1, 55, 57, 61, 6, 7, 17, 27, 53, 58, 67], 8 [4, 34, 35, 5, 9, 13, 25, 36, 37, 41, 71, 22, 26, 30, 33, 39, 42, 44, 48, 52, 54, 60, 62, 0, 23, 29, 31, 32, 50, 64, 66, 68, 2, 3, 11, 38, 45, 69, 8, 15, 21, 24, 40, 46, 47, 49, 70, 16, 28, 51, 56, 63, 10, 12, 14, 18, 19, 20, 43, 59, 65, 1, 55, 57, 61, 6, 7, 17, 27, 53, 58, 67], 9 [4, 34, 35, 5, 9, 13, 25, 36, 37, 41, 71, 22, 26, 30, 33, 39, 42, 44, 48, 52, 54, 60, 62, 0, 23, 29, 31, 32, 50, 64, 66, 68, 2, 3, 11, 38, 45, 69, 8, 15, 21, 24, 40, 46, 47, 49, 70, 16, 28, 51, 56, 63, 10, 12, 14, 18, 19, 20, 43, 59, 65, 1, 55, 57, 61, 6, 7, 17, 27, 53, 58, 67], 10 [4, 34, 35, 5, 9, 13, 25, 36, 37, 41, 71, 22, 26, 30, 33, 39, 42, 44, 48, 52, 54, 60, 62, 0, 23, 29, 31, 32, 50, 64, 66, 68, 2, 3, 11, 38, 45, 69, 8, 15, 21, 24, 40, 46, 47, 49, 70, 16, 28, 51, 56, 63, 10, 12, 14, 18, 19, 20, 43, 59, 65, 1, 55, 57, 61, 6, 7, 17, 27, 53, 58, 67]]

python

1#トピック数(分類したいカテゴリ数) 2topic_num = 10 3 4#学習データのカテゴリ(i番目にi番目のファイルのカテゴリ番号) 5category_list = [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9] 6 7#j番目の学習データのトピック分布(1つ目の要素:トピック番号,2つ目の要素:そのトピックが含まれる比率) 8lda[corpus[j]] = [(9, 0.64129082562831607), (2, 0.27027350524020177), (0, 0.036521793080593931), (4, 0.031606224758011427), (8, 0.010817096260453391)] 9 10def vote_topic(topic_num,category_list,lda): 11 a = [] 12 b = [] 13 for i in range(topic_num): 14 for j in range(len(category_list)): 15 ret = lda[corpus[j]] 16 item = max(ret,key=lambda d:d[1])[0] 17 if i == item: 18 b.append(j) 19 a.append(b) 20 return a

こうなってしまう原因と解決策を教えていただきたいです。
恐らく説明不足で伝えきれていないところもあると思うので修正依頼をしていただけると助かります。
###補足情報
今回の質問内でのカテゴリとトピックの違いについてです。
カテゴリ:学習データの入手先のサイトで分類されていたもの(SF,歴史,恋愛など)
トピック:LDAモデル作成時に自動的に分類されたもの

また、category_list[]とlda[corpus[]]の要素番号は対応していて、
例えばi = 0のとき、
category_list[0]は0番目の学習データのカテゴリ番号
lda[corpus[0]]は0番目の学習データのトピック分布
をそれぞれ表しています。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

bを使いまわしているからかと。未確認ですが、以下なら動くかと思います。

Python

1def vote_topic(topic_num,category_list,lda): 2 a = [] 3 for i in range(topic_num): 4 b = [] 5 for j in range(len(category_list)): 6 ret = lda[corpus[j]] 7 item = max(ret,key=lambda d:d[1])[0] 8 if i == item: 9 b.append(j) 10 a.append(b) 11 return a

端的に言うと、次の挙動が原因です。

Python

1>>> a = [] 2>>> b = [] 3>>> 4>>> b.append(1) 5>>> a.append(b) 6>>> 7>>> b.append(2) 8>>> a.append(b) 9>>> 10>>> print(a) 11[[1, 2], [1, 2]]

Pythonで非常によく見る失敗例です。Qiita - Python のリストの扱いで注意すること

投稿2017/12/22 08:40

編集2017/12/22 08:45
LouiS0616

総合スコア35660

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

aoisj

2017/12/22 09:10

回答ありがとうございます。 解決できました
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問