ゼロからつくディープラーニング2の2章をやっていて疑問に思ったことがあります。
python
1# 参考材料 2 3text = 'You say goodbye and I say hello.' 4 5↓上のテキストの共起行列 6C = [[0 1 0 0 0 0 0] 7 [1 0 1 0 1 1 0] 8 [0 1 0 1 0 0 0] 9 [0 0 1 0 1 0 0] 10 [0 1 0 1 0 0 0] 11 [0 1 0 0 0 0 1] 12 [0 0 0 0 0 1 0]] 13 14# ppmiの式 15np.log2(C[x,y]*N / (C[x]*C[y])) 16# ※Nは総単語数、Cは共起行列です。
のように、ゼロからつくディープラーニング2の2章に書いてあったのですが、そこでppmiを作るために、総単語数Nを取得するためのコードが
python
1N = np.sum(C)
と書いてあったのですが、これではCの中身の1を全て合計するので14
になってしまいます。しかし、'You say goodbye and I say hello.'の総単語数はピリオドも含めて、8(7?)です。なので、14は総単語数ではないのではないかと思いました。なぜ、N = np.sum(C)で、総単語としているのかを教えていただきたいです。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/06/15 00:41
2021/06/15 02:10 編集
2021/06/15 02:15
2021/06/15 02:20 編集
2021/06/15 02:19
2021/06/15 02:41
2021/06/15 02:43 編集
2021/06/15 02:46
2021/06/15 03:27
2021/06/15 03:36