質問編集履歴

3

ご指摘頂きまして、最初の投稿内容に戻しました

2020/03/31 11:34

投稿

iziz
iziz

スコア8

test CHANGED
File without changes
test CHANGED
@@ -1,6 +1,6 @@
1
1
  参考書に記載されている方法でがんの遺伝子発現量のPCAを試しにやっています。
2
2
 
3
- 下記のコード実行結果で
3
+ 下記のコード実行すると
4
4
 
5
5
 
6
6
 
@@ -68,44 +68,14 @@
68
68
 
69
69
 
70
70
 
71
- 主成分 [[ 0.0031 0.0077 -0.0001 ... 0.0009 0.0007 0.0079]
72
-
73
- [ 0.0018 -0.0054 0.0014 ... 0.0023 0.0005 0.0075]
74
-
75
- [-0.0029 -0.0009 0.0076 ... -0.0004 0.0079 -0.0005]
76
-
77
- ...
78
-
79
- [ 0.0034 0.0007 -0.0008 ... 0.003 -0.0045 0.0001]
80
-
81
- [-0.0035 0.0005 -0.0015 ... 0.0007 -0.001 0.0019]
82
-
83
- [-0.0384 0.0004 -0.0158 ... 0.0079 -0.0002 0.0066]]
84
-
85
- 平均 [-8.43311000e-18 3.04584692e-16 9.11922127e-16 ... -5.46995667e-16
86
-
87
- 7.02818867e-17 -4.11093644e-16]
71
+ 下記の様なエラーが出ます
88
-
89
- Traceback (most recent call last):
90
-
91
- File "PCA_gdc.py", line 16, in <module>
92
-
93
- print('共分散',pca.get_covariance())
94
-
95
- File "/home/usr/.local/lib/python3.6/site-packages/sklearn/decomposition/_base.py", line 43, in get_covariance
96
-
97
- cov = np.dot(components_.T * exp_var_diff, components_)
98
-
99
- File "<__array_function__ internals>", line 6, in dot
100
-
101
- MemoryError: Unable to allocate 25.3 GiB for an array with shape (58312, 58312) and data type float64
102
72
 
103
73
 
74
+
75
+ ValueError: Input contains NaN, infinity or a value too large for dtype('float64').
104
76
 
105
77
 
106
78
 
107
79
  ```
108
80
 
109
-
110
-
111
- メモリ不足を意味するエラーかも思いましたが、対処法について教えて頂けますでしょうか
81
+ エラーの内容と対処法について教えて下さい

2

エラーをコード内に表示しました。

2020/03/31 11:34

投稿

iziz
iziz

スコア8

test CHANGED
File without changes
test CHANGED
@@ -1,6 +1,6 @@
1
1
  参考書に記載されている方法でがんの遺伝子発現量のPCAを試しにやっています。
2
2
 
3
- 下記のコード実行すると、
3
+ 下記のコード実行結果で
4
4
 
5
5
 
6
6
 
@@ -66,12 +66,6 @@
66
66
 
67
67
  plt.show()
68
68
 
69
- ```
70
-
71
-
72
-
73
- 下記のエラーが出ます。
74
-
75
69
 
76
70
 
77
71
  主成分 [[ 0.0031 0.0077 -0.0001 ... 0.0009 0.0007 0.0079]
@@ -108,4 +102,10 @@
108
102
 
109
103
 
110
104
 
105
+
106
+
107
+ ```
108
+
109
+
110
+
111
111
  メモリ不足を意味するエラーかもと思いましたが、対処法について教えて頂けますでしょうか。

1

ご指摘頂いた通り、nullを含むサンプルが見つかったので、そのサンプルを除外して再度実行した結果を示しました。

2020/03/30 15:55

投稿

iziz
iziz

スコア8

test CHANGED
File without changes
test CHANGED
@@ -74,8 +74,38 @@
74
74
 
75
75
 
76
76
 
77
+ 主成分 [[ 0.0031 0.0077 -0.0001 ... 0.0009 0.0007 0.0079]
78
+
79
+ [ 0.0018 -0.0054 0.0014 ... 0.0023 0.0005 0.0075]
80
+
81
+ [-0.0029 -0.0009 0.0076 ... -0.0004 0.0079 -0.0005]
82
+
83
+ ...
84
+
85
+ [ 0.0034 0.0007 -0.0008 ... 0.003 -0.0045 0.0001]
86
+
87
+ [-0.0035 0.0005 -0.0015 ... 0.0007 -0.001 0.0019]
88
+
89
+ [-0.0384 0.0004 -0.0158 ... 0.0079 -0.0002 0.0066]]
90
+
91
+ 平均 [-8.43311000e-18 3.04584692e-16 9.11922127e-16 ... -5.46995667e-16
92
+
93
+ 7.02818867e-17 -4.11093644e-16]
94
+
95
+ Traceback (most recent call last):
96
+
97
+ File "PCA_gdc.py", line 16, in <module>
98
+
99
+ print('共分散',pca.get_covariance())
100
+
101
+ File "/home/usr/.local/lib/python3.6/site-packages/sklearn/decomposition/_base.py", line 43, in get_covariance
102
+
103
+ cov = np.dot(components_.T * exp_var_diff, components_)
104
+
105
+ File "<__array_function__ internals>", line 6, in dot
106
+
77
- ValueError: Input contains NaN, infinity or a value too large for dtype('float64').
107
+ MemoryError: Unable to allocate 25.3 GiB for an array with shape (58312, 58312) and data type float64
78
108
 
79
109
 
80
110
 
81
- エラーの内容と対処法教えて頂けないでしょうか。
111
+ メモリ不足を意味するエラーかも思いましたが、対処法について教えて頂けますでしょうか。