Xというリストに分かち書きされた単語文書ベクトルが格納されています。
X = [['日本','国際協力機構',・・・]['3','日','東京外国為替市場'、・・]・・・]
特異値分解で次元削減された時の累積寄与率を求めたくてgensimでBag of Words作ってtfidfのコーパスまで作ったら、numpy.linalg.svdで特異値分解しようとしたのですが、エラーが出てしまいました。(importは省略します)
#ここまでにMeCaBで形態素解析して、単語文書ベクトルXを作成しました。 dictionary = gensim.corpora.Dictionary(X)#辞書作成 X_bow = [dictionary.doc2bow(body) for body in tqdm_notebook(X)]#Bag of Words作成 tfidf_model = gensim.models.TfidfModel(X_bow)#tfidfモデルを使う X_tfidf = tfidf_model[X_bow]#tfidfコーパスを作成 X_lsi = list(map(lambda corpus: [second for first, second in corpus], X_lsi)) #タプルが入ってるので消す A = np.array(X_tfidf) U, s, V = np.linalg.svd(A) #↓エラー内容 --------------------------------------------------------------------------- LinAlgError Traceback (most recent call last) <ipython-input-67-7b40e662e8f6> in <module>() ----> 1 U, s, V = np.linalg.svd(A) /home/ryu/.pyenv/versions/anaconda3-4.2.0/lib/python3.5/site-packages/numpy/linalg/linalg.py in svd(a, full_matrices, compute_uv) 1337 a, wrap = _makearray(a) 1338 _assertNoEmpty2d(a) -> 1339 _assertRankAtLeast2(a) 1340 t, result_t = _commonType(a) 1341 /home/ryu/.pyenv/versions/anaconda3-4.2.0/lib/python3.5/site-packages/numpy/linalg/linalg.py in _assertRankAtLeast2(*arrays) 200 if len(a.shape) < 2: 201 raise LinAlgError('%d-dimensional array given. Array must be ' --> 202 'at least two-dimensional' % len(a.shape)) 203 204 def _assertSquareness(*arrays): LinAlgError: 1-dimensional array given. Array must be at least two-dimensional
これが解決できません。
ちなみに特異値分解した後の累積寄与率の求め方ももし分かるなら教えていただければ嬉しいです。
コードはJupiter notebookで書いてます。
累積寄与率を参考にしたいサイト
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。