質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

データマイニング

データマイニングは、購買履歴やクレジットカードの利用履歴、電話の通話履歴など企業にある大量のデータを解析して、その中に隠れたパターンやルールを探し出す技術です。DMと略されることもあります。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

1回答

1239閲覧

SVDによる次元削減後の変数名の出力

fukubaka

総合スコア11

Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

データマイニング

データマイニングは、購買履歴やクレジットカードの利用履歴、電話の通話履歴など企業にある大量のデータを解析して、その中に隠れたパターンやルールを探し出す技術です。DMと略されることもあります。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

0クリップ

投稿2021/02/21 08:23

実行したいこと

TF-IDFでテキストに含まれる単語の重要度を算出した後、SVDを用いて次元削減を行いました。
しかし、データフレームに出力しようとすると、どの単語が次元削減後に残っているのか1行目に変数名として出力できません。なので、どの単語が次元削減後に残っているのか変数名として出力させる方法がわかる方、ご教授願います。
以下にコードを載せておきます。

PYTHON

1for i in ['description2']: 2 print (i) 3 tfidf_vec2 = TfidfVectorizer(analyzer='word',ngram_range=(1,2)) 4 y = tfidf_vec2.fit_transform(df[i].values.tolist()) 5 6text_svd = TruncatedSVD(n_components=n_comp, algorithm='arpack',random_state=9999) 7df_svd = pd.DataFrame(text_svd.fit_transform(x)) 8df_svd.head()

output

1 0 1 2 3 4 5 6 7 8 9 ... 30 31 32 33 34 35 36 37 38 39 20 -7.501194e-19 -5.083681e-19 9.256121e-19 -9.811705e-19 -1.321589e-18 1.057663e-18 -3.449086e-19 4.886214e-19 6.208254e-19 -8.992375e-20 ... 5.832382e-19 -8.624896e-19 3.031554e-18 3.108539e-19 6.263407e-19 6.603455e-19 1.085247e-18 4.090040e-19 1.496029e-19 -1.805121e-18 31 2.346153e-09 4.267013e-03 2.779447e-01 4.229857e-16 -9.296342e-04 -8.135699e-17 -2.331004e-06 5.270119e-06 4.421652e-06 1.176099e-17 ... 3.130004e-01 -2.671972e-04 -5.242327e-16 -1.175265e-02 -7.096408e-16 -1.203920e-17 7.929157e-06 -8.166032e-08 -1.447494e-16 4.615199e-17 42 6.696090e-19 4.720389e-19 -7.611032e-19 1.091989e-18 1.069477e-18 -9.744506e-19 2.907909e-19 -4.600069e-19 -6.146886e-19 3.387167e-19 ... -6.176979e-19 7.161840e-19 -2.602259e-18 -3.796497e-19 -5.145963e-19 -6.148210e-19 -8.777409e-19 -4.519834e-19 -1.234023e-19 1.536307e-18 53 2.995120e-19 2.087760e-17 -8.396638e-18 -1.235932e-17 3.404933e-17 8.440509e-18 6.103069e-18 4.369044e-17 7.992710e-18 -5.289932e-18 ... 4.392430e-18 1.960763e-17 -1.096823e-17 -4.950404e-18 -4.854007e-18 2.160676e-18 9.344892e-19 1.026864e-17 -1.137194e-17 -1.883769e-17 64 1.721094e-18 1.073870e-18 -1.928538e-18 2.353051e-18 2.504178e-18 -2.702419e-18 5.576733e-19 -9.236454e-19 -1.249903e-18 5.142890e-19 ... -1.483040e-18 1.904206e-18 -6.894953e-

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

SVDによって文書-単語行列を次元削減した場合、次元削減後の各変数は特定の単語に対応しません。

どの単語が次元削減後に残っているのか

といった概念は成立しません。

投稿2021/02/22 11:26

hayataka2049

総合スコア30935

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問