質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
86.12%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

解決済

主成分分析:射影、再構成誤差

komeko
komeko

総合スコア8

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

1回答

2グッド

0クリップ

2664閲覧

投稿2021/12/24 15:48

#主成分分析のおける射影と再構成誤差についての質問をさせて頂きたいです。
##(問)
2次元空間において「(-1,-1),(0,0),(1,1)」という3つのデータ点が与えられ、これらのデータに対して主成分分析を適用した時の射影と再構成誤差について

###質問1:
第一主成分によって得られる1次元空間へデータ点「(-1,-1),(0,0),(1,1)」を射影した時の
1次元空間においてそれぞれの点の座標は何か?

######行ったこと:
第一主成分(1/√2,1/√2)のx軸とy軸をそれぞれのデータ点と掛けた和である
1/√2*(-1)+1/√2*(-1)=√2,
1/√20+1/√20=0,
1/√21+1/√21=√2
A.(√2,0,√2)と計算しました。

######疑問点:
この認識であっているかどうかをお聞きしたいです

###質問2:
質問1で1次元空間に射影されたデータを元の2次元空間に再構成すると、再構成誤差(元のデータと再構成したデータとの誤差)は何%か?

######行ったこと:
再構成誤差が元の点「(-1,-1),(0,0),(1,1)」と射影点「(√2,1,√2)」の平均二乗誤差と考え計算

(1/2){((√2-(-1))2+(√2-(-1))2)(1/2)}=(1/2)*(2(3+2√2))(1/2),
(1/2){((1-0)**2+(1-0)2)(1/2)} = √2/2,
(1/2){((√2-1)2+(√2-1)2)(1/2)}=(1/2)*(2(3-2√2))(1/2)
より
√3+√2/2と計算しました。

######疑問点:
・まず再構成誤差自体はこの計算方法と値で合っているのかどうか
・もし合っているならば何と割り算をして誤差を%として求めれば良いのか
という点についてお聞きしたいです。

takedac, kenkusaba1014👍を押しています

以下のような質問にはグッドを送りましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

グッドが多くついた質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 間違っている
  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

2021/12/25 01:15

こちらの質問が他のユーザーから「過去の低評価」という指摘を受けました。

回答1

2

ベストアンサー

質問1 この認識であっているかどうかをお聞きしたいです

間違っています。
-√2と0と√2です。

質問2:

すべての点の第二主成分がゼロなので、誤差はゼロです。

投稿2021/12/24 17:05

ppaul

総合スコア24620

komeko, kenkusaba1014👍を押しています

良いと思った回答にはグッドを送りましょう。
グッドが多くついた回答ほどページの上位に表示されるので、他の人が素晴らしい回答を見つけやすくなります。

下記のような回答は推奨されていません。

  • 間違っている回答
  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

回答へのコメント

komeko

2021/12/25 02:26

回答して頂きありがとうございます。 質問1についての指摘ありがとうございました。 質問2について "すべての点の第二主成分がゼロなので、誤差はゼロ"とのことですが 全ての点とはどの点のことを指しているのか、 またなぜ誤差が0になるかをよろしければ教えていただけないでしょうか。
ppaul

2021/12/25 03:00

(-1,-1),(0,0),(1,1)という元の点です。 その重心である(0,0)を起点として元の点をベクトルと考えたときの3個のベクトルを考えます。 第一主成分は、3個のデータにもっとも影響を与える方向ベクトルのことで、固有値の絶対値が最大のものに対する固有ベクトルとなります。 この場合は、3点が直線状に並んでいるので、ゼロでない固有値は一つしかなくその固有ベクトルは(1,1)で正規化すれば(√2/2,√2/2)です。 もう一つの固有値がゼロであることを「第二主成分がゼロ」とかいたのですが、「2番目の固有値がゼロ」と書いたほうが正確でしたね。 主成分分析を行うのは、n次元空間のサンプルをより少ない次元のサンプルに射影してデータ量を減らすためです。二次元のサンプルの場合には次元を減らすには1次元か0次元にするのですが、今回は1次元にしていますね。 与えられた3点が直線状にあるので、1次元化した情報は何も情報が失われていません。これが誤差がゼロという意味です。
komeko

2021/12/25 03:46

とても丁寧に説明して頂きありがとうございます! 誤差がなぜ0かが理解することができました。 迅速にお返事して頂きありがとうございます。

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
86.12%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。