質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

Q&A

解決済

1回答

5692閲覧

主成分分析:射影、再構成誤差

komeko

総合スコア8

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

2グッド

0クリップ

投稿2021/12/24 15:48

#主成分分析のおける射影と再構成誤差についての質問をさせて頂きたいです。
##(問)
2次元空間において「(-1,-1),(0,0),(1,1)」という3つのデータ点が与えられ、これらのデータに対して主成分分析を適用した時の射影と再構成誤差について

###質問1:
第一主成分によって得られる1次元空間へデータ点「(-1,-1),(0,0),(1,1)」を射影した時の
1次元空間においてそれぞれの点の座標は何か?

######行ったこと:
第一主成分(1/√2,1/√2)のx軸とy軸をそれぞれのデータ点と掛けた和である
1/√2*(-1)+1/√2*(-1)=√2,
1/√20+1/√20=0,
1/√21+1/√21=√2
A.(√2,0,√2)と計算しました。

######疑問点:
この認識であっているかどうかをお聞きしたいです

###質問2:
質問1で1次元空間に射影されたデータを元の2次元空間に再構成すると、再構成誤差(元のデータと再構成したデータとの誤差)は何%か?

######行ったこと:
再構成誤差が元の点「(-1,-1),(0,0),(1,1)」と射影点「(√2,1,√2)」の平均二乗誤差と考え計算

(1/2){((√2-(-1))2+(√2-(-1))2)(1/2)}=(1/2)*(2(3+2√2))(1/2),
(1/2){((1-0)**2+(1-0)2)(1/2)} = √2/2,
(1/2){((√2-1)2+(√2-1)2)(1/2)}=(1/2)*(2(3-2√2))(1/2)
より
√3+√2/2と計算しました。

######疑問点:
・まず再構成誤差自体はこの計算方法と値で合っているのかどうか
・もし合っているならば何と割り算をして誤差を%として求めれば良いのか
という点についてお聞きしたいです。

takedac, kenkusaba1014👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

質問1 この認識であっているかどうかをお聞きしたいです

間違っています。
-√2と0と√2です。

質問2:

すべての点の第二主成分がゼロなので、誤差はゼロです。

投稿2021/12/24 17:05

ppaul

総合スコア24670

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

komeko

2021/12/25 02:26

回答して頂きありがとうございます。 質問1についての指摘ありがとうございました。 質問2について "すべての点の第二主成分がゼロなので、誤差はゼロ"とのことですが 全ての点とはどの点のことを指しているのか、 またなぜ誤差が0になるかをよろしければ教えていただけないでしょうか。
ppaul

2021/12/25 03:00

(-1,-1),(0,0),(1,1)という元の点です。 その重心である(0,0)を起点として元の点をベクトルと考えたときの3個のベクトルを考えます。 第一主成分は、3個のデータにもっとも影響を与える方向ベクトルのことで、固有値の絶対値が最大のものに対する固有ベクトルとなります。 この場合は、3点が直線状に並んでいるので、ゼロでない固有値は一つしかなくその固有ベクトルは(1,1)で正規化すれば(√2/2,√2/2)です。 もう一つの固有値がゼロであることを「第二主成分がゼロ」とかいたのですが、「2番目の固有値がゼロ」と書いたほうが正確でしたね。 主成分分析を行うのは、n次元空間のサンプルをより少ない次元のサンプルに射影してデータ量を減らすためです。二次元のサンプルの場合には次元を減らすには1次元か0次元にするのですが、今回は1次元にしていますね。 与えられた3点が直線状にあるので、1次元化した情報は何も情報が失われていません。これが誤差がゼロという意味です。
komeko

2021/12/25 03:46

とても丁寧に説明して頂きありがとうございます! 誤差がなぜ0かが理解することができました。 迅速にお返事して頂きありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問