質問編集履歴
4
見やすく変更しました!
test
CHANGED
File without changes
|
test
CHANGED
@@ -30,7 +30,7 @@
|
|
30
30
|
|
31
31
|
```python3
|
32
32
|
|
33
|
-
# df = pd.read_csv('analyse.txt
|
33
|
+
# df = pd.read_csv('analyse.txt', index_col=0)
|
34
34
|
|
35
35
|
```
|
36
36
|
|
3
見やすく変更しました!
test
CHANGED
File without changes
|
test
CHANGED
@@ -25,6 +25,14 @@
|
|
25
25
|
|
26
26
|
|
27
27
|
**データは実際にgit cloneしてみる生データの方が、見やすいかと思います!**
|
28
|
+
|
29
|
+
**__下記のコードでdataframeにして確認してください__**
|
30
|
+
|
31
|
+
```python3
|
32
|
+
|
33
|
+
# df = pd.read_csv('analyse.txtxt', index_col=0)
|
34
|
+
|
35
|
+
```
|
28
36
|
|
29
37
|
|
30
38
|
|
2
見やすく変更しました!
test
CHANGED
File without changes
|
test
CHANGED
@@ -4,13 +4,15 @@
|
|
4
4
|
|
5
5
|
データが必要な方は、git cloneお願いします
|
6
6
|
|
7
|
+
|
8
|
+
|
7
|
-
https://github.com/kouhei-github/txt_data.git
|
9
|
+
git clone https://github.com/kouhei-github/txt_data.git
|
8
10
|
|
9
11
|
|
10
12
|
|
13
|
+
最後に質問をまとめていますので、1点でもわかる方お答え頂きたいです。
|
11
14
|
|
12
|
-
|
13
|
-
|
15
|
+
またデータから気付いた点や、自分なりに分析してみた等の意見もあればお願い致します。
|
14
16
|
|
15
17
|
|
16
18
|
|
@@ -19,6 +21,10 @@
|
|
19
21
|
現在、データ解析の勉強のために、あるサイトの検索順位のアルゴリズムを解析しています。
|
20
22
|
|
21
23
|
下記にデータを示します。
|
24
|
+
|
25
|
+
|
26
|
+
|
27
|
+
**データは実際にgit cloneしてみる生データの方が、見やすいかと思います!**
|
22
28
|
|
23
29
|
|
24
30
|
|
@@ -122,7 +128,7 @@
|
|
122
128
|
|
123
129
|
また見やすくするために累積寄与率をグラフにすると、下記になります。
|
124
130
|
|
125
|
-
![![イメージ説明](e2b9ec508e16b68c3a6404527f4e834d.png)]
|
131
|
+
![![イメージ説明](e2b9ec508e16b68c3a6404527f4e834d.png)]
|
126
132
|
|
127
133
|
|
128
134
|
|
1
見やすく変更しました!
test
CHANGED
File without changes
|
test
CHANGED
@@ -66,7 +66,7 @@
|
|
66
66
|
|
67
67
|
|
68
68
|
|
69
|
-
|
69
|
+
**__データを正規化し、自分なりに必要なデータに絞った__**のが下記で、
|
70
70
|
|
71
71
|
|
72
72
|
|
@@ -88,9 +88,9 @@
|
|
88
88
|
|
89
89
|
|
90
90
|
|
91
|
-
このデータ
|
91
|
+
このデータを、主成分分析(PCA)をかけ,
|
92
92
|
|
93
|
-
第一主成分と第二主成分をplotして、firstpageで散布図を作成すると
|
93
|
+
__**第一主成分と第二主成分をplotして、firstpageで散布図を作成**__すると
|
94
94
|
|
95
95
|
![イメージ説明](23126283f5d213376cc82546c3733e75.png)
|
96
96
|
|
@@ -98,7 +98,7 @@
|
|
98
98
|
|
99
99
|
私の解釈として、第一主成分はfirstpage(1page目になれるかどうか)を表していると考えています。
|
100
100
|
|
101
|
-
ここでの散布図の分かれ目の0.4とは何を表しているのでしょうか?
|
101
|
+
__**ここでの散布図の分かれ目の0.4とは何を表しているのでしょうか?**__
|
102
102
|
|
103
103
|
|
104
104
|
|
@@ -148,13 +148,13 @@
|
|
148
148
|
|
149
149
|
|
150
150
|
|
151
|
-
1, PC1(第一主成分), PC2(第二主成分)でfirstpageの散布図を示した図の、分かれ目の0.4とは何を表しているのでしょうか?
|
151
|
+
**__1, PC1(第一主成分), PC2(第二主成分)でfirstpageの散布図を示した図の、分かれ目の0.4とは何を表しているのでしょうか?__**
|
152
152
|
|
153
|
-
2, 皆さんの解釈で第二主成分は何を表していると思いますか?
|
153
|
+
**__2, 皆さんの解釈で第二主成分は何を表していると思いますか?__**
|
154
154
|
|
155
|
-
3, この主成分分析はあっているのでしょうか?
|
155
|
+
**__3, この主成分分析はあっているのでしょうか?__**
|
156
156
|
|
157
|
-
4, 最後のグラフの数字(PC1だと-1.0~0.0)は何を示しているのでしょうか?
|
157
|
+
**__4, 最後のグラフの数字(PC1だと-1.0~0.0)は何を示しているのでしょうか?__**
|
158
158
|
|
159
159
|
|
160
160
|
|