質問編集履歴
1
データの全体像について補足しました
test
CHANGED
File without changes
|
test
CHANGED
@@ -4,33 +4,67 @@
|
|
4
4
|
|
5
5
|
<gene_name.txt>
|
6
6
|
|
7
|
-
ens_gene
|
7
|
+
ens_gene ext_gene
|
8
8
|
|
9
|
-
1
|
9
|
+
1 ENSG00000210049 MT-TF
|
10
10
|
|
11
|
-
2
|
11
|
+
2 ENSG00000211459 MT-RNR1
|
12
12
|
|
13
|
-
3
|
13
|
+
3 ENSG00000210077 MT-TV
|
14
14
|
|
15
|
-
4
|
15
|
+
4 ENSG00000210082 MT-RNR2
|
16
|
+
|
17
|
+
5 ENSG00000209082 MT-TL1
|
18
|
+
|
19
|
+
... ... ...
|
20
|
+
|
21
|
+
67136 ENSG00000284921 AC004852.4
|
22
|
+
|
23
|
+
67137 ENSG00000285440 AC004852.6
|
24
|
+
|
25
|
+
67138 ENSG00000285110 AC004852.5
|
26
|
+
|
27
|
+
67139 ENSG00000285363 MTRF1LP2
|
28
|
+
|
29
|
+
67140 ENSG00000285114 GSDMC
|
16
30
|
|
17
31
|
|
32
|
+
|
33
|
+
[67140 rows x 2 columns]
|
18
34
|
|
19
35
|
|
20
36
|
|
21
37
|
<test_FPKM.txt>
|
22
38
|
|
23
|
-
|
39
|
+
0
|
24
40
|
|
25
|
-
0
|
41
|
+
0 ENSG00000242268.2
|
26
42
|
|
27
|
-
1
|
43
|
+
1 ENSG00000270112.3
|
28
44
|
|
29
|
-
2
|
45
|
+
2 ENSG00000167578.15
|
30
46
|
|
31
|
-
3
|
47
|
+
3 ENSG00000273842.1
|
32
48
|
|
33
|
-
4
|
49
|
+
4 ENSG00000078237.5
|
50
|
+
|
51
|
+
... ...
|
52
|
+
|
53
|
+
60478 ENSG00000105063.17
|
54
|
+
|
55
|
+
60479 ENSG00000231119.2
|
56
|
+
|
57
|
+
60480 ENSG00000280861.1
|
58
|
+
|
59
|
+
60481 ENSG00000123685.7
|
60
|
+
|
61
|
+
60482 ENSG00000181518.3
|
62
|
+
|
63
|
+
|
64
|
+
|
65
|
+
[60483 rows x 1 columns]
|
66
|
+
|
67
|
+
|
34
68
|
|
35
69
|
|
36
70
|
|
@@ -86,6 +120,12 @@
|
|
86
120
|
|
87
121
|
```
|
88
122
|
|
123
|
+
2つのファイルは行数が異なります。
|
124
|
+
|
125
|
+
また、<test_FPKM.txt>に含まれる文字列は、<gene_name.txt>のens_gene列に小数点以下の数字が付与されています。
|
126
|
+
|
127
|
+
|
128
|
+
|
89
129
|
|
90
130
|
|
91
131
|
ただ、全本のファイルはそれぞれ65,000行くらいあり、全体のデータで処理すると動きません。
|