質問編集履歴

1

データの全体像について補足しました

2020/04/13 13:11

投稿

iziz
iziz

スコア8

test CHANGED
File without changes
test CHANGED
@@ -4,33 +4,67 @@
4
4
 
5
5
  <gene_name.txt>
6
6
 
7
- ens_gene ext_gene
7
+ ens_gene ext_gene
8
8
 
9
- 1 ENSG00000210049 MT-TF
9
+ 1 ENSG00000210049 MT-TF
10
10
 
11
- 2 ENSG00000211459 MT-RNR1
11
+ 2 ENSG00000211459 MT-RNR1
12
12
 
13
- 3 ENSG00000210077 MT-TV
13
+ 3 ENSG00000210077 MT-TV
14
14
 
15
- 4 ENSG00000210082 MT-RNR2
15
+ 4 ENSG00000210082 MT-RNR2
16
+
17
+ 5 ENSG00000209082 MT-TL1
18
+
19
+ ... ... ...
20
+
21
+ 67136 ENSG00000284921 AC004852.4
22
+
23
+ 67137 ENSG00000285440 AC004852.6
24
+
25
+ 67138 ENSG00000285110 AC004852.5
26
+
27
+ 67139 ENSG00000285363 MTRF1LP2
28
+
29
+ 67140 ENSG00000285114 GSDMC
16
30
 
17
31
 
32
+
33
+ [67140 rows x 2 columns]
18
34
 
19
35
 
20
36
 
21
37
  <test_FPKM.txt>
22
38
 
23
- 0
39
+ 0
24
40
 
25
- 0 ENSG00000242268.2
41
+ 0 ENSG00000242268.2
26
42
 
27
- 1 ENSG00000270112.3
43
+ 1 ENSG00000270112.3
28
44
 
29
- 2 ENSG00000167578.15
45
+ 2 ENSG00000167578.15
30
46
 
31
- 3 ENSG00000273842.1
47
+ 3 ENSG00000273842.1
32
48
 
33
- 4 ENSG00000078237.5
49
+ 4 ENSG00000078237.5
50
+
51
+ ... ...
52
+
53
+ 60478 ENSG00000105063.17
54
+
55
+ 60479 ENSG00000231119.2
56
+
57
+ 60480 ENSG00000280861.1
58
+
59
+ 60481 ENSG00000123685.7
60
+
61
+ 60482 ENSG00000181518.3
62
+
63
+
64
+
65
+ [60483 rows x 1 columns]
66
+
67
+
34
68
 
35
69
 
36
70
 
@@ -86,6 +120,12 @@
86
120
 
87
121
  ```
88
122
 
123
+ 2つのファイルは行数が異なります。
124
+
125
+ また、<test_FPKM.txt>に含まれる文字列は、<gene_name.txt>のens_gene列に小数点以下の数字が付与されています。
126
+
127
+
128
+
89
129
 
90
130
 
91
131
  ただ、全本のファイルはそれぞれ65,000行くらいあり、全体のデータで処理すると動きません。