質問編集履歴
1
すべて変えました
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,25 +1,61 @@
|
|
1
|
-
自分が自然言語処理に挑戦したくてもともとあったcsvファイルを
|
1
|
+
自分が自然言語処理に挑戦したくてもともとあったcsvファイル(5列2000行のDataFram)を必要な2列2000行のデータに変えてそれをあるサイトでtsvファイルに変換しました。
|
2
2
|
|
3
|
-
|
3
|
+
もともとあったデータは,
|
4
4
|
|
5
|
-
1\tbbb\t1
|
6
5
|
|
7
|
-
2\tccc\t2
|
8
6
|
|
9
|
-
|
7
|
+
ID sentence flag ,,,,,,,
|
10
8
|
|
9
|
+
0 aaa 1 ,,,,,,,
|
10
|
+
|
11
|
+
1 bbb 2 ,,,,,,,
|
12
|
+
|
13
|
+
2 ccc 2 ,,,,,,,
|
14
|
+
|
15
|
+
3 ddd 1 ,,,,,,,
|
16
|
+
|
17
|
+
4 eee 3 ,,,,,,,
|
18
|
+
|
19
|
+
5 fff 2 ,,,,,,,
|
20
|
+
|
21
|
+
|
22
|
+
|
11
|
-
|
23
|
+
のようなcsvファイルでした。これを,
|
12
24
|
|
13
25
|
|
14
26
|
|
15
27
|
aaa 1
|
16
28
|
|
17
|
-
bbb
|
29
|
+
bbb 2
|
18
30
|
|
19
31
|
ccc 2
|
32
|
+
|
33
|
+
ddd 1
|
34
|
+
|
35
|
+
eee 3
|
20
36
|
|
21
37
|
ddd 2
|
22
38
|
|
23
39
|
|
24
40
|
|
41
|
+
のようなtsvファイル(sentenceとflagの間は半角スペース)にしたかったのですが,df.loc[[:,['sentence','flag']]で必要なカラムだけ取り出して、df.to_csvでcsvファイルを出力してtsvファイルにして,data = pd.read_csv("data.csv")でdataを出力したところ、
|
42
|
+
|
43
|
+
|
44
|
+
|
45
|
+
\tsentence\tflag
|
46
|
+
|
47
|
+
0\taaa\t1
|
48
|
+
|
49
|
+
1\tbbb\t2
|
50
|
+
|
51
|
+
2\tccc\t2
|
52
|
+
|
53
|
+
3\tddd\t1
|
54
|
+
|
55
|
+
4\teee\t3
|
56
|
+
|
57
|
+
5\tfff\t2
|
58
|
+
|
59
|
+
|
60
|
+
|
25
|
-
|
61
|
+
のように出力されてしまいました。(最初の0,1,2,3...はIDではないです)これを真ん中のデータに変える方法はありますでしょうか?
|