質問編集履歴

1

すべて変えました

2020/08/10 15:15

投稿

rikubon_
rikubon_

スコア39

test CHANGED
File without changes
test CHANGED
@@ -1,25 +1,61 @@
1
- 自分が自然言語処理に挑戦したくてもともとあったcsvファイルを改造しtsvファイルに変換したんですが、
1
+ 自分が自然言語処理に挑戦したくてもともとあったcsvファイル(5列2000行のDataFram)必要な2列2000行のデータに変えそれをあるサイトでtsvファイルに変換しまし
2
2
 
3
- 0\taaa\t1
3
+ もともとあったデータは,
4
4
 
5
- 1\tbbb\t1
6
5
 
7
- 2\tccc\t2
8
6
 
9
- 3\tddd\t2 のような形で出力されました。
7
+ ID sentence flag ,,,,,,,
10
8
 
9
+ 0 aaa 1 ,,,,,,,
10
+
11
+ 1 bbb 2 ,,,,,,,
12
+
13
+ 2 ccc 2 ,,,,,,,
14
+
15
+ 3 ddd 1 ,,,,,,,
16
+
17
+ 4 eee 3 ,,,,,,,
18
+
19
+ 5 fff 2 ,,,,,,,
20
+
21
+
22
+
11
- 自分はのデータ
23
+ のようなcsvファイルでした。,
12
24
 
13
25
 
14
26
 
15
27
  aaa 1
16
28
 
17
- bbb 1
29
+ bbb 2
18
30
 
19
31
  ccc 2
32
+
33
+ ddd 1
34
+
35
+ eee 3
20
36
 
21
37
  ddd 2
22
38
 
23
39
 
24
40
 
41
+ のようなtsvファイル(sentenceとflagの間は半角スペース)にしたかったのですが,df.loc[[:,['sentence','flag']]で必要なカラムだけ取り出して、df.to_csvでcsvファイルを出力してtsvファイルにして,data = pd.read_csv("data.csv")でdataを出力したところ、
42
+
43
+
44
+
45
+ \tsentence\tflag
46
+
47
+ 0\taaa\t1
48
+
49
+ 1\tbbb\t2
50
+
51
+ 2\tccc\t2
52
+
53
+ 3\tddd\t1
54
+
55
+ 4\teee\t3
56
+
57
+ 5\tfff\t2
58
+
59
+
60
+
25
- といった形tsvファイルにしたいです。やり方はありますでしょうか?
61
+ よう出力されてまいまし。(最初の0,1,2,3...はIDではないです)これを真ん中のデータに変えるはありますでしょうか?