回答編集履歴
3
strtok の説明を追加
test
CHANGED
@@ -131,3 +131,67 @@
|
|
131
131
|
strtok は元の文字列に '\0' をたくさん書き込みます。
|
132
132
|
|
133
133
|
そのことは理解できていますか?
|
134
|
+
|
135
|
+
|
136
|
+
|
137
|
+
**追記2**
|
138
|
+
|
139
|
+
strtok について説明します。
|
140
|
+
|
141
|
+
|
142
|
+
|
143
|
+
char str[] = "abc:123,def:45,ghi:678."; という文字列があったとします。
|
144
|
+
|
145
|
+
|
146
|
+
|
147
|
+
char *p = strtok(str, ",."); を実行すると、
|
148
|
+
|
149
|
+
strtok は、str の先頭から ',' または '.' を探しに行き、
|
150
|
+
|
151
|
+
str[7] に ',' が入っているのを見つけて、そこを '\0' に書き換えます。
|
152
|
+
|
153
|
+
"abc:123" という文字列を作ったことになります。
|
154
|
+
|
155
|
+
そして、'a' の入った str[0] のアドレスを返します。
|
156
|
+
|
157
|
+
その時 strtok は 'd' の入った str[8] のアドレスを内部に憶えておきます。
|
158
|
+
|
159
|
+
|
160
|
+
|
161
|
+
次に、p = strtok(NULL, ".,"); を実行すると、
|
162
|
+
|
163
|
+
strtok は文字列をもらえず、NULL をもらったので、先ほど憶えておいた
|
164
|
+
|
165
|
+
str[8] のアドレスから ',' または '.' を探しに行き、
|
166
|
+
|
167
|
+
"def:45" という文字列を作って、その先頭の文字のアドレスを返します。
|
168
|
+
|
169
|
+
|
170
|
+
|
171
|
+
これを繰り返すと、str は "abc:123\0def:45\0ghi:678\0" となります。
|
172
|
+
|
173
|
+
|
174
|
+
|
175
|
+
このように、元の文字列 str は書き換えられてしまうので、
|
176
|
+
|
177
|
+
今度は別の区切り文字、例えば ':' で分割しようと思ってももうできません。
|
178
|
+
|
179
|
+
|
180
|
+
|
181
|
+
だから、char buf[1024]; strcpy(buf, str); で str の文字列を buf に
|
182
|
+
|
183
|
+
コピーして、それを分割しているのです。
|
184
|
+
|
185
|
+
|
186
|
+
|
187
|
+
また、元の文字列が、const char *str = "abc:123,def:45,ghi:678."; だった場合、
|
188
|
+
|
189
|
+
str は配列ではなくポインタですから、文字列の実体は書き換えできない
|
190
|
+
|
191
|
+
文字列リテラル "abc:123,def:45,ghi:678." であり、ポインタがそれを指します。
|
192
|
+
|
193
|
+
strtok(str, ",.") とすることはできません。
|
194
|
+
|
195
|
+
この場合も、書き換え可能な char配列に strcpy でコピーしてから、
|
196
|
+
|
197
|
+
strtok を使うことになります。
|
2
strtok のサンプルを追加
test
CHANGED
@@ -57,3 +57,77 @@
|
|
57
57
|
MeCab でのパース結果を見て、単語だけ取り出そうとするとき、
|
58
58
|
|
59
59
|
分割したときの区切り文字が何か知りたいなあと思いませんでしたか?
|
60
|
+
|
61
|
+
|
62
|
+
|
63
|
+
**追記**
|
64
|
+
|
65
|
+
質問者が頑張れば理解可能な strtok の使用例。
|
66
|
+
|
67
|
+
```C
|
68
|
+
|
69
|
+
#include <stdio.h> // puts, printf
|
70
|
+
|
71
|
+
#include <string.h> // strcpy, strtok
|
72
|
+
|
73
|
+
|
74
|
+
|
75
|
+
int main()
|
76
|
+
|
77
|
+
{
|
78
|
+
|
79
|
+
const char *str = "タバコ\t名詞,一般,*,*,*,*,タバコ,タバコ,タバコ\n"
|
80
|
+
|
81
|
+
"を\t助詞,格助詞,一般,*,*,*,を,ヲ,ヲ\n";
|
82
|
+
|
83
|
+
char buf[1024], *p;
|
84
|
+
|
85
|
+
|
86
|
+
|
87
|
+
strcpy(buf, str);
|
88
|
+
|
89
|
+
puts("-- \"\n\" --");
|
90
|
+
|
91
|
+
p = strtok(buf, "\n");
|
92
|
+
|
93
|
+
while (p) { printf("[%s]\n", p); p = strtok(NULL, "\n"); }
|
94
|
+
|
95
|
+
|
96
|
+
|
97
|
+
strcpy(buf, str);
|
98
|
+
|
99
|
+
puts("-- \"\t\" --");
|
100
|
+
|
101
|
+
p = strtok(buf, "\t");
|
102
|
+
|
103
|
+
while (p) { printf("[%s]\n", p); p = strtok(NULL, "\t"); }
|
104
|
+
|
105
|
+
|
106
|
+
|
107
|
+
strcpy(buf, str);
|
108
|
+
|
109
|
+
puts("-- \",\" --");
|
110
|
+
|
111
|
+
p = strtok(buf, ",");
|
112
|
+
|
113
|
+
while (p) { printf("[%s]\n", p); p = strtok(NULL, ","); }
|
114
|
+
|
115
|
+
|
116
|
+
|
117
|
+
strcpy(buf, str);
|
118
|
+
|
119
|
+
puts("-- \",\t\n\" --");
|
120
|
+
|
121
|
+
p = strtok(buf, ",\t\n");
|
122
|
+
|
123
|
+
while (p) { printf("[%s]\n", p); p = strtok(NULL, ",\t\n"); }
|
124
|
+
|
125
|
+
}
|
126
|
+
|
127
|
+
```
|
128
|
+
|
129
|
+
なぜ、strcpy を何度も実行しているのか分かりますか?
|
130
|
+
|
131
|
+
strtok は元の文字列に '\0' をたくさん書き込みます。
|
132
|
+
|
133
|
+
そのことは理解できていますか?
|
1
スペースの調整
test
CHANGED
@@ -32,9 +32,9 @@
|
|
32
32
|
|
33
33
|
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
|
34
34
|
|
35
|
-
吸い 動詞,自立,*,*,五段・ワ行促音便,連用形,吸う,スイ,スイ
|
35
|
+
吸い 動詞,自立,*,*,五段・ワ行促音便,連用形,吸う,スイ,スイ
|
36
36
|
|
37
|
-
ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
|
37
|
+
ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
|
38
38
|
|
39
39
|
。 記号,句点,*,*,*,*,。,。,。
|
40
40
|
|