質問編集履歴
3
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -118,66 +118,6 @@
|
|
118
118
|
|
119
119
|
ご回答いただいたように試しましたが、形態素解析の結果に改行が入っている訳ではないので、実行しても下記のようになってしまいます。
|
120
120
|
|
121
|
-
```
|
122
|
-
|
123
|
-
text = "プログラミング教室を手伝ってくれる人を募集中!締め切りは6月23日です。"
|
124
|
-
|
125
|
-
t = MeCab.Tagger('')
|
126
|
-
|
127
|
-
test = t.parse(text)
|
128
|
-
|
129
|
-
text = re.sub(r"\n",",0\n",test)
|
130
|
-
|
131
|
-
test = re.sub(r'EOS',"",test)
|
132
|
-
|
133
|
-
test += "O"
|
134
|
-
|
135
|
-
|
136
|
-
|
137
|
-
print(test)
|
138
|
-
|
139
|
-
=>
|
140
|
-
|
141
|
-
#プログラミング 名詞,一般,*,*,*,*,プログラミング,,
|
142
|
-
|
143
|
-
#教室 名詞,一般,*,*,*,*,教室,キョウシツ,キョーシツ
|
144
|
-
|
145
|
-
#を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
|
146
|
-
|
147
|
-
#手伝っ 動詞,自立,*,*,五段・ワ行促音便,連用タ接続,手伝う,テツダッ,テツダッ
|
148
|
-
|
149
|
-
#て 助詞,接続助詞,*,*,*,*,て,テ,テ
|
150
|
-
|
151
|
-
#くれる 動詞,非自立,*,*,一段・クレル,基本形,くれる,クレル,クレル
|
152
|
-
|
153
|
-
#人 名詞,一般,*,*,*,*,人,ヒト,ヒト
|
154
|
-
|
155
|
-
#を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
|
156
|
-
|
157
|
-
#募集中 名詞,一般,*,*,*,*,募集中,,
|
158
|
-
|
159
|
-
#! 記号,一般,*,*,*,*,!,!,!
|
160
|
-
|
161
|
-
#締め切り 名詞,一般,*,*,*,*,締め切り,シメキリ,シメキリ
|
162
|
-
|
163
|
-
#は 助詞,係助詞,*,*,*,*,は,ハ,ワ
|
164
|
-
|
165
|
-
#6月23日 名詞,一般,*,*,*,*,6月23日,,
|
166
|
-
|
167
|
-
#です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
|
168
|
-
|
169
|
-
#。 記号,句点,*,*,*,*,。,。,。
|
170
|
-
|
171
|
-
#
|
172
|
-
|
173
|
-
#O
|
174
|
-
|
175
|
-
```
|
176
|
-
|
177
|
-
|
178
|
-
|
179
|
-
|
180
|
-
|
181
121
|
|
182
122
|
|
183
123
|
###補足情報
|
2
加筆
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,4 +1,8 @@
|
|
1
1
|
###実現したいこと
|
2
|
+
|
3
|
+
機械学習を用いた固有表現抽出を行うためのデータセットを作成しています。
|
4
|
+
|
5
|
+
タグ一切なしの状態では形態素解析の結果が多すぎるため、作業に一番多くつけるタグをつけ後ほど修正するという形を取ろうと考えています。
|
2
6
|
|
3
7
|
MeCabによる形態素解析の結果の一つ一つにタグをつけたいのですが、いまいちやり方がわかりません。
|
4
8
|
|
@@ -112,6 +116,66 @@
|
|
112
116
|
|
113
117
|
各行ごとに文字列の長さをlen()で確かめて挿入できないか試しましたが、全体で捉えられてしまうため1行の区切りがどこにあるのかがわかりませんでした。
|
114
118
|
|
119
|
+
ご回答いただいたように試しましたが、形態素解析の結果に改行が入っている訳ではないので、実行しても下記のようになってしまいます。
|
120
|
+
|
121
|
+
```
|
122
|
+
|
123
|
+
text = "プログラミング教室を手伝ってくれる人を募集中!締め切りは6月23日です。"
|
124
|
+
|
125
|
+
t = MeCab.Tagger('')
|
126
|
+
|
127
|
+
test = t.parse(text)
|
128
|
+
|
129
|
+
text = re.sub(r"\n",",0\n",test)
|
130
|
+
|
131
|
+
test = re.sub(r'EOS',"",test)
|
132
|
+
|
133
|
+
test += "O"
|
134
|
+
|
135
|
+
|
136
|
+
|
137
|
+
print(test)
|
138
|
+
|
139
|
+
=>
|
140
|
+
|
141
|
+
#プログラミング 名詞,一般,*,*,*,*,プログラミング,,
|
142
|
+
|
143
|
+
#教室 名詞,一般,*,*,*,*,教室,キョウシツ,キョーシツ
|
144
|
+
|
145
|
+
#を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
|
146
|
+
|
147
|
+
#手伝っ 動詞,自立,*,*,五段・ワ行促音便,連用タ接続,手伝う,テツダッ,テツダッ
|
148
|
+
|
149
|
+
#て 助詞,接続助詞,*,*,*,*,て,テ,テ
|
150
|
+
|
151
|
+
#くれる 動詞,非自立,*,*,一段・クレル,基本形,くれる,クレル,クレル
|
152
|
+
|
153
|
+
#人 名詞,一般,*,*,*,*,人,ヒト,ヒト
|
154
|
+
|
155
|
+
#を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
|
156
|
+
|
157
|
+
#募集中 名詞,一般,*,*,*,*,募集中,,
|
158
|
+
|
159
|
+
#! 記号,一般,*,*,*,*,!,!,!
|
160
|
+
|
161
|
+
#締め切り 名詞,一般,*,*,*,*,締め切り,シメキリ,シメキリ
|
162
|
+
|
163
|
+
#は 助詞,係助詞,*,*,*,*,は,ハ,ワ
|
164
|
+
|
165
|
+
#6月23日 名詞,一般,*,*,*,*,6月23日,,
|
166
|
+
|
167
|
+
#です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
|
168
|
+
|
169
|
+
#。 記号,句点,*,*,*,*,。,。,。
|
170
|
+
|
171
|
+
#
|
172
|
+
|
173
|
+
#O
|
174
|
+
|
175
|
+
```
|
176
|
+
|
177
|
+
|
178
|
+
|
115
179
|
|
116
180
|
|
117
181
|
|
1
加筆修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -2,7 +2,7 @@
|
|
2
2
|
|
3
3
|
MeCabによる形態素解析の結果の一つ一つにタグをつけたいのですが、いまいちやり方がわかりません。
|
4
4
|
|
5
|
-
一行一行の結果の
|
5
|
+
一行一行の結果の行末に下記の例のようにタグをつけたいです。
|
6
6
|
|
7
7
|
|
8
8
|
|
@@ -60,9 +60,17 @@
|
|
60
60
|
|
61
61
|
#。 記号,句点,*,*,*,*,。,。,。
|
62
62
|
|
63
|
+
```
|
63
64
|
|
64
65
|
|
66
|
+
|
67
|
+
出力したい結果は、以下のように各行の行末にOのようなタグがついた状態です。
|
68
|
+
|
65
|
-
|
69
|
+
```python
|
70
|
+
|
71
|
+
print(test)
|
72
|
+
|
73
|
+
#タグをつけた状態(期待する結果、タグはとりあえずOとする)
|
66
74
|
|
67
75
|
#プログラミング 名詞,一般,*,*,*,*,プログラミング,,O
|
68
76
|
|