質問編集履歴

3

修正

2017/06/22 05:25

投稿

swallowataill
swallowataill

スコア36

test CHANGED
File without changes
test CHANGED
@@ -118,66 +118,6 @@
118
118
 
119
119
  ご回答いただいたように試しましたが、形態素解析の結果に改行が入っている訳ではないので、実行しても下記のようになってしまいます。
120
120
 
121
- ```
122
-
123
- text = "プログラミング教室を手伝ってくれる人を募集中!締め切りは6月23日です。"
124
-
125
- t = MeCab.Tagger('')
126
-
127
- test = t.parse(text)
128
-
129
- text = re.sub(r"\n",",0\n",test)
130
-
131
- test = re.sub(r'EOS',"",test)
132
-
133
- test += "O"
134
-
135
-
136
-
137
- print(test)
138
-
139
- =>
140
-
141
- #プログラミング 名詞,一般,*,*,*,*,プログラミング,,
142
-
143
- #教室 名詞,一般,*,*,*,*,教室,キョウシツ,キョーシツ
144
-
145
- #を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
146
-
147
- #手伝っ 動詞,自立,*,*,五段・ワ行促音便,連用タ接続,手伝う,テツダッ,テツダッ
148
-
149
- #て 助詞,接続助詞,*,*,*,*,て,テ,テ
150
-
151
- #くれる 動詞,非自立,*,*,一段・クレル,基本形,くれる,クレル,クレル
152
-
153
- #人 名詞,一般,*,*,*,*,人,ヒト,ヒト
154
-
155
- #を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
156
-
157
- #募集中 名詞,一般,*,*,*,*,募集中,,
158
-
159
- #! 記号,一般,*,*,*,*,!,!,!
160
-
161
- #締め切り 名詞,一般,*,*,*,*,締め切り,シメキリ,シメキリ
162
-
163
- #は 助詞,係助詞,*,*,*,*,は,ハ,ワ
164
-
165
- #6月23日 名詞,一般,*,*,*,*,6月23日,,
166
-
167
- #です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
168
-
169
- #。 記号,句点,*,*,*,*,。,。,。
170
-
171
- #
172
-
173
- #O
174
-
175
- ```
176
-
177
-
178
-
179
-
180
-
181
121
 
182
122
 
183
123
  ###補足情報

2

加筆

2017/06/22 05:25

投稿

swallowataill
swallowataill

スコア36

test CHANGED
File without changes
test CHANGED
@@ -1,4 +1,8 @@
1
1
  ###実現したいこと
2
+
3
+ 機械学習を用いた固有表現抽出を行うためのデータセットを作成しています。
4
+
5
+ タグ一切なしの状態では形態素解析の結果が多すぎるため、作業に一番多くつけるタグをつけ後ほど修正するという形を取ろうと考えています。
2
6
 
3
7
  MeCabによる形態素解析の結果の一つ一つにタグをつけたいのですが、いまいちやり方がわかりません。
4
8
 
@@ -112,6 +116,66 @@
112
116
 
113
117
  各行ごとに文字列の長さをlen()で確かめて挿入できないか試しましたが、全体で捉えられてしまうため1行の区切りがどこにあるのかがわかりませんでした。
114
118
 
119
+ ご回答いただいたように試しましたが、形態素解析の結果に改行が入っている訳ではないので、実行しても下記のようになってしまいます。
120
+
121
+ ```
122
+
123
+ text = "プログラミング教室を手伝ってくれる人を募集中!締め切りは6月23日です。"
124
+
125
+ t = MeCab.Tagger('')
126
+
127
+ test = t.parse(text)
128
+
129
+ text = re.sub(r"\n",",0\n",test)
130
+
131
+ test = re.sub(r'EOS',"",test)
132
+
133
+ test += "O"
134
+
135
+
136
+
137
+ print(test)
138
+
139
+ =>
140
+
141
+ #プログラミング 名詞,一般,*,*,*,*,プログラミング,,
142
+
143
+ #教室 名詞,一般,*,*,*,*,教室,キョウシツ,キョーシツ
144
+
145
+ #を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
146
+
147
+ #手伝っ 動詞,自立,*,*,五段・ワ行促音便,連用タ接続,手伝う,テツダッ,テツダッ
148
+
149
+ #て 助詞,接続助詞,*,*,*,*,て,テ,テ
150
+
151
+ #くれる 動詞,非自立,*,*,一段・クレル,基本形,くれる,クレル,クレル
152
+
153
+ #人 名詞,一般,*,*,*,*,人,ヒト,ヒト
154
+
155
+ #を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
156
+
157
+ #募集中 名詞,一般,*,*,*,*,募集中,,
158
+
159
+ #! 記号,一般,*,*,*,*,!,!,!
160
+
161
+ #締め切り 名詞,一般,*,*,*,*,締め切り,シメキリ,シメキリ
162
+
163
+ #は 助詞,係助詞,*,*,*,*,は,ハ,ワ
164
+
165
+ #6月23日 名詞,一般,*,*,*,*,6月23日,,
166
+
167
+ #です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
168
+
169
+ #。 記号,句点,*,*,*,*,。,。,。
170
+
171
+ #
172
+
173
+ #O
174
+
175
+ ```
176
+
177
+
178
+
115
179
 
116
180
 
117
181
 

1

加筆修正

2017/06/22 03:44

投稿

swallowataill
swallowataill

スコア36

test CHANGED
File without changes
test CHANGED
@@ -2,7 +2,7 @@
2
2
 
3
3
  MeCabによる形態素解析の結果の一つ一つにタグをつけたいのですが、いまいちやり方がわかりません。
4
4
 
5
- 一行一行の結果の最後に下記の例のようにタグをつけたいです。
5
+ 一行一行の結果の行末に下記の例のようにタグをつけたいです。
6
6
 
7
7
 
8
8
 
@@ -60,9 +60,17 @@
60
60
 
61
61
  #。 記号,句点,*,*,*,*,。,。,。
62
62
 
63
+ ```
63
64
 
64
65
 
66
+
67
+ 出力したい結果は、以下のように各行の行末にOのようなタグがついた状態です。
68
+
65
- #タグをつけた状態
69
+ ```python
70
+
71
+ print(test)
72
+
73
+ #タグをつけた状態(期待する結果、タグはとりあえずOとする)
66
74
 
67
75
  #プログラミング 名詞,一般,*,*,*,*,プログラミング,,O
68
76