質問編集履歴
5
test
CHANGED
File without changes
|
test
CHANGED
@@ -36,105 +36,7 @@
|
|
36
36
|
|
37
37
|
最初にmecabの形態素解析の名詞のみの抽出のコードと、次に、dbからcookpadのレシピを5つ取り出してきたコードを載せました。これを組み合わせたいです。
|
38
38
|
|
39
|
-
```import MeCab
|
40
|
-
|
41
|
-
mecab = MeCab.Tagger ('/usr/local/lib/mecab/dic/mecab-ipadic-neologd')
|
42
|
-
|
43
|
-
text = '解析したいテキスト'
|
44
|
-
|
45
|
-
mecab.parse('')
|
46
|
-
|
47
|
-
node = mecab.parseToNode(text)
|
48
|
-
|
49
|
-
while node:
|
50
|
-
|
51
|
-
word = node.surface
|
52
|
-
|
53
|
-
pos = node.feature.split(",")[1]
|
54
|
-
|
55
|
-
print('{0} , {1}'.format(word, pos))
|
56
|
-
|
57
|
-
node = node.next
|
58
|
-
|
59
|
-
|
60
|
-
|
61
|
-
|
62
|
-
|
63
|
-
text = input("解析する文章を入力してください:")
|
64
|
-
|
65
|
-
result = mecab.parse(text)
|
66
|
-
|
67
|
-
print(result)
|
68
|
-
|
69
|
-
|
70
|
-
|
71
|
-
lines = result.split('\n')
|
72
|
-
|
73
|
-
nounAndVerb = []#「名詞」と「動詞」を格納するリスト
|
74
|
-
|
75
|
-
for line in lines:
|
76
|
-
|
77
|
-
feature = line.split('\t')
|
78
|
-
|
79
|
-
if len(feature) == 2: #'EOS'と''を省く
|
80
|
-
|
81
|
-
info = feature[1].split(',')
|
82
|
-
|
83
|
-
hinshi = info[0]
|
84
|
-
|
85
|
-
if hinshi in ('名詞', ):
|
86
|
-
|
87
|
-
nounAndVerb.append(info[6])
|
88
|
-
|
89
|
-
|
90
|
-
|
91
|
-
nounAndVerb
|
92
|
-
|
93
|
-
|
94
|
-
|
95
|
-
from pymongo import MongoClient
|
96
|
-
|
97
|
-
from bs4 import BeautifulSoup
|
98
|
-
|
99
|
-
|
100
|
-
|
101
|
-
|
102
|
-
|
103
|
-
def main():
|
104
|
-
|
105
|
-
client = MongoClient('localhost', 27017)
|
106
|
-
|
107
|
-
db = client.html.cookpad_html
|
108
|
-
|
109
|
-
collection = db.test_collection
|
110
|
-
|
111
|
-
|
112
|
-
|
113
|
-
htmls = list(db.find().limit(5))
|
114
|
-
|
115
|
-
|
116
|
-
|
117
|
-
for num, html in enumerate(htmls):
|
118
|
-
|
119
|
-
soup = BeautifulSoup(html["html"], 'lxml')
|
120
|
-
|
121
|
-
print("---------------{}番目のレシピ---------------".format(num))
|
122
|
-
|
123
|
-
for steps in soup.find_all(attrs={"class": "step_text"}):
|
124
|
-
|
125
|
-
|
126
|
-
|
127
|
-
print(steps.get_text())
|
128
|
-
|
129
|
-
|
130
|
-
|
131
|
-
|
132
|
-
|
133
|
-
if __name__ == "__main__":
|
134
|
-
|
135
|
-
|
39
|
+
`
|
136
|
-
|
137
|
-
|
138
40
|
|
139
41
|
### 試したこと
|
140
42
|
|
4
test
CHANGED
File without changes
|
test
CHANGED
@@ -16,7 +16,7 @@
|
|
16
16
|
|
17
17
|
```
|
18
18
|
|
19
|
-
エラーメッセージ どうやって、
|
19
|
+
エラーメッセージ どうやって、名詞のみの抽出とdbから取り出してみた文を組み合わせればいいのかわかりません。
|
20
20
|
|
21
21
|
```
|
22
22
|
|
@@ -28,7 +28,7 @@
|
|
28
28
|
|
29
29
|
```ここに言語名を入力
|
30
30
|
|
31
|
-
|
31
|
+
mecab
|
32
32
|
|
33
33
|
|
34
34
|
|
3
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -36,17 +36,9 @@
|
|
36
36
|
|
37
37
|
最初にmecabの形態素解析の名詞のみの抽出のコードと、次に、dbからcookpadのレシピを5つ取り出してきたコードを載せました。これを組み合わせたいです。
|
38
38
|
|
39
|
-
```lang-言語名pythonテキスト
|
40
|
-
|
41
|
-
|
42
|
-
|
43
|
-
import MeCab
|
39
|
+
```import MeCab
|
44
|
-
|
45
|
-
|
46
40
|
|
47
41
|
mecab = MeCab.Tagger ('/usr/local/lib/mecab/dic/mecab-ipadic-neologd')
|
48
|
-
|
49
|
-
|
50
42
|
|
51
43
|
text = '解析したいテキスト'
|
52
44
|
|
@@ -55,8 +47,6 @@
|
|
55
47
|
node = mecab.parseToNode(text)
|
56
48
|
|
57
49
|
while node:
|
58
|
-
|
59
|
-
|
60
50
|
|
61
51
|
word = node.surface
|
62
52
|
|
@@ -142,11 +132,7 @@
|
|
142
132
|
|
143
133
|
if __name__ == "__main__":
|
144
134
|
|
145
|
-
main()
|
135
|
+
main()```
|
146
|
-
|
147
|
-
|
148
|
-
|
149
|
-
```
|
150
136
|
|
151
137
|
|
152
138
|
|
2
コードが直せません
test
CHANGED
File without changes
|
test
CHANGED
@@ -36,7 +36,9 @@
|
|
36
36
|
|
37
37
|
最初にmecabの形態素解析の名詞のみの抽出のコードと、次に、dbからcookpadのレシピを5つ取り出してきたコードを載せました。これを組み合わせたいです。
|
38
38
|
|
39
|
-
```lang-
|
39
|
+
```lang-言語名pythonテキスト
|
40
|
+
|
41
|
+
|
40
42
|
|
41
43
|
import MeCab
|
42
44
|
|
1
直してみました。
test
CHANGED
File without changes
|
test
CHANGED
@@ -16,7 +16,7 @@
|
|
16
16
|
|
17
17
|
```
|
18
18
|
|
19
|
-
エラーメッセージ
|
19
|
+
エラーメッセージ どうやって、mecabの形態素解析の名詞のみの抽出とdbから取り出してみた文を組み合わせればいいのかわかりません。
|
20
20
|
|
21
21
|
```
|
22
22
|
|
@@ -34,7 +34,9 @@
|
|
34
34
|
|
35
35
|
ソースコード
|
36
36
|
|
37
|
+
最初にmecabの形態素解析の名詞のみの抽出のコードと、次に、dbからcookpadのレシピを5つ取り出してきたコードを載せました。これを組み合わせたいです。
|
38
|
+
|
37
|
-
```
|
39
|
+
```lang-
|
38
40
|
|
39
41
|
import MeCab
|
40
42
|
|
@@ -142,7 +144,7 @@
|
|
142
144
|
|
143
145
|
|
144
146
|
|
145
|
-
|
147
|
+
```
|
146
148
|
|
147
149
|
|
148
150
|
|