質問編集履歴
7
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -98,7 +98,7 @@
|
|
98
98
|
|
99
99
|
|
100
100
|
|
101
|
-
|
101
|
+
```
|
102
102
|
|
103
103
|
```Python
|
104
104
|
|
6
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -40,7 +40,7 @@
|
|
40
40
|
|
41
41
|
d = {
|
42
42
|
|
43
|
-
category
|
43
|
+
'category' : "urlを入力して下さい。"
|
44
44
|
|
45
45
|
}
|
46
46
|
|
@@ -52,7 +52,7 @@
|
|
52
52
|
|
53
53
|
soup = BeautifulSoup(r.text, 'lxml')
|
54
54
|
|
55
|
-
|
55
|
+
doc = soup.find_all('p')
|
56
56
|
|
57
57
|
|
58
58
|
|
@@ -60,27 +60,29 @@
|
|
60
60
|
|
61
61
|
word_list=''
|
62
62
|
|
63
|
-
|
63
|
+
for text in doc:
|
64
64
|
|
65
|
-
m
|
65
|
+
m = MeCab.Tagger()
|
66
66
|
|
67
|
-
|
67
|
+
m_text = m.parse(text.text)
|
68
68
|
|
69
|
-
|
69
|
+
for row in m_text.split("\n"):
|
70
70
|
|
71
|
-
|
71
|
+
word =row.split("\t")[0]#タブ区切りになっている1つ目を取り出す。ここには形態素が格納されている
|
72
72
|
|
73
|
-
|
73
|
+
if word == "EOS":
|
74
74
|
|
75
|
-
e
|
75
|
+
break
|
76
76
|
|
77
|
-
|
77
|
+
else:
|
78
78
|
|
79
|
-
s
|
79
|
+
pos = row.split("\t")[1]#タブ区切りになっている2つ目を取り出す。ここには品詞が格納されている
|
80
80
|
|
81
|
-
|
81
|
+
slice = pos[:2]
|
82
82
|
|
83
|
+
if slice == "名詞":
|
84
|
+
|
83
|
-
word_list = word_list +" "+ word
|
85
|
+
word_list = word_list +" "+ word
|
84
86
|
|
85
87
|
|
86
88
|
|
@@ -93,8 +95,6 @@
|
|
93
95
|
|
94
96
|
|
95
97
|
return render(request, 'classifier/index.html',d)
|
96
|
-
|
97
|
-
```
|
98
98
|
|
99
99
|
|
100
100
|
|
5
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -34,15 +34,17 @@
|
|
34
34
|
|
35
35
|
url = request.GET.get('url')
|
36
36
|
|
37
|
-
|
37
|
+
|
38
38
|
|
39
39
|
if url == None:
|
40
40
|
|
41
|
+
d = {
|
42
|
+
|
41
|
-
category = "urlを入力して下さい。"
|
43
|
+
category = "urlを入力して下さい。"
|
44
|
+
|
45
|
+
}
|
42
46
|
|
43
47
|
else:
|
44
|
-
|
45
|
-
#/追加(1)
|
46
48
|
|
47
49
|
# 入力されたURLでの本文を取得する。
|
48
50
|
|
@@ -82,11 +84,11 @@
|
|
82
84
|
|
83
85
|
|
84
86
|
|
85
|
-
d = {
|
87
|
+
d = {
|
86
88
|
|
87
|
-
'category': word_list
|
89
|
+
'category': word_list
|
88
90
|
|
89
|
-
}
|
91
|
+
}
|
90
92
|
|
91
93
|
|
92
94
|
|
4
urlがNoneの場合
test
CHANGED
File without changes
|
test
CHANGED
@@ -14,6 +14,8 @@
|
|
14
14
|
|
15
15
|
|
16
16
|
|
17
|
+
**・urlがNoneの場合の処理をviews.pyに追加**
|
18
|
+
|
17
19
|
```Python
|
18
20
|
|
19
21
|
#Views.py
|
@@ -28,61 +30,71 @@
|
|
28
30
|
|
29
31
|
def index(request):
|
30
32
|
|
33
|
+
|
34
|
+
|
31
35
|
url = request.GET.get('url')
|
36
|
+
|
37
|
+
#追加(1)
|
38
|
+
|
39
|
+
if url == None:
|
40
|
+
|
41
|
+
category = "urlを入力して下さい。"
|
42
|
+
|
43
|
+
else:
|
44
|
+
|
45
|
+
#/追加(1)
|
46
|
+
|
47
|
+
# 入力されたURLでの本文を取得する。
|
48
|
+
|
49
|
+
r = requests.get(url)
|
50
|
+
|
51
|
+
soup = BeautifulSoup(r.text, 'lxml')
|
52
|
+
|
53
|
+
text = soup.find_all('p')
|
32
54
|
|
33
55
|
|
34
56
|
|
35
|
-
#
|
57
|
+
#取得した本文を形態素解析し、名詞のみ抽出
|
36
58
|
|
37
|
-
|
59
|
+
word_list=''
|
38
60
|
|
39
|
-
|
61
|
+
m = MeCab.Tagger()
|
40
62
|
|
41
|
-
text =
|
63
|
+
m_text = m.parse(text.text)
|
64
|
+
|
65
|
+
for row in m_text.split("\n"):
|
66
|
+
|
67
|
+
word =row.split("\t")[0]#タブ区切りになっている1つ目を取り出す。ここには形態素が格納されている
|
68
|
+
|
69
|
+
if word == "EOS":
|
70
|
+
|
71
|
+
break
|
72
|
+
|
73
|
+
else:
|
74
|
+
|
75
|
+
pos = row.split("\t")[1]#タブ区切りになっている2つ目を取り出す。ここには品詞が格納されている
|
76
|
+
|
77
|
+
slice = pos[:2]
|
78
|
+
|
79
|
+
if slice == "名詞":
|
80
|
+
|
81
|
+
word_list = word_list +" "+ word
|
42
82
|
|
43
83
|
|
44
84
|
|
45
|
-
#取得した本文を形態素解析し、名詞のみ抽出
|
46
|
-
|
47
|
-
word_list=''
|
48
|
-
|
49
|
-
m = MeCab.Tagger()
|
50
|
-
|
51
|
-
m_text = m.parse(text.text)
|
52
|
-
|
53
|
-
for row in m_text.split("\n"):
|
54
|
-
|
55
|
-
word =row.split("\t")[0]#タブ区切りになっている1つ目を取り出す。ここには形態素が格納されている
|
56
|
-
|
57
|
-
if word == "EOS":
|
58
|
-
|
59
|
-
break
|
60
|
-
|
61
|
-
else:
|
62
|
-
|
63
|
-
pos = row.split("\t")[1]#タブ区切りになっている2つ目を取り出す。ここには品詞が格納されている
|
64
|
-
|
65
|
-
slice = pos[:2]
|
66
|
-
|
67
|
-
if slice == "名詞":
|
68
|
-
|
69
|
-
word_list = word_list +" "+ word
|
70
|
-
|
71
|
-
return word_list
|
72
|
-
|
73
|
-
|
74
|
-
|
75
85
|
d = {
|
76
86
|
|
77
|
-
'category': wordlist
|
87
|
+
'category': word_list
|
78
88
|
|
79
89
|
}
|
80
90
|
|
81
91
|
|
82
92
|
|
83
|
-
return render(request, 'index.html',d)
|
93
|
+
return render(request, 'classifier/index.html',d)
|
84
94
|
|
85
95
|
```
|
96
|
+
|
97
|
+
|
86
98
|
|
87
99
|
|
88
100
|
|
3
追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -80,7 +80,7 @@
|
|
80
80
|
|
81
81
|
|
82
82
|
|
83
|
-
return render(request, '
|
83
|
+
return render(request, 'index.html',d)
|
84
84
|
|
85
85
|
```
|
86
86
|
|
2
追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -3,6 +3,10 @@
|
|
3
3
|
|
4
4
|
|
5
5
|
例えば、フォームにyahoo.comと入力した場合、そのURLでの本文を取得し表示。
|
6
|
+
|
7
|
+
|
8
|
+
|
9
|
+
下記はローカルでhttp://localhost:8000/index/にアクセスした際に起こるエラーです。
|
6
10
|
|
7
11
|
|
8
12
|
|
1
誤字
test
CHANGED
File without changes
|
test
CHANGED
@@ -116,4 +116,8 @@
|
|
116
116
|
|
117
117
|
|
118
118
|
|
119
|
-
かれこれ3時間ほど悩んでいるのです
|
119
|
+
かれこれ3時間ほど悩んでいるのですが、解決できません。。よろしくお願いします。
|
120
|
+
|
121
|
+
|
122
|
+
|
123
|
+
また、エラーの解決に必要なファイルがあれば追加するので、お申し付けください。
|