質問編集履歴
6
title
CHANGED
File without changes
|
body
CHANGED
File without changes
|
5
title
CHANGED
File without changes
|
body
CHANGED
@@ -31,6 +31,6 @@
|
|
31
31
|
|
32
32
|
コード
|
33
33
|
```
|
34
|
-
と打ち込んだところ実行を押しても何も動きませんでした...。[]のところには*ではなくちゃんと数字があります。ド文系で本当に初心者のため、その都度その都度調べてはいますが、コードの意味もよくわかっていなければ、専門用語もよくわかっていません。もし宜しければどうしてこのコードで動かないのか、教えていただけないでしょうか。
|
34
|
+
と打ち込んだところ実行を押しても何も動きませんでした...。[]のところには*ではなくちゃんと数字があります。ド文系で本当に初心者のため、その都度その都度調べてはいますが、コードの意味もよくわかっていなければ、専門用語もよくわかっていません。もし宜しければどうしてこのコードで動かないのか、どうすれば動くようになるのか、教えていただけないでしょうか。
|
35
35
|
|
36
36
|
補足情報としてはWindows10を使っています。
|
4
title
CHANGED
File without changes
|
body
CHANGED
@@ -22,7 +22,7 @@
|
|
22
22
|
|
23
23
|
words = [item[0]
|
24
24
|
for item in items
|
25
|
-
if (item[0] not in ('EOS', '', 't', '
|
25
|
+
if (item[0] not in ('EOS', '', 't', '一般') and
|
26
26
|
item[1] == '名詞' and item[2] == '一般')]
|
27
27
|
|
28
28
|
counter = Counter(words)
|
3
title
CHANGED
File without changes
|
body
CHANGED
@@ -16,7 +16,7 @@
|
|
16
16
|
text = f.read
|
17
17
|
|
18
18
|
mecab = MeCab.Tagger()
|
19
|
-
parse = mecab.parse(data)
|
19
|
+
parse = mecab.parse('data')
|
20
20
|
lines = parse.split('\n')
|
21
21
|
items = (re.split('[\t,]', line) for line in lines)
|
22
22
|
|
2
title
CHANGED
File without changes
|
body
CHANGED
@@ -5,7 +5,9 @@
|
|
5
5
|
|
6
6
|
そして今度は名詞で頻出単語を抽出したいと思い、
|
7
7
|
|
8
|
+
```ここに言語を入力
|
9
|
+
|
8
|
-
|
10
|
+
import MeCab
|
9
11
|
import sys
|
10
12
|
import re
|
11
13
|
from collections import Counter
|
@@ -27,6 +29,8 @@
|
|
27
29
|
for word, count in counter.most_common():
|
28
30
|
print(f"{word}: {count}")
|
29
31
|
|
32
|
+
コード
|
33
|
+
```
|
30
34
|
と打ち込んだところ実行を押しても何も動きませんでした...。[]のところには*ではなくちゃんと数字があります。ド文系で本当に初心者のため、その都度その都度調べてはいますが、コードの意味もよくわかっていなければ、専門用語もよくわかっていません。もし宜しければどうしてこのコードで動かないのか、教えていただけないでしょうか。
|
31
35
|
|
32
36
|
補足情報としてはWindows10を使っています。
|
1
title
CHANGED
File without changes
|
body
CHANGED
@@ -1,25 +1,32 @@
|
|
1
|
-
|
1
|
+
<すみません、こちらのサイトすらうまく使えておらずご迷惑をおかけしました...>
|
2
2
|
|
3
|
-
ここに質問の内容を詳しく書いてください。
|
4
|
-
(例)PHP(CakePHP)で●●なシステムを作っています。
|
5
|
-
■■な機能を実装中に以下のエラーメッセージが発生しました。
|
6
3
|
|
7
|
-
|
4
|
+
文系大学4年生の初心者です。卒論で紙媒体のテキストを電子テキスト化し、頻出単語をMecabで抽出する作業を行なっています。jupyterでテキストを呼び起こすことやprint(c.most_common(50))などで頻出単語50個を抽出するところまでは2週間ほどかけてようやくできました...。
|
8
5
|
|
9
|
-
```
|
10
|
-
|
6
|
+
そして今度は名詞で頻出単語を抽出したいと思い、
|
11
|
-
```
|
12
7
|
|
13
|
-
|
8
|
+
```import MeCab
|
9
|
+
import sys
|
10
|
+
import re
|
11
|
+
from collections import Counter
|
14
12
|
|
13
|
+
f = open("卒論テキスト.txt")
|
15
|
-
|
14
|
+
text = f.read
|
16
|
-
ソースコード
|
17
|
-
```
|
18
15
|
|
19
|
-
|
16
|
+
mecab = MeCab.Tagger()
|
17
|
+
parse = mecab.parse(data)
|
18
|
+
lines = parse.split('\n')
|
19
|
+
items = (re.split('[\t,]', line) for line in lines)
|
20
20
|
|
21
|
+
words = [item[0]
|
21
|
-
|
22
|
+
for item in items
|
23
|
+
if (item[0] not in ('EOS', '', 't', 'ー') and
|
24
|
+
item[1] == '名詞' and item[2] == '一般')]
|
22
25
|
|
26
|
+
counter = Counter(words)
|
27
|
+
for word, count in counter.most_common():
|
23
|
-
|
28
|
+
print(f"{word}: {count}")
|
24
29
|
|
30
|
+
と打ち込んだところ実行を押しても何も動きませんでした...。[]のところには*ではなくちゃんと数字があります。ド文系で本当に初心者のため、その都度その都度調べてはいますが、コードの意味もよくわかっていなければ、専門用語もよくわかっていません。もし宜しければどうしてこのコードで動かないのか、教えていただけないでしょうか。
|
31
|
+
|
25
|
-
|
32
|
+
補足情報としてはWindows10を使っています。
|