teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

6

2020/10/02 07:57

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
File without changes

5

2020/10/02 07:57

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -31,6 +31,6 @@
31
31
 
32
32
  コード
33
33
  ```
34
- と打ち込んだところ実行を押しても何も動きませんでした...。[]のところには*ではなくちゃんと数字があります。ド文系で本当に初心者のため、その都度その都度調べてはいますが、コードの意味もよくわかっていなければ、専門用語もよくわかっていません。もし宜しければどうしてこのコードで動かないのか、教えていただけないでしょうか。
34
+ と打ち込んだところ実行を押しても何も動きませんでした...。[]のところには*ではなくちゃんと数字があります。ド文系で本当に初心者のため、その都度その都度調べてはいますが、コードの意味もよくわかっていなければ、専門用語もよくわかっていません。もし宜しければどうしてこのコードで動かないのか、どうすれば動くようになるのか、教えていただけないでしょうか。
35
35
 
36
36
  補足情報としてはWindows10を使っています。

4

2020/10/02 07:55

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -22,7 +22,7 @@
22
22
 
23
23
  words = [item[0]
24
24
  for item in items
25
- if (item[0] not in ('EOS', '', 't', '') and
25
+ if (item[0] not in ('EOS', '', 't', '一般') and
26
26
  item[1] == '名詞' and item[2] == '一般')]
27
27
 
28
28
  counter = Counter(words)

3

2020/10/02 07:49

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -16,7 +16,7 @@
16
16
  text = f.read
17
17
 
18
18
  mecab = MeCab.Tagger()
19
- parse = mecab.parse(data)
19
+ parse = mecab.parse('data')
20
20
  lines = parse.split('\n')
21
21
  items = (re.split('[\t,]', line) for line in lines)
22
22
 

2

2020/10/02 07:48

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -5,7 +5,9 @@
5
5
 
6
6
  そして今度は名詞で頻出単語を抽出したいと思い、
7
7
 
8
+ ```ここに言語を入力
9
+
8
- ```import MeCab
10
+ import MeCab
9
11
  import sys
10
12
  import re
11
13
  from collections import Counter
@@ -27,6 +29,8 @@
27
29
  for word, count in counter.most_common():
28
30
  print(f"{word}: {count}")
29
31
 
32
+ コード
33
+ ```
30
34
  と打ち込んだところ実行を押しても何も動きませんでした...。[]のところには*ではなくちゃんと数字があります。ド文系で本当に初心者のため、その都度その都度調べてはいますが、コードの意味もよくわかっていなければ、専門用語もよくわかっていません。もし宜しければどうしてこのコードで動かないのか、教えていただけないでしょうか。
31
35
 
32
36
  補足情報としてはWindows10を使っています。

1

2020/10/02 07:46

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -1,25 +1,32 @@
1
- ### 前提・実現したいこと
1
+ <すみません、こちらのサイトすらうまく使えておらずご迷惑をおかけまし...>
2
2
 
3
- ここに質問の内容を詳しく書いてください。
4
- (例)PHP(CakePHP)で●●なシステムを作っています。
5
- ■■な機能を実装中に以下のエラーメッセージが発生しました。
6
3
 
7
- ### 発生している問題・エラーメッセージ
4
+ 文系大学4年の初心者です。卒論で紙媒体のテキストを電子テキスト化、頻出単語をMecabで抽出する作業を行なっています。jupyterでテキストを呼び起こすことやprint(c.most_common(50))などで頻出単語50個を抽出すところまでは2週間ほどかけてようやくできました...。
8
5
 
9
- ```
10
- エラーメッセージ
6
+ そして今度は名詞で頻出単語を抽出したいと思い、
11
- ```
12
7
 
13
- ### 該当のソースコード
8
+ ```import MeCab
9
+ import sys
10
+ import re
11
+ from collections import Counter
14
12
 
13
+ f = open("卒論テキスト.txt")
15
- ```ここに言語名を入力
14
+ text = f.read
16
- ソースコード
17
- ```
18
15
 
19
- ### 試したこと
16
+ mecab = MeCab.Tagger()
17
+ parse = mecab.parse(data)
18
+ lines = parse.split('\n')
19
+ items = (re.split('[\t,]', line) for line in lines)
20
20
 
21
+ words = [item[0]
21
- ここに問題に対して試したことを記載してください。
22
+ for item in items
23
+ if (item[0] not in ('EOS', '', 't', 'ー') and
24
+ item[1] == '名詞' and item[2] == '一般')]
22
25
 
26
+ counter = Counter(words)
27
+ for word, count in counter.most_common():
23
- ### 補足情報(FW/ツールのバージョンなど)
28
+ print(f"{word}: {count}")
24
29
 
30
+ と打ち込んだところ実行を押しても何も動きませんでした...。[]のところには*ではなくちゃんと数字があります。ド文系で本当に初心者のため、その都度その都度調べてはいますが、コードの意味もよくわかっていなければ、専門用語もよくわかっていません。もし宜しければどうしてこのコードで動かないのか、教えていただけないでしょうか。
31
+
25
- ここにより詳細な情報を記載してください。
32
+ 補足情報してはWindows10を使ってます