編集履歴

質問編集履歴

2020/10/02 07:57

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

File without changes

7 619 1248

2020/10/02 07:57

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -31,6 +31,6 @@
 コード
 ```
-と打ち込んだところ実行を押しても何も動きませんでした...。［］のところには*ではなくちゃんと数字があります。ド文系で本当に初心者のため、その都度その都度調べてはいますが、コードの意味もよくわかっていなければ、専門用語もよくわかっていません。もし宜しければどうしてこのコードで動かないのか、教えていただけないでしょうか。
+と打ち込んだところ実行を押しても何も動きませんでした...。［］のところには*ではなくちゃんと数字があります。ド文系で本当に初心者のため、その都度その都度調べてはいますが、コードの意味もよくわかっていなければ、専門用語もよくわかっていません。もし宜しければどうしてこのコードで動かないのか、どうすれば動くようになるのか、教えていただけないでしょうか。
 補足情報としてはWindows10を使っています。

7 619 1248

2020/10/02 07:55

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -22,7 +22,7 @@
 words = [item[0]
          for item in items
-         if (item[0] not in ('EOS', '', 't', 'ー') and
+         if (item[0] not in ('EOS', '', 't', '一般') and
              item[1] == '名詞' and item[2] == '一般')]
 counter = Counter(words)

7 619 1248

2020/10/02 07:49

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -16,7 +16,7 @@
 text = f.read
 mecab = MeCab.Tagger()
-parse = mecab.parse(data)
+parse = mecab.parse('data')
 lines = parse.split('\n')
 items = (re.split('[\t,]', line) for line in lines)

7 619 1248

2020/10/02 07:48

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -5,7 +5,9 @@
 そして今度は名詞で頻出単語を抽出したいと思い、
+```ここに言語を入力
-```import MeCab
+import MeCab
 import sys
 import re
 from collections import Counter
@@ -27,6 +29,8 @@
 for word, count in counter.most_common():
     print(f"{word}: {count}")
+コード
+```
 と打ち込んだところ実行を押しても何も動きませんでした...。［］のところには*ではなくちゃんと数字があります。ド文系で本当に初心者のため、その都度その都度調べてはいますが、コードの意味もよくわかっていなければ、専門用語もよくわかっていません。もし宜しければどうしてこのコードで動かないのか、教えていただけないでしょうか。
 補足情報としてはWindows10を使っています。

7 619 1248

2020/10/02 07:46

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,25 +1,32 @@
-### 前提・実現したいこと
+＜すみません、こちらのサイトすらうまく使えておらずご迷惑をおかけしました...＞
-ここに質問の内容を詳しく書いてください。
-（例）PHP(CakePHP)で●●なシステムを作っています。
-■■な機能を実装中に以下のエラーメッセージが発生しました。
-### 発生している問題・エラーメッセージ
+文系大学4年生の初心者です。卒論で紙媒体のテキストを電子テキスト化し、頻出単語をMecabで抽出する作業を行なっています。jupyterでテキストを呼び起こすことやprint(c.most_common(50))などで頻出単語50個を抽出するところまでは2週間ほどかけてようやくできました...。
-```
-エラーメッセージ
+そして今度は名詞で頻出単語を抽出したいと思い、
-```
-### 該当のソースコード
+```import MeCab
+import sys
+import re
+from collections import Counter
+f = open("卒論テキスト.txt")
-```ここに言語名を入力
+text = f.read
-ソースコード
-```
-### 試したこと
+mecab = MeCab.Tagger()
+parse = mecab.parse(data)
+lines = parse.split('\n')
+items = (re.split('[\t,]', line) for line in lines)
+words = [item[0]
-ここに問題に対して試したことを記載してください。
+         for item in items
+         if (item[0] not in ('EOS', '', 't', 'ー') and
+             item[1] == '名詞' and item[2] == '一般')]
+counter = Counter(words)
+for word, count in counter.most_common():
-### 補足情報（FW/ツールのバージョンなど）
+    print(f"{word}: {count}")
+と打ち込んだところ実行を押しても何も動きませんでした...。［］のところには*ではなくちゃんと数字があります。ド文系で本当に初心者のため、その都度その都度調べてはいますが、コードの意味もよくわかっていなければ、専門用語もよくわかっていません。もし宜しければどうしてこのコードで動かないのか、教えていただけないでしょうか。
-ここにより詳細な情報を記載してください。
+補足情報としてはWindows10を使っています。

7 619 1248