編集履歴

質問編集履歴

追記の修正

2018/07/12 00:48

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -192,9 +192,9 @@
  ###追記
-以下のコードを実行すると、名詞のみの単語リストは作れるのですが、
+以下のコードを実行すると求めたい出力を得ることはできましたが、
-出力が繰り繰り返されるため、後どの点を修正すればいいか教えていただきたいです。
+少々冗長なので、どうすればより効率の良いコードになるか教えていただきたいです。
 ```python
@@ -214,7 +214,11 @@
     result.extend(nltk.pos_tag(nltk.word_tokenize(word)))
+    print(word)
-     #for word in result:
+for word in result:
     s = {'NN', 'NNP', 'NNPS', 'NNS'}
@@ -222,62 +226,24 @@
     selected_wordsets.extend(selected_word)
+    break;
+selected_wordsets
-    #for word in selected_wordsets:
+for word in selected_wordsets:
     ans_word =[word for word, tag in selected_wordsets]
     ans_wordsets.extend(ans_word)
+    break;
 ans_wordsets
 ```
-出力
-```
-['beef',
- 'beef',
- 'beef',
- 'chicken',
- 'beef',
- 'beef',
- 'chicken',
- 'beef',
- 'chicken',
- 'meat',
- 'beef',
- 'beef',
- 'chicken',
- 'beef',
- 'chicken',
- 'meat',
- 'beef',
- 'chicken',
- 'meat',
- 'pork']
-```

追記のコードの編集

2018/07/12 00:48

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -198,6 +198,10 @@
 ```python
+words = ['beef', 'boiled chicken', 'processed meat', 'pork']
 result = []
 selected_wordsets = []

追記を追加

2018/07/11 22:04

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -190,6 +190,90 @@
 ```
+ ###追記
+以下のコードを実行すると、名詞のみの単語リストは作れるのですが、
+出力が繰り繰り返されるため、後どの点を修正すればいいか教えていただきたいです。
+```python
+result = []
+selected_wordsets = []
+ans_wordsets = []
+import nltk
+for word in words:
+    result.extend(nltk.pos_tag(nltk.word_tokenize(word)))
+     #for word in result:
+    s = {'NN', 'NNP', 'NNPS', 'NNS'}
+    selected_word = [(word, tag) for word, tag in result if tag in s]
+    selected_wordsets.extend(selected_word)
+    #for word in selected_wordsets:
+    ans_word =[word for word, tag in selected_wordsets]
+    ans_wordsets.extend(ans_word)
+ans_wordsets
+```
+出力
+```
+['beef',
+ 'beef',
+ 'beef',
+ 'chicken',
+ 'beef',
+ 'beef',
+ 'chicken',
+ 'beef',
+ 'chicken',
+ 'meat',
+ 'beef',
+ 'beef',
+ 'chicken',
+ 'beef',
+ 'chicken',
+ 'meat',
+ 'beef',
+ 'chicken',
+ 'meat',
+ 'pork']
+```

エラー文の追記と現状のコードの修正

2018/07/11 11:47

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -20,15 +20,61 @@
-現状のコードだと
+現状のコードだと以下のエラーが出てしまうため、
-```
+```
+---------------------------------------------------------------------------
+ValueError                                Traceback (most recent call last)
+<ipython-input-38-45defa4ddf68> in <module>()
-['pork']
+      1 for word in result:
+      2     s = {'NN', 'NNP', 'NNPS', 'NNS'}
+----> 3     selected_wordsets.append( [(word, tag) for word, tag in result if tag in s])
+      4 selected_wordsets
+      5
+<ipython-input-38-45defa4ddf68> in <listcomp>(.0)
+      1 for word in result:
+      2     s = {'NN', 'NNP', 'NNPS', 'NNS'}
+----> 3     selected_wordsets.append( [(word, tag) for word, tag in result if tag in s])
+      4 selected_wordsets
+      5
+ValueError: not enough values to unpack (expected 2, got 1)
+ File "<ipython-input-39-74a608359c14>", line 2
+    ans.append(word for word, tag in selected_wordsets])
+                                                      ^
+SyntaxError: invalid syntax
-```
+```
-しか出力されないため、どのように修正すれば良いかアドバイスをいただきたいです。
+どのように修正すれば良いかアドバイスをいただきたいです。
@@ -46,19 +92,33 @@
 result = []
+selected_wordsets = []
+ans = []
 import nltk
 for word in words:
-    result = nltk.pos_tag(nltk.word_tokenize(word))
+    result.append(nltk.pos_tag(nltk.word_tokenize(word)))
+result
+for word in result:
     s = {'NN', 'NNP', 'NNPS', 'NNS'}
-    selected_wordsets = [(word, tag) for word, tag in result if tag in s]
+    selected_wordsets.append( [(word, tag) for word, tag in result if tag in s])
+selected_wordsets
+for word in selected_wordsets:
-    ans = [word for word, tag in selected_wordsets]
+    ans.append(word for word, tag in selected_wordsets])
-result
 ans
@@ -66,6 +126,24 @@
+出力
+```
+#result
+[[('beef', 'NN')],
+ [('boiled', 'VBN'), ('chicken', 'NN')],
+ [('processed', 'VBN'), ('meat', 'NN')],
+ [('pork', 'NN')]]
+```
 ### 試したこと
 形態素解析を行った後、名詞のみを取り出してリストに加えることはできています。
@@ -112,6 +190,16 @@
 ```
 ### 補足情報（FW/ツールのバージョンなど）
 Python 3.6