質問編集履歴

試したこと①の修正

2018/06/18 09:39

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -150,11 +150,7 @@
 from jaconv import hira2kata
-file = open('sample.csv', 'r')  #読み込みモードでオープン
+data = open('sample.csv', 'r').readlines()
-data = file.read()      #readですべて読み込む
 data_with_syn = []
@@ -164,6 +160,10 @@
+#結果　['\ufeffりんご\n', 'いぬ\n', 'いちご\n', 'くま\n', 'みかん\n', 'ねこ']
 for datum in data:
     ret = wn.synsets(datum, lang='jpn')
@@ -202,57 +202,27 @@
 ```
-Unknown word: .
+Unknown word: リンゴ
-Unknown word: リ.
-Unknown word: ン.
-Unknown word: ゴ.
-Unknown word:
-.
+.
-Unknown word: イ.
+Unknown word: イヌ
-Unknown word: ヌ.
-Unknown word:
-.
+.
-Unknown word: イ.
+Unknown word: イチゴ
-Unknown word: チ.
-Unknown word: ゴ.
-Unknown word:
-.
+.
-Unknown word: ク.
+Unknown word: クマ
-Unknown word: マ.
-Unknown word:
-.
+.
-Unknown word: カ.
+Unknown word: ミカン
-Unknown word: ン.
-Unknown word:
-.
+.
-Unknown word: ネ.
-Unknown word: コ.
-('ミ', Synset('mi.n.08'))
+('ネコ', Synset('cat.n.01'))
 ```

ご回答を受けて試したこと①の修正

2018/06/18 09:39

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -142,24 +142,26 @@
 ###ご回答を受けて試したこと
-①csvから読み込んだデータでもできるかどうか試しましたが、以下のようにエラーが出てしまいました。
+①csvから読み込んだデータでもできるかどうか試しましたが、以下の結果が出てしまいました、
 ```Python
-import pandas as pd
-import numpy as np
 from nltk.corpus import wordnet as wn
 from jaconv import hira2kata
-data = pd.read_csv('sample.csv', header=None)
+file = open('sample.csv', 'r')  #読み込みモードでオープン
+data = file.read()      #readですべて読み込む
 data_with_syn = []
+print(data)
 for datum in data:
@@ -196,19 +198,127 @@
+結果
+```
+Unknown word: .
+Unknown word: リ.
+Unknown word: ン.
+Unknown word: ゴ.
+Unknown word:
+.
+Unknown word: イ.
+Unknown word: ヌ.
+Unknown word:
+.
+Unknown word: イ.
+Unknown word: チ.
+Unknown word: ゴ.
+Unknown word:
+.
+Unknown word: ク.
+Unknown word: マ.
+Unknown word:
+.
+Unknown word: カ.
+Unknown word: ン.
+Unknown word:
+.
+Unknown word: ネ.
+Unknown word: コ.
+('ミ', Synset('mi.n.08'))
+```
+②単語を英語にした場合、jaconvは使えないため、エラー処理に困る
+```python
+from nltk.corpus import wordnet as wn
+#from jaconv import hira2kata
+data = ['apple', 'dog', "strawberry", 'bear', 'orange', 'cats']
+data_with_syn = []
+for datum in data:
+    ret = wn.synsets(datum, lang='en')
+    if ret:
+        data_with_syn.append((datum, ret[0]))
+        continue
+    #datum = hira2kata(datum)
+    #ret = wn.synsets(datum, lang='en')
+    #if ret:
+        #data_with_syn.append((datum, ret[0]))
+       # continue
+    print(f'Unknown word: {datum}.')
+print(*data_with_syn, sep='\n')
+```
 エラー文
 ```
 ---------------------------------------------------------------------------
-AttributeError                            Traceback (most recent call last)
+WordNetError                              Traceback (most recent call last)
-<ipython-input-16-9da0225fd0d7> in <module>()
+<ipython-input-29-f740c715a42a> in <module>()
       1 for datum in data:
-----> 2     ret = wn.synsets(datum, lang='jpn')
+----> 2     ret = wn.synsets(datum, lang='en')
       3     if ret:
@@ -220,96 +330,6 @@
 ~/.pyenv/versions/anaconda3-5.0.1/lib/python3.6/site-packages/nltk/corpus/reader/wordnet.py in synsets(self, lemma, pos, lang, check_exceptions)
-   1481         of that language will be returned.
-   1482         """
--> 1483         lemma = lemma.lower()
-   1484
-   1485         if lang == 'eng':
-AttributeError: 'numpy.int64' object has no attribute 'lower'
-```
-②単語を英語にした場合、jaconvは使えないため、エラー処理に困る
-```python
-from nltk.corpus import wordnet as wn
-#from jaconv import hira2kata
-data = ['apple', 'dog', "strawberry", 'bear', 'orange', 'cats']
-data_with_syn = []
-for datum in data:
-    ret = wn.synsets(datum, lang='en')
-    if ret:
-        data_with_syn.append((datum, ret[0]))
-        continue
-    #datum = hira2kata(datum)
-    #ret = wn.synsets(datum, lang='en')
-    #if ret:
-        #data_with_syn.append((datum, ret[0]))
-       # continue
-    print(f'Unknown word: {datum}.')
-print(*data_with_syn, sep='\n')
-```
-エラー文
-```
----------------------------------------------------------------------------
-WordNetError                              Traceback (most recent call last)
-<ipython-input-29-f740c715a42a> in <module>()
-      1 for datum in data:
-----> 2     ret = wn.synsets(datum, lang='en')
-      3     if ret:
-      4         data_with_syn.append((datum, ret[0]))
-      5         continue
-~/.pyenv/versions/anaconda3-5.0.1/lib/python3.6/site-packages/nltk/corpus/reader/wordnet.py in synsets(self, lemma, pos, lang, check_exceptions)
    1494
    1495         else:

試したことの追記

2018/06/18 09:29

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -142,7 +142,7 @@
 ###ご回答を受けて試したこと
-csvから読み込んだデータでもできるかどうか試しましたが、以下のようにエラーが出てしまいました。
+①csvから読み込んだデータでもできるかどうか試しましたが、以下のようにエラーが出てしまいました。
 ```Python
@@ -235,3 +235,107 @@
 AttributeError: 'numpy.int64' object has no attribute 'lower'
 ```
+②単語を英語にした場合、jaconvは使えないため、エラー処理に困る
+```python
+from nltk.corpus import wordnet as wn
+#from jaconv import hira2kata
+data = ['apple', 'dog', "strawberry", 'bear', 'orange', 'cats']
+data_with_syn = []
+for datum in data:
+    ret = wn.synsets(datum, lang='en')
+    if ret:
+        data_with_syn.append((datum, ret[0]))
+        continue
+    #datum = hira2kata(datum)
+    #ret = wn.synsets(datum, lang='en')
+    #if ret:
+        #data_with_syn.append((datum, ret[0]))
+       # continue
+    print(f'Unknown word: {datum}.')
+print(*data_with_syn, sep='\n')
+```
+エラー文
+```
+---------------------------------------------------------------------------
+WordNetError                              Traceback (most recent call last)
+<ipython-input-29-f740c715a42a> in <module>()
+      1 for datum in data:
+----> 2     ret = wn.synsets(datum, lang='en')
+      3     if ret:
+      4         data_with_syn.append((datum, ret[0]))
+      5         continue
+~/.pyenv/versions/anaconda3-5.0.1/lib/python3.6/site-packages/nltk/corpus/reader/wordnet.py in synsets(self, lemma, pos, lang, check_exceptions)
+   1494
+   1495         else:
+-> 1496             self._load_lang_data(lang)
+   1497             synset_list = []
+   1498             for l in self._lang_data[lang][1][lemma]:
+~/.pyenv/versions/anaconda3-5.0.1/lib/python3.6/site-packages/nltk/corpus/reader/wordnet.py in _load_lang_data(self, lang)
+   1135
+   1136         if lang not in self.langs():
+-> 1137             raise WordNetError("Language is not supported.")
+   1138
+   1139         f = self._omw_reader.open('{0:}/wn-data-{0:}.tab'.format(lang))
+WordNetError: Language is not supported.
+```

試したことの追記

2018/06/18 06:34

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -137,3 +137,101 @@
 Mac OS High Sierra
 Jupyter notebook 5.0.
+###ご回答を受けて試したこと
+csvから読み込んだデータでもできるかどうか試しましたが、以下のようにエラーが出てしまいました。
+```Python
+import pandas as pd
+import numpy as np
+from nltk.corpus import wordnet as wn
+from jaconv import hira2kata
+data = pd.read_csv('sample.csv', header=None)
+data_with_syn = []
+for datum in data:
+    ret = wn.synsets(datum, lang='jpn')
+    if ret:
+        data_with_syn.append((datum, ret[0]))
+        continue
+    datum = hira2kata(datum)
+    ret = wn.synsets(datum, lang='jpn')
+    if ret:
+        data_with_syn.append((datum, ret[0]))
+        continue
+    print(f'Unknown word: {datum}.')
+print(*data_with_syn, sep='\n')
+```
+エラー文
+```
+---------------------------------------------------------------------------
+AttributeError                            Traceback (most recent call last)
+<ipython-input-16-9da0225fd0d7> in <module>()
+      1 for datum in data:
+----> 2     ret = wn.synsets(datum, lang='jpn')
+      3     if ret:
+      4         data_with_syn.append((datum, ret[0]))
+      5         continue
+~/.pyenv/versions/anaconda3-5.0.1/lib/python3.6/site-packages/nltk/corpus/reader/wordnet.py in synsets(self, lemma, pos, lang, check_exceptions)
+   1481         of that language will be returned.
+   1482         """
+-> 1483         lemma = lemma.lower()
+   1484
+   1485         if lang == 'eng':
+AttributeError: 'numpy.int64' object has no attribute 'lower'
+```