回答編集履歴

追記

2018/06/18 06:45

投稿

スコア35660

test CHANGED Viewed

@@ -153,3 +153,59 @@
 [Synset('dog.n.01')]
 ```
+質問追記を受けて
+---
+> csvから読み込んだデータでもできるかどうか試しましたが、以下のようにエラーが出てしまいました。
+pandasのオブジェクトをそのまま渡しているからですね。
+個人的にはpandasどころかcsvもいらないと思います。テキストファイルで良いのでは。
+> 単語を英語にした場合、jaconvは使えないため、エラー処理に困る
+[str.isalpha](https://docs.python.jp/3/library/stdtypes.html#str.isalpha)を使えば...
+```Python
+>>> 'いぬ'.isalpha()
+True
+>>> 'dog'.isalpha()
+True
+```
+**えっ？**
+[Qiita - [修正] Python 文字列の英数字判定でハマった](https://qiita.com/fujiy/items/f738aa9d0bb7427e07a4)
+こう書かねばならないようです。
+```Python
+>>> 'いぬ'.encode('utf-8').isalpha()
+False
+>>> 'dog'.encode('utf-8').isalpha()
+True
+```

追記

2018/06/18 06:45

投稿

スコア35660

test CHANGED Viewed

@@ -125,3 +125,31 @@
 良い感じですね。
+追記2
+---
+これ、『政府の犬』とかそっちの方の『いぬ』ですね...
+```Python
+>>> wn.synsets('いぬ', lang='jpn')
+[Synset('spy.n.01')]
+>>> wn.synsets('spy')
+[Synset('spy.n.01'), Synset('spy.n.02'), Synset('descry.v.01'), Synset('spy.v.02'), Synset('spy.v.03'), Synset('spy.v.04')]
+>>>
+>>> wn.synsets('イヌ', lang='jpn')
+[Synset('dog.n.01')]
+```

修正

2018/06/18 04:40

投稿

スコア35660

test CHANGED Viewed

@@ -15,8 +15,6 @@
 ```
----
 返り値を見て、未登録の場合は別フローに入るべきかと。
@@ -96,7 +94,11 @@
+    print(f'Unknown word: {datum}.')
-print(*data_with_syn, sep='\n')  # [('いぬ', Synset('spy.n.01'))]
+print(*data_with_syn, sep='\n')
 ```

追記

2018/06/18 04:37

投稿

スコア35660

test CHANGED Viewed

@@ -49,3 +49,77 @@
 『いぬ』しかないですね。
+追記
+---
+[jaconv](https://pypi.org/project/jaconv/)という良さげなモジュールがあったので、使ってみました。
+```Python
+from nltk.corpus import wordnet as wn
+from jaconv import hira2kata
+data = ['りんご', 'いぬ', 'いちご', 'くま', 'みかん', 'ねこ']
+data_with_syn = []
+for datum in data:
+    ret = wn.synsets(datum, lang='jpn')
+    if ret:
+        data_with_syn.append((datum, ret[0]))
+        continue
+    datum = hira2kata(datum)
+    ret = wn.synsets(datum, lang='jpn')
+    if ret:
+        data_with_syn.append((datum, ret[0]))
+        continue
+print(*data_with_syn, sep='\n')  # [('いぬ', Synset('spy.n.01'))]
+```
+**標準出力**
+```plain
+('リンゴ', Synset('apple.n.01'))
+('いぬ', Synset('spy.n.01'))
+('イチゴ', Synset('strawberry.n.01'))
+('クマ', Synset('bear.n.01'))
+('ミカン', Synset('orange.n.01'))
+('ネコ', Synset('cat.n.01'))
+```
+良い感じですね。