teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

2

pyokakaはライブラリとしても使えるよ

2019/07/14 07:21

投稿

raccy
raccy

スコア21767

answer CHANGED
@@ -2,7 +2,7 @@
2
2
 
3
3
  - [romkan](https://pypi.org/project/romkan/)
4
4
  - [jTransliterate](https://pypi.org/project/jTransliterate/) ※ 開発停止しているためPython3で動作するか不明
5
- - [pyokaka](https://pypi.org/project/pyokaka/) ※ ライブラリではなくツール
5
+ - [pyokaka](https://pypi.org/project/pyokaka/) ※ ライブラリとしてだけではなくツールとしても使用可能
6
6
  - [romajitable](https://pypi.org/project/romajitable/)
7
7
  - [wanakana-python](https://pypi.org/project/wanakana-python/)
8
8
 

1

検索に辿り着くまで

2019/07/14 07:21

投稿

raccy
raccy

スコア21767

answer CHANGED
@@ -9,5 +9,17 @@
9
9
 
10
10
  さらに漢字にするにはIMEと同じことをする必要があります。普段使っているIMEの推測が正確ではないことからもわかるように、**正確な漢字を割り当てるのははほぼ無理です。**前後の文脈がわかるような長文を大量に機械学習させたAIに噛ませればより正確にできるかも知れませんが、**すでにそれを実施している**Siri、Alexa、Cortana、Google Assistant等の音声応答システムでも度々間違えてしまいます。逆に言えば、そのレベルで十分であれば、Siri、Alexa、Cortana、Google Assistant等と同じことをすれば良いとなります。同じものを用意するには大企業並の資金が必要ですが、音声読み上げしてGoogleの[Cloud Speech-to-Text](https://cloud.google.com/speech-to-text/?hl=ja)に投げると言ったものであれば、それほどお金はかからないと思います。ただ、ローマ字には音声と違ってイントネーションなどがないため、情報量不足でより不正確になると思います。
11
11
 
12
+ なお、PalZaxsonさんは検索するとライブラリがいくつでもみつかると言っていますが、キーワードが悪かったのか、Google検索では全く見つけられませんでした。仕方がないので[PyPI](https://pypi.org/)で"romaji"や"kana"のキーワードで探しましたが、関係無いライブラリもひっかかり、どれが使えるかがすぐにわかりませんでした。PalZaxsonさんはノーヒントで簡単にみつかるようなことを言っていましたが、私にはとても難しかったです。すごい技術のある人はなんでも簡単にできて凄いなーと思いました。
12
13
 
13
- なお、PalZaxsonさんは検索するとライブラリがいくつでもみつかると言っていますが、キーワードが悪かったのか、Google検索では全く見つけられませんでした。仕方がないので[PyPI](https://pypi.org/)で"romaji"や"kana"のキーワードで探しましたが、関係無いライブラリもひっかかり、どれが使えるかがすぐにわかりませんでした。PalZaxsonさんはノーヒントで簡単にみつかるようなことを言っていましたが、私にはとても難しかったです。すごい技術のある人はなんでも簡単にできて凄いなーと思いました。
14
+ ---
15
+
16
+ ついでに、どうやってそこまで辿り着いたかを書いておきます。
17
+
18
+ 1. 「ローマ字 かな 変換 Python」と言ったキーワードでGoogle検索しても、カナ->ローマ字変換の話か、自分でリスト作ってライブラリにする話しか引っかからず、該当するようなライブラリが見つけられない。
19
+ 2. PyPIであるならPyPIで検索できるはずと思いつく。英語じゃなきゃ行けないかなと思って"roma"で検索すると、全く関係無いライブラリばかりが引っかかる。
20
+ 3. そういや、Rubyにもそんなライブラリがあったなーと思って、「ローマ字 かな 変換 Ruby」でググった結果、[romaji](https://github.com/makimoto/romaji)を見つける。
21
+ 4. RubyGemsでromajiを検索するにはどうすべきを確認していると"roma"では同じく駄目で、"romaji"や"kana"だとうまく引っかかることがわかる。
22
+ 5. PyPIに戻って"romaji"や"kana"で検索して、引っかかったものの説明を一通り確認していく。全く関係無いものは概要でわかるけど、カナ->ローマ字しかできないものもあって、区別するには詳しい説明文を読まないといけない。他にもPython3に対応しているかの記述の確認もあって、ちょっと苦労する。
23
+ 6. 説明文からできそうな物をピックアップ。
24
+
25
+ 私のような凡人レベルでは、これぐらい苦労してしまいました。こんなこともせずに一発で簡単に検索できる人はやはりかなり凄いレベルの人なんでしょうね。