音声データの言語判定をおこないたい。

pythonで動画データから音声データを抽出し、テキスト可するプログラムを作成しました。
音声データには日本語と英語があります。1つのデータに複数の言語は混ざってはいません。

音声のテキスト可にはgoogleのrecognize_googleを使用しているのですが、自分が調べた限りでは複数の言語を指定する事はできないようです。
なので、事前に音声データが何語であるかを調べて場合分けを行いたいのですが、その方法を見つける事ができませんでした。

pythonに限らず、音声データの言語判定を行える方法をご存じの方がいらっしゃいましたら教えてください。
よろしくお願いします。

行動規範の内容に同意します

回答1件

というぐらいしか、方法はないでしょう。

どちらのテキストが正しそうかは、翻訳の出力が十分に大きければ作れるでしょうけれども、短い文しかなければ、必ず出て来る単語でも無い限り難しいでしょう。

投稿2021/09/06 07:35

総合スコア24670

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだベストアンサーが選ばれていません

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問