質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

Java

Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

Q&A

解決済

2回答

11003閲覧

【Java】Google Speech API を利用し、マイク入力した音声を認識する方法

Jonconan

総合スコア20

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

Java

Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

0グッド

0クリップ

投稿2015/12/18 09:11

編集2015/12/18 09:12

Javaで、マイクを使って音声入力した内容を、自動的にテキストにしたく、プログラムと格闘しております。
簡単に言えば、マイク越しに話した内容を、自動的にリアルタイムで字幕化したいのです。

【 解決したいこと 】
☆ flacファイルを送っているが、result が null になってしまっている点 ←重要
・ 現在、一時的にflacファイルに保存しているが、マイクから直接変換をかけたい

【 ソースコード 】
import java.io.;
import javax.sound.sampled.AudioInputStream;
import javax.net.ssl.HttpsURLConnection;
import javax.sound.sampled.
;
import java.net.*;
import java.nio.file.Files;
import java.nio.file.Paths;

public class MicrophoneIn {
private static final boolean DEBUG_MODE = true;

public static final int BITS = 16; public static final int HZ = 48000; public static final int SECOND = 10; public static final String API_KEY = *********; public static void main(String[] args) { // リニアPCM 16bit 8000Hz × 10秒間 = 160000byte byte[] voiceData = new byte[HZ * BITS / 8 * SECOND]; if (!DEBUG_MODE) { // マイク入力を音声ファイルに(※現在使用していません。) recVoice(voiceData); } System.out.println("GoogleSpeechAPIへ録音したファイルを送信します"); String urlString = "https://www.google.com/speech-api/v2/recognize?output=json&client=chromium&maxresults=10&lang=ja-JP&key=" + API_KEY; URL url; try { url = new URL(urlString); URLConnection urlConn = url.openConnection(); if (!(urlConn instanceof HttpsURLConnection)) { throw new IOException("URL is not an Https URL"); } System.out.println("URL Check Success. (URL:" +urlString+ ")"); HttpsURLConnection httpConn = (HttpsURLConnection) urlConn; httpConn.setRequestMethod("POST"); httpConn.setRequestProperty("Transfer-Encoding", "chunked"); httpConn.setRequestProperty("User-Agent", "Jonconan"); httpConn.setRequestProperty("Content-Type", "audio/x-flac; rate=16000"); httpConn.setRequestProperty("AcceptEncoding", "gzip,deflate,sdch"); httpConn.setDoOutput(true); System.out.println("Connection Success."); DataOutputStream wr = new DataOutputStream( httpConn.getOutputStream()); System.out.println("Flacfile sending.."); wr.write(Files.readAllBytes(Paths .get("news-16000hz.flac"))); System.out.println("Send Success."); wr.flush(); wr.close(); System.out.println("Get Response.."); int responseCode = httpConn.getResponseCode(); System.out.println("\nSending 'POST' request to URL : " + url); System.out.println("Response Code : " + responseCode); BufferedReader in = new BufferedReader(new InputStreamReader( httpConn.getInputStream())); System.out.println("Get-Result Success."); String inputLine; StringBuffer response = new StringBuffer(); while ((inputLine = in.readLine()) != null) { response.append(inputLine); } in.close(); // print result System.out.println("Starting to write data to output..."); System.out.println(response.toString()); System.out.println("******** END *******"); } catch (MalformedURLException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } }

}

【 実行結果 】
GoogleSpeechAPIへ録音したファイルを送信します
URL Check Success. (URL:https://www.google.com/speech-api/v2/recognize?output=json&client=chromium&maxresults=10&lang=ja-JP&key=*********)
Connection Success.
Flacfile sending..
Send Success.
Get Response..

Sending 'POST' request to URL : https://www.google.com/speech-api/v2/recognize?output=json&client=chromium&maxresults=10&lang=ja-JP&key=*********
Response Code : 200
Get-Result Success.
Starting to write data to output...
{"result":[]}
******** END *******

解決したいことは2点です。

・flacファイルを送っているが、result が null になってしまっている点
こちらは、適当なニュースの音声をトリミングし、使用しています。
ファイル名「news-16000hz.flac」
https://drive.google.com/file/d/0B82VdXPWFz8JdDc4bmh0Ujg5LXc/view?usp=sharing
しかし、結果が取得できなくて苦しんでいます。

・ 現在、一時的にflacファイルに保存しているが、マイクから直接変換をかけたい
今は見たとおり、Flacファイルを変換していますが、
マイクで入力した音声をそのままGoogle Speech APIへと送り、テキスト化したく思っています。

どうか、よろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

Jonconanさんが使用されている下記ファイルでは同様の結果になりました。
https://drive.google.com/file/d/0B82VdXPWFz8JdDc4bmh0Ujg5LXc/view?usp=sharing

下記の音源でテストしてみたところうまく動作しましたので単に音源の問題だと思います。
https://github.com/gillesdemey/google-speech-v2/tree/master/audio

投稿2015/12/20 08:59

naoyan77

総合スコア56

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Jonconan

2015/12/20 09:56

ありがとうございます! 質問を重ねてしまい申し訳ないのですが、送信する音声ファイルの制限ってわかりますか? 自分でも調べてみたのですが、容量、時間など、詳しい制限がよく分からなくて… もしご存知でしたら、教えていただけると嬉しいです。 よろしくお願いします。
guest

0

naoyan77様にご指摘いただいたことを元に調査したところ、解決できましたので改めて報告です。

どうやら、Google Speech APIの音源ファイルの仕様は、以下のようになっていたようです。

【 FLAC 】

Flac file; 44100Hz 32bit float, exported with Audacity. Check the audio folder in this repository for some hilarious examples.

Channels : 2
Sample Rate : 44100
Precision : 32-bit
Sample Encoding: 32-bit Float

【 16-bit PCM 】

The following audio options are confirmed working for 16-bit PCM sample encoding:

Channels : 1
Sample Rate : 16000
Precision : 16-bit
Sample Encoding: 16-bit Signed Integer PCM

https://github.com/gillesdemey/google-speech-v2 より引用)

まとめると、音源ファイルの形式が異なっていたのが本件の問題でした。
対応としては、FLACファイルからWAVファイルに変更したところ、問題なく動作できました。

自己解決という欄に報告させていただいてる点が少しあれですが、
教えてくださった naoyan77様 、またこの質問を見て、考えてくれた皆様に、
心より感謝申し上げます。

本当にありがとうございました。

投稿2015/12/21 01:53

Jonconan

総合スコア20

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問