前提・実現したいこと
mp3ファイルをGCPのspeech-to-textを利用して文字起こしをし、その結果をCloud Storage(GCS)に保存する、というFlask appを作成しようとしています。(mp3ファイルはVue.jsからFlaskにアップロードします)
その過程で、ユーザーが選択したmp3ファイルをflacファイルに変換したいのですが、ローカルに保存せずにそのままspeech-to-textに投げる、もしくはGCSに保存したいです。
どのようなモジュールを使っても構いませんが、ローカルを経由せずにGCSに変換した音声ファイルを保存したいです。
発生している問題
音声ファイルの変換によく使われるpydubを利用しようとしたのですが、私が試したところ、変換前ファイルの選択、変換後ファイルの保存先の選択で引数に取れるのが相対パスだけでした。Flaskで受け取ったmp3ファイルをflacファイルに変換しGCSに保存できません。
GCSに保存できないとしても、変換後のファイルが変数に保存できれば構いませんが、それもできませんでした。
該当のソースコード
python
1from pydub import AudioSegment 2 3# (1)ローカルファイルの変換は可能 4sound = AudioSegment.from_mp3("example.mp3") 5sound.export("example.flac", format="flac") 6 7# (2)GCSのURLを引数に渡せない 8sound = AudioSegment.from_mp3("https://storage.googleapis.com/<バケット名>/example.mp3") 9sound.export("https://storage.googleapis.com/<バケット名>/example.flac", format="flac") 10 11# (3)変数として書き出す 12sound = sound.export(format="flac") 13sound.export("example.flac")
試したこと
上記ソースコードのうち
(1)は期待通りの挙動を示し、カレントディレクトリに変換されたexample.flacが保存されます
(2)では下記エラーが表示されます
FileNotFoundError: [Errno 2] No such file or directory: 'https://storage.googleapis.com/<バケット名>/npl_speech_2.mp3'
(3)では下記エラーが表示されます
AttributeError: '_io.BufferedRandom' object has no attribute 'export'
pydub以外も色々調べましたが、全て相対パスしか指定できませんでした。
よろしくお願いします!
###追記(19.12.27)
「ユーザーがmp3ファイルを選択すると、文字起こしをする」というWebアプリを作りたい、という状況です。
AWS Lambdaにあげて実装しようとしておりまして、どうしよう…という感じです。たとえ「Lambdaにコードをあげてもローカルに保存できる」としてもローカルを一度挟むサービスにはしたくないと思っております。
よろしくお願いします。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/12/26 16:42
2019/12/26 21:55
2019/12/29 08:43