質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
86.02%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

分割した音声ファイルを文字起こししてみた

masamasa123
masamasa123

総合スコア2

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1回答

0グッド

0クリップ

524閲覧

投稿2021/11/07 05:13

前提・実現したいこと

音声ファイルを分割し分割したファイルを全て文字起こししたいです
ここに質問の内容を詳しく書いてください。
音声を分割することはできましたが、その後の分割したファイルを文字起こしするとことがうまく行きませんでした。
分割した音声ファイルの初めのファイルだけが何回も文字起こしされてしまいます。
■■な機能を実装中に以下のエラーメッセージが発生しました。

発生している問題・エラーメッセージ

エラーメッセージ

該当のソースコード

ソースコード

コード
import wave
import struct
from scipy import fromstring,int16
import numpy as np
import os
import math
import speech_recognition as sr
import pandas as pd
import tkinter.filedialog

def cut_wav(filename,time):

wavf = filename wr = wave.open(wavf, 'r') ch = wr.getnchannels() width = wr.getsampwidth() fr = wr.getframerate() fn = wr.getnframes() total_time = 1.0 * fn / fr integer = math.floor(total_time*100) # 小数点以下切り捨て t = int(time*100) # 秒数[sec] frames = int(ch * fr * t /100) num_cut = int(integer//t) data = wr.readframes(wr.getnframes()) wr.close() X = np.frombuffer(data, dtype=int16) for i in range(num_cut + 1): outf = out_dir + '/' + str(i) + '.wav' if i > 0: start_cut = int(i*frames) - int(100000) else: start_cut = int(i*frames) end_cut = int(i*frames + frames) Y = X[start_cut:end_cut] outd = struct.pack("h" * len(Y), *Y) ww = wave.open(outf, 'w') ww.setnchannels(ch) ww.setsampwidth(width) ww.setframerate(fr) ww.writeframes(outd) ww.close() str_cut = "" list1 = [wavf,"",""] df_x = pd.DataFrame([list1]) df_x.columns = ['NO','音声ファイル','変換結果'] for ii in range(num_cut + 1): cutf = out_dir + '/' + str(ii) + '.wav' str_out = wav_to_text(outf) df_x.loc[ii] = [ii,str(ii) + '.wav',str_out] with pd.ExcelWriter(out_file) as writer: df_x.to_excel(writer,sheet_name='結果',index=False)

def wav_to_text(wavfile):
r = sr.Recognizer()

with sr.AudioFile(wavfile) as source: audio = r.record(source) wav_to_text = r.recognize_google(audio,language='ja-JP') print(wav_to_text) return wav_to_text

out_dir= "output"
file = os.path.exists(out_dir)

if file == False:
os.mkdir(out_dir)

fTyp = [("", ".wav")]
iDir = os.path.abspath(os.path.dirname(_))
f_name = tkinter.filedialog.askopenfilename(filetypes=fTyp, initialdir=iDir)

cut_time = 60
out_file = "output/out.xlsx"
cut_wav(f_name,float(cut_time))### 試したこと

ここに問題に対して試したことを記載してください。
for文で繰り返すことを実践しようとしましたがうまく組み込ませることができませんでした

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。```ここに言語を入力python
コード

以下のような質問にはグッドを送りましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

グッドが多くついた質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 間違っている
  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

y_waiwai

2021/11/07 07:33

このままではコードが読めないので、質問を編集し、<code>ボタンを押し、出てくる’’’の枠の中にコードを貼り付けてください
jbpb0

2021/11/07 11:31

pythonのコードの一番最初の行のすぐ上に ```python だけの行を追加してください また、pythonのコードの一番最後の行のすぐ下に ``` だけの行を追加してください または、 https://teratail.storage.googleapis.com/uploads/contributed_images/56957fe805d9d7befa7dba6a98676d2b.gif を見て、そのようにしてみてください 現状、コードがとても読み辛いです 質問にコードを載せる際に上記をやってくれたら、他人がコードを読みやすくなり、コードの実行による現象確認もやりやすくなるので、回答されやすくなります

回答1

0

ベストアンサー

  • 分割した音声ファイルの初めのファイルだけが何回も文字起こしされてしまいます。

コードからは、分割した音声ファイルの最後のファイルだけが何回も文字起こしされてしまう、となるよう見えます。

for ii in range(num_cut + 1):
cutf = out_dir + '/' + str(ii) + '.wav'
str_out = wav_to_text(outf)
df_x.loc[ii] = [ii,str(ii) + '.wav',str_out]

のoutfはcutfが正しいので、そこを変更して再実行してみてください。

投稿2021/11/08 01:08

編集2021/11/08 01:09
ppaul

総合スコア24620

良いと思った回答にはグッドを送りましょう。
グッドが多くついた回答ほどページの上位に表示されるので、他の人が素晴らしい回答を見つけやすくなります。

下記のような回答は推奨されていません。

  • 間違っている回答
  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

回答へのコメント

masamasa123

2021/11/09 10:04

ご丁寧にありがとうございました!

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
86.02%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。