Python
1コード 2import wave 3import struct 4from scipy import fromstring,int16 5import numpy as np 6import os 7import math 8import speech_recognition as sr 9import pandas as pd 10import tkinter.filedialog 11 12def cut_wav(filename,time): 13 14 wavf = filename 15 wr = wave.open(wavf, 'r') 16 17 ch = wr.getnchannels() 18 width = wr.getsampwidth() 19 fr = wr.getframerate() 20 fn = wr.getnframes() 21 total_time = 1.0 * fn / fr 22 integer = math.floor(total_time*100) # 小数点以下切り捨て 23 t = int(time*100) # 秒数[sec] 24 frames = int(ch * fr * t /100) 25 num_cut = int(integer//t) 26 data = wr.readframes(wr.getnframes()) 27 wr.close() 28 X = np.frombuffer(data, dtype=int16) 29 30 for i in range(num_cut + 1): 31 32 outf = out_dir + '/' + str(i) + '.wav' 33 34 35 if i > 0: 36 start_cut = int(i*frames) - int(100000) 37 else: 38 start_cut = int(i*frames) 39 40 41 end_cut = int(i*frames + frames) 42 Y = X[start_cut:end_cut] 43 outd = struct.pack("h" * len(Y), *Y) 44 45 ww = wave.open(outf, 'w') 46 ww.setnchannels(ch) 47 ww.setsampwidth(width) 48 ww.setframerate(fr) 49 ww.writeframes(outd) 50 ww.close() 51 52 str_cut = "" 53 list1 = [wavf,"",""] 54 df_x = pd.DataFrame([list1]) 55 df_x.columns = ['NO','音声ファイル','変換結果'] 56 57 for ii in range(num_cut + 1): 58 cutf = out_dir + '/' + str(ii) + '.wav' 59 str_out = wav_to_text(outf) 60 df_x.loc[ii] = [ii,str(ii) + '.wav',str_out] 61 62 with pd.ExcelWriter(out_file) as writer: 63 df_x.to_excel(writer,sheet_name='結果',index=False) 64 65def wav_to_text(wavfile): 66 r = sr.Recognizer() 67 68 with sr.AudioFile(wavfile) as source: 69 audio = r.record(source) 70 71 wav_to_text = r.recognize_google(audio,language='ja-JP') 72 73 print(wav_to_text) 74 75 return wav_to_text 76 77out_dir= "output" 78file = os.path.exists(out_dir) 79 80if file == False: 81 os.mkdir(out_dir) 82 83fTyp = [("", ".wav")] 84iDir = os.path.abspath(os.path.dirname(_)) 85f_name = tkinter.filedialog.askopenfilename(filetypes=fTyp, initialdir=iDir) 86 87cut_time = 60 88out_file = "output/out.xlsx" 89cut_wav(f_name,float(cut_time)) 90```PythonでJupiterLabを使いました。初心者です。 91音声ファイルを選択し、そのファイルを1分毎分割して、文字起こしをし、そのデータをExcelに書き出すというプログラムを作成しました。 92結果、音声ファイルの最初の10秒程度を数回、文字起こしして、Excelに書き出さないです。 93どのように改善したらいいでしょうか、アドバイスお願いします。
あなたの回答
tips
プレビュー