質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1090閲覧

分割した音声ファイルを文字起こししてみた

masamasa123

総合スコア2

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/11/07 05:13

前提・実現したいこと

音声ファイルを分割し分割したファイルを全て文字起こししたいです
ここに質問の内容を詳しく書いてください。
音声を分割することはできましたが、その後の分割したファイルを文字起こしするとことがうまく行きませんでした。
分割した音声ファイルの初めのファイルだけが何回も文字起こしされてしまいます。
■■な機能を実装中に以下のエラーメッセージが発生しました。

発生している問題・エラーメッセージ

エラーメッセージ

該当のソースコード

ソースコード

コード
import wave
import struct
from scipy import fromstring,int16
import numpy as np
import os
import math
import speech_recognition as sr
import pandas as pd
import tkinter.filedialog

def cut_wav(filename,time):

wavf = filename wr = wave.open(wavf, 'r') ch = wr.getnchannels() width = wr.getsampwidth() fr = wr.getframerate() fn = wr.getnframes() total_time = 1.0 * fn / fr integer = math.floor(total_time*100) # 小数点以下切り捨て t = int(time*100) # 秒数[sec] frames = int(ch * fr * t /100) num_cut = int(integer//t) data = wr.readframes(wr.getnframes()) wr.close() X = np.frombuffer(data, dtype=int16) for i in range(num_cut + 1): outf = out_dir + '/' + str(i) + '.wav' if i > 0: start_cut = int(i*frames) - int(100000) else: start_cut = int(i*frames) end_cut = int(i*frames + frames) Y = X[start_cut:end_cut] outd = struct.pack("h" * len(Y), *Y) ww = wave.open(outf, 'w') ww.setnchannels(ch) ww.setsampwidth(width) ww.setframerate(fr) ww.writeframes(outd) ww.close() str_cut = "" list1 = [wavf,"",""] df_x = pd.DataFrame([list1]) df_x.columns = ['NO','音声ファイル','変換結果'] for ii in range(num_cut + 1): cutf = out_dir + '/' + str(ii) + '.wav' str_out = wav_to_text(outf) df_x.loc[ii] = [ii,str(ii) + '.wav',str_out] with pd.ExcelWriter(out_file) as writer: df_x.to_excel(writer,sheet_name='結果',index=False)

def wav_to_text(wavfile):
r = sr.Recognizer()

with sr.AudioFile(wavfile) as source: audio = r.record(source) wav_to_text = r.recognize_google(audio,language='ja-JP') print(wav_to_text) return wav_to_text

out_dir= "output"
file = os.path.exists(out_dir)

if file == False:
os.mkdir(out_dir)

fTyp = [("", ".wav")]
iDir = os.path.abspath(os.path.dirname(_))
f_name = tkinter.filedialog.askopenfilename(filetypes=fTyp, initialdir=iDir)

cut_time = 60
out_file = "output/out.xlsx"
cut_wav(f_name,float(cut_time))### 試したこと

ここに問題に対して試したことを記載してください。
for文で繰り返すことを実践しようとしましたがうまく組み込ませることができませんでした

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。```ここに言語を入力python
コード

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

y_waiwai

2021/11/07 07:33

このままではコードが読めないので、質問を編集し、<code>ボタンを押し、出てくる’’’の枠の中にコードを貼り付けてください
jbpb0

2021/11/07 11:31

pythonのコードの一番最初の行のすぐ上に ```python だけの行を追加してください また、pythonのコードの一番最後の行のすぐ下に ``` だけの行を追加してください または、 https://teratail.storage.googleapis.com/uploads/contributed_images/56957fe805d9d7befa7dba6a98676d2b.gif を見て、そのようにしてみてください 現状、コードがとても読み辛いです 質問にコードを載せる際に上記をやってくれたら、他人がコードを読みやすくなり、コードの実行による現象確認もやりやすくなるので、回答されやすくなります
guest

回答1

0

ベストアンサー

  • 分割した音声ファイルの初めのファイルだけが何回も文字起こしされてしまいます。

コードからは、分割した音声ファイルの最後のファイルだけが何回も文字起こしされてしまう、となるよう見えます。

for ii in range(num_cut + 1):
cutf = out_dir + '/' + str(ii) + '.wav'
str_out = wav_to_text(outf)
df_x.loc[ii] = [ii,str(ii) + '.wav',str_out]

のoutfはcutfが正しいので、そこを変更して再実行してみてください。

投稿2021/11/08 01:08

編集2021/11/08 01:09
ppaul

総合スコア24666

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

masamasa123

2021/11/09 10:04

ご丁寧にありがとうございました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問