実現したいこと
JTubeSpeech:https://github.com/sarulab-speech/jtubespeech
音声コーパス作成のため、colabでJTubeSpeechを実行しようとしておりますが、出力されたcsvがどうもおかしくて困っています。
上記のStep3の字幕が利用可能が調べるスクリプトを実行した際、「videoid」「auto」「sub」の項目が記載されたcsvが出力されます。videoidはyoutubeの動画のid、autoは自動字幕の有無、subは人間が作成した字幕の有無を示します。
私が実行すると、この時出力されたcsvのautoとsubが全て「False」になってしまいます。念のためvideoidから該当の動画をyoutubeで調べてみたのですが、手動字幕有りの動画も「False」になっていました。
何が悪いのか自力では分からなかったので、ご助力いただければ幸いです。
よろしくお願いいたします。
前提
実行環境:Colab
JtubeSpeechのStep1のスクリプトをそのまま実行すると膨大な検索ワードになってしまうので、テキストファイルに「読み聞かせ」「絵本」といったワードを数個一行ずつ記載したものをテストに利用しております。
該当のソースコード
Python
1#JtubeSpeechをクローン 2!git clone https://github.com/sarulab-speech/jtubespeech.git
Python
1#インストールライブラリリスト 2 3text_file = open("pip_list.txt", "wt") 4 5text_file.write("espnet\n") 6text_file.write("yt-dlp\n") 7text_file.write("joblib\n") 8text_file.write("pydub\n") 9text_file.write("pandas\n") 10text_file.write("num2words\n") 11text_file.write("neologdn\n") 12text_file.write("romkan\n") 13 14text_file.write("requests\n") 15text_file.write("tqdm\n") 16 17text_file.close()
Python
1#インストール実行 2!pip3 install -r pip_list.txt
Python
1#テスト用検索ワードファイル 2 3text_file = open("test_search_word.txt", "wt") 4 5text_file.write("読み聞かせ\n") 6text_file.write("よみきかせ\n") 7text_file.write("昔話\n") 8text_file.write("昔ばなし\n") 9text_file.write("むかしばなし\n") 10text_file.write("絵本\n") 11text_file.write("えほん\n") 12 13text_file.close()
Python
1#Step2 ビデオIDの取得 2!python3 jtubespeech/scripts/obtain_video_id.py ja test_search_word.txt
Python
1#Step3 字幕が利用できるか確認 2!python3 jtubespeech/scripts/retrieve_subtitle_exists.py ja videoid/ja/test_search_word.txt
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2023/09/07 07:16