質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

シェルスクリプト

シェルスクリプトは、UNIX系のOSもしくはコマンドラインインタプリタ向けに記述されたスクリプト。bash/zshといったシェルによって実行されるため、このように呼ばれています。バッチ処理などに使用されており、テキストファイルに書かれた命令を順に実行します。

Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

199閲覧

wav2vec-masterを使用したモデルの構築

Myb0107

総合スコア0

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

シェルスクリプト

シェルスクリプトは、UNIX系のOSもしくはコマンドラインインタプリタ向けに記述されたスクリプト。bash/zshといったシェルによって実行されるため、このように呼ばれています。バッチ処理などに使用されており、テキストファイルに書かれた命令を順に実行します。

Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2023/02/22 01:30

実現したいこと

wav2vec2を利用したモデルの作成
最終的には自分の持つデータ(wav)を使いたいが現時点ではlibrispeechのデータセット(flac)を使用している

前提

google colabolatory上で、librispeechのデータセットとwav2vec2-masterを利用したモデルの作成をしたいと思っているのですがエラーが出てしまいます。
最終的には自分の持つデータを適応したいと考えているのですがデータセットを使用したモデルの構築の時点でエラーが治りません。

発生している問題・エラーメッセージ

2023-02-21 15:53:50 | INFO | train | task: audio_pretraining (AudioPretrainingTask) 2023-02-21 15:53:50 | INFO | train | model: wav2vec2 (Wav2Vec2Model) 2023-02-21 15:53:50 | INFO | train | criterion: wav2vec (Wav2vecCriterion) 2023-02-21 15:53:50 | INFO | train | num. model params: 95044608 (num. trained: 95044608) 2023-02-21 15:53:50 | INFO | trainer | detected shared parameter: feature_extractor.conv_layers.0.0.bias <- feature_extractor.conv_layers.1.0.bias 2023-02-21 15:53:50 | INFO | trainer | detected shared parameter: feature_extractor.conv_layers.0.0.bias <- feature_extractor.conv_layers.2.0.bias 2023-02-21 15:53:50 | INFO | trainer | detected shared parameter: feature_extractor.conv_layers.0.0.bias <- feature_extractor.conv_layers.3.0.bias 2023-02-21 15:53:50 | INFO | trainer | detected shared parameter: feature_extractor.conv_layers.0.0.bias <- feature_extractor.conv_layers.4.0.bias 2023-02-21 15:53:50 | INFO | trainer | detected shared parameter: feature_extractor.conv_layers.0.0.bias <- feature_extractor.conv_layers.5.0.bias 2023-02-21 15:53:50 | INFO | trainer | detected shared parameter: feature_extractor.conv_layers.0.0.bias <- feature_extractor.conv_layers.6.0.bias 2023-02-21 15:53:50 | INFO | train | training on 64 devices (GPUs/TPUs) 2023-02-21 15:53:50 | INFO | train | max tokens per GPU = 1400000 and max sentences per GPU = None 2023-02-21 15:53:50 | INFO | trainer | no existing checkpoint found /content/drive/MyDrive/colabo/model/path/checkpoint_last.pt 2023-02-21 15:53:50 | INFO | trainer | loading train data for epoch 1 2023-02-21 15:53:50 | INFO | dataload.audio.raw_audio_dataset | loaded 2637, skipped 37 samples Traceback (most recent call last): File "/content/drive/MyDrive/colabo/wav2vec-master/wav2vec-master/src/dataload/data_utils.py", line 239, in batch_by_size from fairseq.data.data_utils_fast import ( ImportError: cannot import name 'batch_by_size_fast' from 'fairseq.data.data_utils_fast' (/usr/local/lib/python3.8/dist-packages/fairseq/data/data_utils_fast.cpython-38-x86_64-linux-gnu.so) During handling of the above exception, another exception occurred: Traceback (most recent call last): File "train.py", line 324, in <module> cli_main() File "train.py", line 320, in cli_main distributed_utils.call_main(args, main) File "/content/drive/MyDrive/colabo/wav2vec-master/wav2vec-master/src/tools/distributed_utils.py", line 181, in call_main main(args, **kwargs) File "train.py", line 106, in main extra_state, epoch_itr = checkpoint_utils.load_checkpoint(args, trainer) File "/content/drive/MyDrive/colabo/wav2vec-master/wav2vec-master/src/tools/checkpoint_utils.py", line 185, in load_checkpoint epoch_itr = trainer.get_train_iterator( File "/content/drive/MyDrive/colabo/wav2vec-master/wav2vec-master/src/trainer.py", line 305, in get_train_iterator return self.task.get_batch_iterator( File "/content/drive/MyDrive/colabo/wav2vec-master/wav2vec-master/src/tasks/fairseq_task.py", line 213, in get_batch_iterator batch_sampler = dataset.batch_by_size( File "/content/drive/MyDrive/colabo/wav2vec-master/wav2vec-master/src/dataload/fairseq_dataset.py", line 118, in batch_by_size return data_utils.batch_by_size( File "/content/drive/MyDrive/colabo/wav2vec-master/wav2vec-master/src/dataload/data_utils.py", line 243, in batch_by_size raise ImportError( ImportError: Please build Cython components with: `pip install --editable .`

該当のソースコード

! python train.py --distributed-world-size 64 --distributed-port 1 /content/drive/MyDrive/colabo/manifest/path \ --save-dir /content/drive/MyDrive/colabo/model/path --fp16 --num-workers 6 --task audio_pretraining --criterion wav2vec --arch wav2vec2 \ --log-keys '["prob_perplexity","code_perplexity","temp"]' --quantize-targets --extractor-mode default \ --conv-feature-layers '[(512, 10, 5)] + [(512, 3, 2)] * 4 + [(512,2,2)] * 2' --final-dim 256 --latent-vars 320 \ --latent-groups 2 --latent-temp '(2,0.5,0.999995)' --infonce --optimizer adam \ --adam-betas '(0.9,0.98)' --adam-eps 1e-06 --lr-scheduler polynomial_decay --total-num-update 400000 \ --lr 0.0005 --warmup-updates 32000 --mask-length 10 --mask-prob 0.65 --mask-selection static --mask-other 0 \ --encoder-layerdrop 0.05 --dropout-input 0.1 --dropout-features 0.1 --feature-grad-mult 0.1 \ --loss-weights '[0.1, 10]' --conv-pos 128 --conv-pos-groups 16 --num-negatives 100 --cross-sample-negatives 0 \ --max-sample-size 250000 --min-sample-size 32000 --dropout 0.1 --attention-dropout 0.1 --weight-decay 0.01 \ --max-tokens 1400000 --max-update 400000 --skip-invalid-size-inputs-valid-test --ddp-backend no_c10d

試したこと

!pip install --editable .を行ったところ、
Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Obtaining file:///content/drive/MyDrive/colabo/wav2vec-master/wav2vec-master/src
ERROR: file:///content/drive/MyDrive/colabo/wav2vec-master/wav2vec-master/src does not appear to be a Python project: neither 'setup.py' nor 'pyproject.toml' found.
という結果が出ました

補足情報(FW/ツールのバージョンなど)

Python 3.8.10

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Myb0107

2023/02/23 15:06

ご返答ありがとうございます、 fairseqの環境を下げようとバージョン指定を行ったURLでgit clone を行ったところ、エラーが出てしまいました、SHAの指定を行ってもできなかったのですが、このような場合はローカルからドライブに渡してcontentに追加するしかないのでしょうか?
melian

2023/02/23 15:20

git clone https://github.com/facebookresearch/fairseq -b v0.10.2 ではどうでしょうか。それと、すみません、名前が変更されたのは fairseq 0.12.0 でした。その一つ前のタグが v0.10.2 になります。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問