トップに関する質問 Perlで、503個のデータを処理したいのですが、413個しか生成されず困っています。

編集履歴

質問編集履歴

追記

2018/11/04 06:08

投稿

BURI55

スコア25

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,4 +1,4 @@
-元データ生成に使ったのは、[なんかいろいろしてみます](http://akihiro0105.web.fc2.com/Downloads/Downloads-SHABERU.html)で配布されているものを、[まほろば　音響モデルを自作する５（音素ラベリング）](http://mahoro-ba.net/e1890.html)で修正したsegment_atr503_windows-v1.0で、
+データ生成に使ったのは、[なんかいろいろしてみます](http://akihiro0105.web.fc2.com/Downloads/Downloads-SHABERU.html)で配布されているものを、[まほろば　音響モデルを自作する５（音素ラベリング）](http://mahoro-ba.net/e1890.html)で修正したsegment_atr503_windows-v1.0で、
 hirosibaフォルダにa01から503個のwavデータを置いて実行しましたが、a01からa09とかb01からb09などがスキップされて413個しかそれぞれデータが生成されません。どうすれば、全てのデータが得られますでしょうか？
@@ -10,7 +10,7 @@
 [今すぐ試すPadreのデバッグ支援機能](http://nekozitacafe.cocolog-nifty.com/blog/2011/03/padre-9bea.html)
-を参考に試しています。
+を参考にステップ実行及び変数のチェックを試しています。

追記

2018/11/04 06:08

投稿

BURI55

スコア25

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -14,7 +14,7 @@
-Pealtidyを入れ整形しました。
+Pealtidyを入れ整形しました。[perltidyを使ってみました](http://d.hatena.ne.jp/nitsuji/20060507/1146991795)や[perltidy - Perlソースコード整形ツール](https://qiita.com/kayama0fa/items/e65323feda9f8fb4234e)を参考にしました。
 ```Peal

Pealtidy導入

2018/11/04 05:27

投稿

BURI55

スコア25

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,433 +1,393 @@
-Ubuntu14.4を使ってHTS2.3を使って、OpenJTalk用の音響モデルの学習をさせています。
-まほろばの一連の投稿を参考にしました。[まほろば　音響モデルを自作する１（概要）](http://mahoro-ba.net/e1876.html)など。
-[音響モデルを自作する２（Linux環境）](http://mahoro-ba.net/e1887.html)，[音響モデルを自作する３（音響モデル学習）](http://mahoro-ba.net/e1888.html)、[音響モデルを自作する４（サンプルデータ）](http://mahoro-ba.net/e1889.html)までで、サンプルスクリプトはうまく動いたのですが、[音響モデルを自作する５（音素ラベリング）](http://mahoro-ba.net/e1890.html)で生成した自分のデータで[音響モデルを自作する６（独自音声）](http://mahoro-ba.net/e1891.html)を動かしたところ以下のエラーで止まってしまいます。
-```Ubuntu
-# Generating monophone and fullcontext Master Label Files (MLF)
-echo "#!MLF!#" > labels/mono.mlf
-echo "\"*/nitech_jp_atr503_m001_*.lab\" -> \"/home/buri/HTS/HTS-demo_base/data/labels/mono\"" >> labels/mono.mlf
-echo "#!MLF!#" > labels/full.mlf
-echo "\"*/nitech_jp_atr503_m001_*.lab\" -> \"/home/buri/HTS/HTS-demo_base/data/labels/full\"" >> labels/full.mlf
-# Generating a fullcontext model list file
-mkdir -p lists
-rm -f tmp
-for lab in labels/full/nitech_jp_atr503_m001_*.lab; do \
-		if [ -s ${lab} -a -s labels/mono/`basename ${lab}` -a -s cmp/`basename ${lab} .lab`.cmp ]; then \
-			sed -e "s/.* //g" ${lab} >> tmp; \
-		fi \
-	done
-sort -u tmp > lists/full.list
-sort: cannot read: tmp: そのようなファイルやディレクトリはありません
-make[1]: *** [list] エラー 2
-make[1]: ディレクトリ `/home/buri/HTS/HTS-demo_base/data' から出ます
-make: *** [data] エラー 2
-buri@buri-VirtualBox:~/HTS/HTS-demo_base$
+元データ生成に使ったのは、[なんかいろいろしてみます](http://akihiro0105.web.fc2.com/Downloads/Downloads-SHABERU.html)で配布されているものを、[まほろば　音響モデルを自作する５（音素ラベリング）](http://mahoro-ba.net/e1890.html)で修正したsegment_atr503_windows-v1.0で、
+hirosibaフォルダにa01から503個のwavデータを置いて実行しましたが、a01からa09とかb01からb09などがスキップされて413個しかそれぞれデータが生成されません。どうすれば、全てのデータが得られますでしょうか？
+アドバイスで、
+[Padre](http://padre.perlide.org/)を入れました。
+[今すぐ試すPadreのデバッグ支援機能](http://nekozitacafe.cocolog-nifty.com/blog/2011/03/padre-9bea.html)
+を参考に試しています。
+Pealtidyを入れ整形しました。
+```Peal
+#!/usr/bin/perl
+#atr503 labels wav
+#名前はa01からj53までとする。
+$speaker = "hiroshiba";
+$label   = "labels";
+@abc     = ( a, b, c, d, e, f, g, h, i, j );
+## julius4 executable
+$julius4bin = "julius";
+## acoustic model
+$hmmdefs = "./models/hmmdefs_monof_mix16_gid.binhmm";    # monophone model
+## working directory
+$TMPDIR = ".";
+mkdir $speaker . "/mono";
+mkdir $speaker . "/full";
+mkdir $speaker . "/raw";
+@filenum = ( 0, 0 );
+$abcnum = 0;
+while ()
+#### initialize
+{
+    if ( $filenum[0] == 5 && $filenum[1] == 3 ) {
+        $filenum[0] = 0;
+        $filenum[1] = 0;
+        $abcnum += 1;
+    }
+    if ( $abcnum == 10 ) {
+        print "Error: cannot open wav file ¥n";
+        print "push key¥n";
+        <STDIN>;
+        die;
+    }
+    if ( $filenum[1] == 9 ) {
+        $filenum[0] += 1;
+        $filenum[1] = 0;
+    }
+    else {
+        $filenum[1] += 1;
+    }
+    $filename   = $abc[$abcnum] . $filenum[0] . $filenum[1];
+    $monofile   = $label . "/mono/${filename}.lab";
+    $fullfile   = $label . "/full/${filename}.lab";
+    $speechfile = $speaker . "/${filename}.wav";
+    print "Start segmentation $filename ¥n";
+    if ( -r $speechfile ) {
+#### generate speech grammar 'tmp.dfa' and 'tmp.dict' from transcription
+        # clean temporary file
+        unlink("$TMPDIR/tmp.dfa")  if ( -r "$TMPDIR/tmp.dfa" );
+        unlink("$TMPDIR/tmp.dict") if ( -r "$TMPDIR/tmp.dict" );
+## read transcription
+        @words = ();
+        $line  = 0;
+        open( TRANS_MONO, "$monofile" );
+        while (<TRANS_MONO>) {
+            chomp;
+            next if /^[ ¥t¥n]*$/;
+            if ( $line == 1 ) {
+                s/pau/sp/;
+                s/A/a/;
+                s/I/i/;
+                s/U/u/;
+                s/E/e/;
+                s/O/o/;
+                s/cl/q/;
+                s/sil$/silE/;
+                s/[0-9]+//g;
+                s/ //g;
+            }
+            if ( $line == 0 ) {
+                s/sil$/silB/;
+                s/[0-9]+//g;
+                s/ //g;
+                $line = 1;
+            }
+            push( @words, $_ );
+        }
+        close(TRANS_MONO);
+        $num = $#words;
+        # write dfa
+        open( DFA, ">$TMPDIR/tmp.dfa" );
+        for ( $i = 0; $i <= $num; $i++ ) {
+            $str = sprintf( "%d %d %d 0", $i, $num - $i, $i + 1 );
+            if ( $i == 0 ) {
+                $str .= " 1¥n";
+            }
+            else {
+                $str .= " 0¥n";
+            }
+            print DFA "$str";
+        }
+        $str = sprintf( "%d -1 -1 1 0¥n", $num + 1 );
+        print DFA "$str";
+        close(DFA);
+        # write dict
+        open( DICT, ">$TMPDIR/tmp.dict" );
+        for ( $i = 0; $i <= $num; $i++ ) {
+            $w             = shift(@words);
+            $str           = "$i [w_$i] $w¥n";
+            $WLIST{"w_$i"} = "$w";
+            print DICT "$str";
+        }
+        close(DICT);
+        # check generated files
+        if ( ( !-r "$TMPDIR/tmp.dfa" ) || ( !-f "$TMPDIR/tmp.dfa" ) ) {
+            die "Error: failed to make ¥"$TMPDIR/tmp.dfa¥"¥n";
+        }
+        if ( ( !-r "$TMPDIR/tmp.dict" ) || ( !-f "$TMPDIR/tmp.dict" ) ) {
+            die "Error: failed to make ¥"$TMPDIR/tmp.dict¥"¥n";
+        }
+#### execute Julius4 and store the output to log
+        $command
+            = "echo $speechfile | $julius4bin -h $hmmdefs -dfa $TMPDIR/tmp.dfa -v $TMPDIR/tmp.dict -input file -spmodel null -48 -palign";
+        system("$command > ${monofile}.log");
+#### remove temporary file
+        unlink("$TMPDIR/tmp.dfa");
+        unlink("$TMPDIR/tmp.dict");
+#### open result file for writing
+        $logfile_mono = "${speaker}/mono/${filename}.lab";
+        $logfile_mono =‾ s/wav//;
+        $logfile_full = "${speaker}/full/${filename}.lab";
+        $logfile_full =‾ s/wav//;
+        open( RESULT_MONO, ">$logfile_mono" );
+        open( RESULT_FULL, ">$logfile_full" );
+#### parse log and append result to speechfile.align
+        open( LOG,        "${monofile}.log" );
+        open( TRANS_MONO, "$monofile" );
+        open( TRANS_FULL, "$fullfile" );
+        $sw = 0;
+        while (<LOG>) {
+            chomp;
+            if (/re-computed AM score:/) {
+                $sw = 0;
+            }
+            if ( $sw == 2 ) {
+                $data_mono = <TRANS_MONO>;
+                $data_mono =‾ s/¥n//;
+                $data_mono =‾ s/^[0-9]+ [0-9]+//g;
+                $data_full = <TRANS_FULL>;
+                $data_full =‾ s/¥n//;
+                $data_full =‾ s/^[0-9]+ [0-9]+//g;
+                s/-[0-9]+.[0-9]+//;
+                s/[[]//;
+                s/[]]//;
+                s/[a-zA-Z]+//g;
+                s/ +//;
+                s/ +/ /g;
+                @num = split( /¥s/, $_ );
+                $num[0] = $num[0] * 100000;
+                $num[1] = ( $num[1] + 1 ) * 100000;
+                if ( $num[1] != 0 ) {
+                    print RESULT_MONO "@num" . "$data_mono¥n";
+                    print RESULT_FULL "@num" . "$data_full¥n";
+                }
+            }
+            if ( $sw == 1 ) {
+                $sw = 2;
+            }
+            if (/ id: from  to    n_score    unit/) {
+                $sw = 1;
+            }
+        }
+        close(LOG);
+        close(RESULT_MONO);
+        close(RESULT_FULL);
+        close(TRANS_MONO);
+        close(TRANS_FULL);
+        unlink "${monofile}.log";
+        system(
+            "echo $speechfile | sox -t wav $speechfile -t raw -L -2 -s $speaker/raw/${filename}.raw"
+        );
+    }
+}
 ```
-[まほろばの投稿　音響モデルを自作する７（パラメータ調整）](http://mahoro-ba.net/e1894.html)を参考に[HTSメーリングリスト](http://hts.sp.nitech.ac.jp/hts-users/)をたどったところ、
-同じエラーで質問している人が2・3いましたが、有用な答えは得られていないようです。
-例えば、以下のツリーです。
-[[hts-users:01149] Generating a fullcntext model list occurred in the training data](http://hts.sp.nitech.ac.jp/hts-users/spool/2008/msg00066.html)
-何が原因と考えられるでしょうか？tmpフォルダがないのでしょうか？それともlistsフォルダの生成に失敗しているのでしょうかそれともfull.listがないのでしょうか？よろしくご教示ください。
-メーリングリストの答えに合った通り、自分で調べました。/home/buri/HTS/HTS-demo_base/data/lists/full.listが生成されているものの0バイトのようです。それでtmpでsort行おうとしてもエラーが出てしまうようです。元dataのa1からa9などが欠けているから、full.listの生成に失敗してと考えられます。元データ生成に使ったのは、[なんかいろいろしてみます](http://akihiro0105.web.fc2.com/Downloads/Downloads-SHABERU.html)で配布されているものを、[まほろば　音響モデルを自作する５（音素ラベリング）](http://mahoro-ba.net/e1890.html)で修正したsegment_atr503_windows-v1.0で、
-```Perl
-#!/usr/bin/perl
-#atr503 labels wav
-#名前はa01からj53までとする。
-$speaker = "hiroshiba";
-$label = "labels";
-@abc = (a,b,c,d,e,f,g,h,i,j);
-## julius4 executable
-$julius4bin="julius";
-## acoustic model
-$hmmdefs="./models/hmmdefs_monof_mix16_gid.binhmm"; # monophone model
-## working directory
-$TMPDIR=".";
-mkdir $speaker."/mono";
-mkdir $speaker."/full";
-mkdir $speaker."/raw";
-@filenum = (0,0);
-$abcnum = 0;
-while(){
-#### initialize
-if($filenum[0]==5 && $filenum[1]==3){
-	$filenum[0] =0;
-	$filenum[1] =0;
-	$abcnum += 1;
-}
-if($abcnum==10){
-	print "Error: cannot open wav file ¥n";
-	print "push key¥n";
-	<STDIN>;
-	die;
-}
-if($filenum[1]==9){
-	$filenum[0] +=1;
-	$filenum[1] =0;
-}else{
-	$filenum[1] += 1;
-}
-$filename = $abc[$abcnum].$filenum[0].$filenum[1];
-$monofile = $label."/mono/${filename}.lab";
-$fullfile = $label."/full/${filename}.lab";
-$speechfile = $speaker."/${filename}.wav";
-print "Start segmentation $filename ¥n";
-if (-r $speechfile) {
-#### generate speech grammar 'tmp.dfa' and 'tmp.dict' from transcription
-# clean temporary file
-unlink("$TMPDIR/tmp.dfa") if (-r "$TMPDIR/tmp.dfa");
-unlink("$TMPDIR/tmp.dict") if (-r "$TMPDIR/tmp.dict");
-## read transcription
-@words=();
-$line = 0;
-open(TRANS_MONO, "$monofile");
-while(<TRANS_MONO>) {
-    chomp;
-    next if /^[ ¥t¥n]*$/;
-    if($line == 1){
-    	s/pau/sp/;
-		s/A/a/;
-		s/I/i/;
-		s/U/u/;
-		s/E/e/;
-		s/O/o/;
-		s/cl/q/;
-		s/sil$/silE/;
-		s/[0-9]+//g;
-		s/ //g;
-	}
-	if($line == 0){
-		s/sil$/silB/;
-		s/[0-9]+//g;
-		s/ //g;
-		$line = 1;
-    }
-    push(@words, $_);
-}
-close(TRANS_MONO);
-$num = $#words;
-# write dfa
-open(DFA, ">$TMPDIR/tmp.dfa");
-for ($i = 0; $i <= $num; $i++) {
-    $str = sprintf("%d %d %d 0", $i, $num - $i, $i + 1);
-    if ($i == 0) {
-	$str .= " 1¥n";
-    } else {
-	$str .= " 0¥n";
-    }
-    print DFA "$str";
-}
-$str = sprintf("%d -1 -1 1 0¥n", $num + 1);
-print DFA "$str";
-close(DFA);
-# write dict
-open(DICT, ">$TMPDIR/tmp.dict");
-for ($i = 0; $i <= $num; $i++) {
-    $w = shift(@words);
-    $str = "$i [w_$i] $w¥n";
-    $WLIST{"w_$i"} = "$w";
-    print DICT "$str";
-}
-close(DICT);
-# check generated files
-if ((! -r "$TMPDIR/tmp.dfa") || (! -f "$TMPDIR/tmp.dfa")) {
-    die "Error: failed to make ¥"$TMPDIR/tmp.dfa¥"¥n";
-}
-if ((! -r "$TMPDIR/tmp.dict") || (! -f "$TMPDIR/tmp.dict")) {
-    die "Error: failed to make ¥"$TMPDIR/tmp.dict¥"¥n";
-}
-#### execute Julius4 and store the output to log
-$command = "echo $speechfile | $julius4bin -h $hmmdefs -dfa $TMPDIR/tmp.dfa -v $TMPDIR/tmp.dict -input file -spmodel null -48 -palign";
-system("$command > ${monofile}.log");
-#### remove temporary file
-unlink("$TMPDIR/tmp.dfa");
-unlink("$TMPDIR/tmp.dict");
-#### open result file for writing
-$logfile_mono = "${speaker}/mono/${filename}.lab";
-$logfile_mono =‾ s/wav//;
-$logfile_full = "${speaker}/full/${filename}.lab";
-$logfile_full =‾ s/wav//;
-open(RESULT_MONO, ">$logfile_mono");
-open(RESULT_FULL, ">$logfile_full");
-#### parse log and append result to speechfile.align
-open(LOG, "${monofile}.log");
-open(TRANS_MONO, "$monofile");
-open(TRANS_FULL, "$fullfile");
-$sw = 0;
-while(<LOG>) {
-    chomp;
-    if (/re-computed AM score:/) {
-		$sw = 0;
-    }
-	if($sw == 2){
-			$data_mono = <TRANS_MONO>;
-			$data_mono =‾ s/¥n//;
-			$data_mono =‾ s/^[0-9]+ [0-9]+//g;
-			$data_full = <TRANS_FULL>;
-			$data_full =‾ s/¥n//;
-			$data_full =‾ s/^[0-9]+ [0-9]+//g;
-		s/-[0-9]+.[0-9]+//;
-		s/[[]//;
-		s/[]]//;
-		s/[a-zA-Z]+//g;
-		s/ +//;
-		s/ +/ /g;
-		@num = split(/¥s/, $_);
-		$num[0] = $num[0] * 100000;
-		$num[1] = ($num[1]+1) * 100000;
-		if($num[1]!=0){
-			print RESULT_MONO "@num"."$data_mono¥n";
-			print RESULT_FULL "@num"."$data_full¥n";
-		}
-	}
-	if($sw == 1){
-		$sw = 2;
-	}
-    if (/ id: from  to    n_score    unit/) {
-		$sw = 1;
-    }
-}
-close(LOG);
-close(RESULT_MONO);
-close(RESULT_FULL);
-close(TRANS_MONO);
-close(TRANS_FULL);
-unlink "${monofile}.log";
-system("echo $speechfile | sox -t wav $speechfile -t raw -L -2 -s $speaker/raw/${filename}.raw");
-}
-}
-```
-で、hirosibaフォルダにa01から503個のwavデータを置いて実行しましたが、a01からa09とかb01からb09などがスキップされて413個しかそれぞれデータが生成されません。どうすれば、全てのデータが得られますでしょうか？
-[Padre](http://padre.perlide.org/)を入れました。
-[今すぐ試すPadreのデバッグ支援機能](http://nekozitacafe.cocolog-nifty.com/blog/2011/03/padre-9bea.html)
-を参考に試しています。

Perlデバッガ導入

2018/11/04 05:20

投稿

BURI55

スコア25

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -425,3 +425,9 @@
 ```
 で、hirosibaフォルダにa01から503個のwavデータを置いて実行しましたが、a01からa09とかb01からb09などがスキップされて413個しかそれぞれデータが生成されません。どうすれば、全てのデータが得られますでしょうか？
+[Padre](http://padre.perlide.org/)を入れました。
+[今すぐ試すPadreのデバッグ支援機能](http://nekozitacafe.cocolog-nifty.com/blog/2011/03/padre-9bea.html)
+を参考に試しています。

初心者マーク付加

2018/11/04 04:45

投稿

BURI55

スコア25

test CHANGED Viewed

File without changes

test CHANGED Viewed

File without changes

初心者マーク取る

2018/11/04 04:05

投稿

BURI55

スコア25

test CHANGED Viewed

File without changes

test CHANGED Viewed

File without changes

誤字の修正

2018/11/04 01:21

投稿

BURI55

スコア25

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -424,4 +424,4 @@
 ```
-で、hirosibaフォルダにa01から503個のwavデータを置いて実行しましたが、a01からa09とかb01からb09とかがスキップされて413個しかそれぞれデータが生成されません。どうすれば、全てのデータが得られますでしょうか？
+で、hirosibaフォルダにa01から503個のwavデータを置いて実行しましたが、a01からa09とかb01からb09などがスキップされて413個しかそれぞれデータが生成されません。どうすれば、全てのデータが得られますでしょうか？

タイトル編集

2018/11/04 01:10

投稿

BURI55

スコア25

test CHANGED Viewed

	@@ -1 +1 @@
1	- Perlで、~~入力データは、a1からJ1まで、~~503個のデータを処理したいのですが、~~結果のデータが、a1からa9までなどが欠けてしまってa10からなどになってしまって~~413個しか生成されず困っています。
1	+ Perlで、503個のデータを処理したいのですが、413個しか生成されず困っています。

test CHANGED Viewed

File without changes

タイトル追記

2018/11/04 01:02

投稿

BURI55

スコア25

test CHANGED Viewed

	@@ -1 +1 @@
1	- Perlで、入力データは、a1からJ1まで、503個のデータを処理したいのですが、結果のデータが、a1からa9までなどが欠けてしまってa10からなどになってしまって困っています。
1	+ Perlで、入力データは、a1からJ1まで、503個のデータを処理したいのですが、結果のデータが、a1からa9までなどが欠けてしまってa10からなどになってしまって413個しか生成されず困っています。

test CHANGED Viewed

File without changes

追記

2018/11/04 00:59

投稿

BURI55

スコア25

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -424,4 +424,4 @@
 ```
-で、hirosibaフォルダにa01から503個のwavデータを置いて実行しましたが、a01からa09とかb01からb09とかがスキップされてしまいます。どうすれば、全てのデータが得られますでしょうか？
+で、hirosibaフォルダにa01から503個のwavデータを置いて実行しましたが、a01からa09とかb01からb09とかがスキップされて413個しかそれぞれデータが生成されません。どうすれば、全てのデータが得られますでしょうか？

追記

2018/11/04 00:58

投稿

BURI55

スコア25

test CHANGED Viewed

	@@ -1 +1 @@
1	- Perlで、a1からJ1まで、503個のデータを処理したいのですが、a1からa9までなどが欠けてしまってa10からになってしまって困っています。
1	+ Perlで、入力データは、a1からJ1まで、503個のデータを処理したいのですが、結果のデータが、a1からa9までなどが欠けてしまってa10からなどになってしまって困っています。

test CHANGED Viewed

File without changes

追記

2018/11/04 00:52

投稿

BURI55

スコア25

test CHANGED Viewed

	@@ -1 +1 @@
1	- Perl~~によるデータ生成プログラム~~で、a1からJ1まで、503個のデータを処理したいのですが、a1からa9までなどが欠けてしまって困っています。
1	+ Perlで、a1からJ1まで、503個のデータを処理したいのですが、a1からa9までなどが欠けてしまってa10からになってしまって困っています。

test CHANGED Viewed

File without changes

誤字の修正

2018/11/04 00:51

投稿

BURI55

スコア25

test CHANGED Viewed

	@@ -1 +1 @@
1	- Perlによるデータ生成プログラムで、a1からJ1まで、503個のデータを処理したいのだが、a1からa9までなどが欠けてしまって困っています。
1	+ Perlによるデータ生成プログラムで、a1からJ1まで、503個のデータを処理したいのですが、a1からa9までなどが欠けてしまって困っています。

test CHANGED Viewed

File without changes

追記

2018/11/04 00:49

投稿

BURI55

スコア25

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -60,7 +60,7 @@
-メーリングリストの答えに合った通り、自分で調べました。/home/buri/HTS/HTS-demo_base/data/lists/full.listが生成されているものの0バイトのようです。それでtmpでsort行おうとしてもエラーが出てしまうのでしょうか？dataの1から9が欠けているから、生成に失敗しているのでしょうか。元データ生成に使ったのは、[なんかいろいろしてみます](http://akihiro0105.web.fc2.com/Downloads/Downloads-SHABERU.html)で配布されているものを、[まほろば　音響モデルを自作する５（音素ラベリング）](http://mahoro-ba.net/e1890.html)で修正したsegment_atr503_windows-v1.0で、
+メーリングリストの答えに合った通り、自分で調べました。/home/buri/HTS/HTS-demo_base/data/lists/full.listが生成されているものの0バイトのようです。それでtmpでsort行おうとしてもエラーが出てしまうようです。元dataのa1からa9などが欠けているから、full.listの生成に失敗してと考えられます。元データ生成に使ったのは、[なんかいろいろしてみます](http://akihiro0105.web.fc2.com/Downloads/Downloads-SHABERU.html)で配布されているものを、[まほろば　音響モデルを自作する５（音素ラベリング）](http://mahoro-ba.net/e1890.html)で修正したsegment_atr503_windows-v1.0で、

タイトル変更

2018/11/04 00:42

投稿

BURI55

スコア25

test CHANGED Viewed

	@@ -1 +1 @@
1	- ~~HTS2.3を使ってOp~~e~~nJTa~~l~~k用の音響モ~~デ~~ルの学習をさせてい~~ますが、データ~~不足でエラー~~を吐いて止まってしまいます。~~データを欠けなく生成するにはどうしたらよいでしょうか？~~
1	+ Perlによるデータ生成プログラムで、a1からJ1まで、503個のデータを処理したいのだが、a1からa9までなどが欠けてしまって困っています。

test CHANGED Viewed

File without changes

リンク追記

2018/11/04 00:39

投稿

BURI55

スコア25

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -2,7 +2,7 @@
 まほろばの一連の投稿を参考にしました。[まほろば　音響モデルを自作する１（概要）](http://mahoro-ba.net/e1876.html)など。
-サンプルスクリプトはうまく動いたのですが、自分のデータで動かしたところ以下のエラーで止まってしまいます。
+[音響モデルを自作する２（Linux環境）](http://mahoro-ba.net/e1887.html)，[音響モデルを自作する３（音響モデル学習）](http://mahoro-ba.net/e1888.html)、[音響モデルを自作する４（サンプルデータ）](http://mahoro-ba.net/e1889.html)までで、サンプルスクリプトはうまく動いたのですが、[音響モデルを自作する５（音素ラベリング）](http://mahoro-ba.net/e1890.html)で生成した自分のデータで[音響モデルを自作する６（独自音声）](http://mahoro-ba.net/e1891.html)を動かしたところ以下のエラーで止まってしまいます。
 ```Ubuntu
@@ -52,13 +52,15 @@
 同じエラーで質問している人が2・3いましたが、有用な答えは得られていないようです。
+例えば、以下のツリーです。
 [[hts-users:01149] Generating a fullcntext model list occurred in the training data](http://hts.sp.nitech.ac.jp/hts-users/spool/2008/msg00066.html)
 何が原因と考えられるでしょうか？tmpフォルダがないのでしょうか？それともlistsフォルダの生成に失敗しているのでしょうかそれともfull.listがないのでしょうか？よろしくご教示ください。
-メーリングリストの答えに合った通り、自分で調べました。/home/buri/HTS/HTS-demo_base/data/lists/full.listが生成されているものの0バイトのようです。それでtmpでsort行おうとしてもエラーが出てしまうのでしょうか？dataの1から9が欠けているから、生成に失敗しているのでしょうか。元データ生成に使ったのは、[なんかいろいろしてみます](http://akihiro0105.web.fc2.com/Downloads/Downloads-SHABERU.html)で配布されているものを、[まほろば](http://mahoro-ba.net/e1890.html)で修正したsegment_atr503_windows-v1.0で、
+メーリングリストの答えに合った通り、自分で調べました。/home/buri/HTS/HTS-demo_base/data/lists/full.listが生成されているものの0バイトのようです。それでtmpでsort行おうとしてもエラーが出てしまうのでしょうか？dataの1から9が欠けているから、生成に失敗しているのでしょうか。元データ生成に使ったのは、[なんかいろいろしてみます](http://akihiro0105.web.fc2.com/Downloads/Downloads-SHABERU.html)で配布されているものを、[まほろば　音響モデルを自作する５（音素ラベリング）](http://mahoro-ba.net/e1890.html)で修正したsegment_atr503_windows-v1.0で、

タイトル追加

2018/11/04 00:32

投稿

BURI55

スコア25

test CHANGED Viewed

	@@ -1 +1 @@
1	- HTS2.3を使ってOpenJTalk用の音響モデルの学習をさせていますが、~~tmpフォルダが見つからない？~~エラーを吐いて止まってしまいます。
1	+ HTS2.3を使ってOpenJTalk用の音響モデルの学習をさせていますが、データ不足でエラーを吐いて止まってしまいます。データを欠けなく生成するにはどうしたらよいでしょうか？

test CHANGED Viewed

File without changes

追記

2018/11/04 00:24

投稿

BURI55

スコア25

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,6 +1,6 @@
 Ubuntu14.4を使ってHTS2.3を使って、OpenJTalk用の音響モデルの学習をさせています。
-まほろばの一連の投稿を参考にしました。[まほろば](http://mahoro-ba.net/e1876.html)
+まほろばの一連の投稿を参考にしました。[まほろば　音響モデルを自作する１（概要）](http://mahoro-ba.net/e1876.html)など。
 サンプルスクリプトはうまく動いたのですが、自分のデータで動かしたところ以下のエラーで止まってしまいます。
@@ -48,9 +48,9 @@
 ```
-[まほろばの投稿](http://mahoro-ba.net/e1894.html)を参考にHTSメーリングリストをたどったところ、
+[まほろばの投稿　音響モデルを自作する７（パラメータ調整）](http://mahoro-ba.net/e1894.html)を参考に[HTSメーリングリスト](http://hts.sp.nitech.ac.jp/hts-users/)をたどったところ、
-同じエラーで質問している人がいましたが、有用な答えは得られていないようです。
+同じエラーで質問している人が2・3いましたが、有用な答えは得られていないようです。
 [[hts-users:01149] Generating a fullcntext model list occurred in the training data](http://hts.sp.nitech.ac.jp/hts-users/spool/2008/msg00066.html)
@@ -58,7 +58,7 @@
-自分で調べました。/home/buri/HTS/HTS-demo_base/data/lists/full.listが生成されているものの0バイトのようです。それでtmpでsort行おうとしてもエラーが出てしまうのでしょうか？dataの1から9が欠けているから、生成に失敗しているのでしょうか。元データ生成に使ったのは、[なんかいろいろしてみます](http://akihiro0105.web.fc2.com/Downloads/Downloads-SHABERU.html)で配布されているものを、[まほろば](http://mahoro-ba.net/e1890.html)で修正したsegment_atr503_windows-v1.0で、
+メーリングリストの答えに合った通り、自分で調べました。/home/buri/HTS/HTS-demo_base/data/lists/full.listが生成されているものの0バイトのようです。それでtmpでsort行おうとしてもエラーが出てしまうのでしょうか？dataの1から9が欠けているから、生成に失敗しているのでしょうか。元データ生成に使ったのは、[なんかいろいろしてみます](http://akihiro0105.web.fc2.com/Downloads/Downloads-SHABERU.html)で配布されているものを、[まほろば](http://mahoro-ba.net/e1890.html)で修正したsegment_atr503_windows-v1.0で、

スペース挿入

2018/11/04 00:23

投稿

BURI55

スコア25

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -56,8 +56,12 @@
 何が原因と考えられるでしょうか？tmpフォルダがないのでしょうか？それともlistsフォルダの生成に失敗しているのでしょうかそれともfull.listがないのでしょうか？よろしくご教示ください。
 自分で調べました。/home/buri/HTS/HTS-demo_base/data/lists/full.listが生成されているものの0バイトのようです。それでtmpでsort行おうとしてもエラーが出てしまうのでしょうか？dataの1から9が欠けているから、生成に失敗しているのでしょうか。元データ生成に使ったのは、[なんかいろいろしてみます](http://akihiro0105.web.fc2.com/Downloads/Downloads-SHABERU.html)で配布されているものを、[まほろば](http://mahoro-ba.net/e1890.html)で修正したsegment_atr503_windows-v1.0で、
 ```Perl
 #!/usr/bin/perl

追記

2018/11/04 00:17

投稿

BURI55

スコア25

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -56,4 +56,366 @@
 何が原因と考えられるでしょうか？tmpフォルダがないのでしょうか？それともlistsフォルダの生成に失敗しているのでしょうかそれともfull.listがないのでしょうか？よろしくご教示ください。
-自分で調べました。/home/buri/HTS/HTS-demo_base/data/lists/full.listが生成されているものの0バイトのようです。それでtmpでsort行おうとしてもエラーが出てしまうのでしょうか？
+自分で調べました。/home/buri/HTS/HTS-demo_base/data/lists/full.listが生成されているものの0バイトのようです。それでtmpでsort行おうとしてもエラーが出てしまうのでしょうか？dataの1から9が欠けているから、生成に失敗しているのでしょうか。元データ生成に使ったのは、[なんかいろいろしてみます](http://akihiro0105.web.fc2.com/Downloads/Downloads-SHABERU.html)で配布されているものを、[まほろば](http://mahoro-ba.net/e1890.html)で修正したsegment_atr503_windows-v1.0で、
+```Perl
+#!/usr/bin/perl
+#atr503 labels wav
+#名前はa01からj53までとする。
+$speaker = "hiroshiba";
+$label = "labels";
+@abc = (a,b,c,d,e,f,g,h,i,j);
+## julius4 executable
+$julius4bin="julius";
+## acoustic model
+$hmmdefs="./models/hmmdefs_monof_mix16_gid.binhmm"; # monophone model
+## working directory
+$TMPDIR=".";
+mkdir $speaker."/mono";
+mkdir $speaker."/full";
+mkdir $speaker."/raw";
+@filenum = (0,0);
+$abcnum = 0;
+while(){
+#### initialize
+if($filenum[0]==5 && $filenum[1]==3){
+	$filenum[0] =0;
+	$filenum[1] =0;
+	$abcnum += 1;
+}
+if($abcnum==10){
+	print "Error: cannot open wav file ¥n";
+	print "push key¥n";
+	<STDIN>;
+	die;
+}
+if($filenum[1]==9){
+	$filenum[0] +=1;
+	$filenum[1] =0;
+}else{
+	$filenum[1] += 1;
+}
+$filename = $abc[$abcnum].$filenum[0].$filenum[1];
+$monofile = $label."/mono/${filename}.lab";
+$fullfile = $label."/full/${filename}.lab";
+$speechfile = $speaker."/${filename}.wav";
+print "Start segmentation $filename ¥n";
+if (-r $speechfile) {
+#### generate speech grammar 'tmp.dfa' and 'tmp.dict' from transcription
+# clean temporary file
+unlink("$TMPDIR/tmp.dfa") if (-r "$TMPDIR/tmp.dfa");
+unlink("$TMPDIR/tmp.dict") if (-r "$TMPDIR/tmp.dict");
+## read transcription
+@words=();
+$line = 0;
+open(TRANS_MONO, "$monofile");
+while(<TRANS_MONO>) {
+    chomp;
+    next if /^[ ¥t¥n]*$/;
+    if($line == 1){
+    	s/pau/sp/;
+		s/A/a/;
+		s/I/i/;
+		s/U/u/;
+		s/E/e/;
+		s/O/o/;
+		s/cl/q/;
+		s/sil$/silE/;
+		s/[0-9]+//g;
+		s/ //g;
+	}
+	if($line == 0){
+		s/sil$/silB/;
+		s/[0-9]+//g;
+		s/ //g;
+		$line = 1;
+    }
+    push(@words, $_);
+}
+close(TRANS_MONO);
+$num = $#words;
+# write dfa
+open(DFA, ">$TMPDIR/tmp.dfa");
+for ($i = 0; $i <= $num; $i++) {
+    $str = sprintf("%d %d %d 0", $i, $num - $i, $i + 1);
+    if ($i == 0) {
+	$str .= " 1¥n";
+    } else {
+	$str .= " 0¥n";
+    }
+    print DFA "$str";
+}
+$str = sprintf("%d -1 -1 1 0¥n", $num + 1);
+print DFA "$str";
+close(DFA);
+# write dict
+open(DICT, ">$TMPDIR/tmp.dict");
+for ($i = 0; $i <= $num; $i++) {
+    $w = shift(@words);
+    $str = "$i [w_$i] $w¥n";
+    $WLIST{"w_$i"} = "$w";
+    print DICT "$str";
+}
+close(DICT);
+# check generated files
+if ((! -r "$TMPDIR/tmp.dfa") || (! -f "$TMPDIR/tmp.dfa")) {
+    die "Error: failed to make ¥"$TMPDIR/tmp.dfa¥"¥n";
+}
+if ((! -r "$TMPDIR/tmp.dict") || (! -f "$TMPDIR/tmp.dict")) {
+    die "Error: failed to make ¥"$TMPDIR/tmp.dict¥"¥n";
+}
+#### execute Julius4 and store the output to log
+$command = "echo $speechfile | $julius4bin -h $hmmdefs -dfa $TMPDIR/tmp.dfa -v $TMPDIR/tmp.dict -input file -spmodel null -48 -palign";
+system("$command > ${monofile}.log");
+#### remove temporary file
+unlink("$TMPDIR/tmp.dfa");
+unlink("$TMPDIR/tmp.dict");
+#### open result file for writing
+$logfile_mono = "${speaker}/mono/${filename}.lab";
+$logfile_mono =‾ s/wav//;
+$logfile_full = "${speaker}/full/${filename}.lab";
+$logfile_full =‾ s/wav//;
+open(RESULT_MONO, ">$logfile_mono");
+open(RESULT_FULL, ">$logfile_full");
+#### parse log and append result to speechfile.align
+open(LOG, "${monofile}.log");
+open(TRANS_MONO, "$monofile");
+open(TRANS_FULL, "$fullfile");
+$sw = 0;
+while(<LOG>) {
+    chomp;
+    if (/re-computed AM score:/) {
+		$sw = 0;
+    }
+	if($sw == 2){
+			$data_mono = <TRANS_MONO>;
+			$data_mono =‾ s/¥n//;
+			$data_mono =‾ s/^[0-9]+ [0-9]+//g;
+			$data_full = <TRANS_FULL>;
+			$data_full =‾ s/¥n//;
+			$data_full =‾ s/^[0-9]+ [0-9]+//g;
+		s/-[0-9]+.[0-9]+//;
+		s/[[]//;
+		s/[]]//;
+		s/[a-zA-Z]+//g;
+		s/ +//;
+		s/ +/ /g;
+		@num = split(/¥s/, $_);
+		$num[0] = $num[0] * 100000;
+		$num[1] = ($num[1]+1) * 100000;
+		if($num[1]!=0){
+			print RESULT_MONO "@num"."$data_mono¥n";
+			print RESULT_FULL "@num"."$data_full¥n";
+		}
+	}
+	if($sw == 1){
+		$sw = 2;
+	}
+    if (/ id: from  to    n_score    unit/) {
+		$sw = 1;
+    }
+}
+close(LOG);
+close(RESULT_MONO);
+close(RESULT_FULL);
+close(TRANS_MONO);
+close(TRANS_FULL);
+unlink "${monofile}.log";
+system("echo $speechfile | sox -t wav $speechfile -t raw -L -2 -s $speaker/raw/${filename}.raw");
+}
+}
+```
+で、hirosibaフォルダにa01から503個のwavデータを置いて実行しましたが、a01からa09とかb01からb09とかがスキップされてしまいます。どうすれば、全てのデータが得られますでしょうか？

追記

2018/11/04 00:16

投稿

BURI55

スコア25

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -55,3 +55,5 @@
 [[hts-users:01149] Generating a fullcntext model list occurred in the training data](http://hts.sp.nitech.ac.jp/hts-users/spool/2008/msg00066.html)
 何が原因と考えられるでしょうか？tmpフォルダがないのでしょうか？それともlistsフォルダの生成に失敗しているのでしょうかそれともfull.listがないのでしょうか？よろしくご教示ください。
+自分で調べました。/home/buri/HTS/HTS-demo_base/data/lists/full.listが生成されているものの0バイトのようです。それでtmpでsort行おうとしてもエラーが出てしまうのでしょうか？