質問の内容
ファイル2の文字列がファイル1の2列目の文字列と部分一致している場合、数をカウントし出力する方法について質問です。
resultの3個目の3個目の値は値は1つ目、2つ目の文字列が入っているのをが入っているのを除外したいので除外したいので求めたい求めたい値は値は4です。
result
fail1
1111 AAA_BBB_CCC_DDD_1 2222 AAA_BBB_CCC_DDD_2 3333 AAA_BBB_CCC_DDD_3 4444 AAA_BBB_DDD_EEE_1 5555 AAA_BBB_DDD_EEE_2 6666 AAA_BBB_1 7777 AAA_BBB_2 8888 AAA_BBB_3 9999 AAA_BBB_4
fail2
1AAA_BBB_CCC_DDD 2AAA_BBB_DDD_EEE 3AAA_BBB
result
1AAA_BBB_CCC_DDD 3 2AAA_BBB_DDD_EEE 2 3AAA_BBB 4
perl
1$INF1=$ARGV[0]; 2open(INF1,"< $INF1"); 3 4while(<INF1>){ 5 chomp; 6 @a=split; 7 $i = $a[1]; 8 $keyword{$i}++; 9} 10 11$INF2=$ARGV[1]; 12open(INF2,"< $INF2"); 13 14while(<INF2>){ 15 chomp; 16 @b=split; 17 $j = $b[0]; 18 if ($i =~ $j) { 19 $keyword{$j}++; 20 } 21 printf ("%s ",$j); 22 printf ("%s\n",$keyword{$j}); 23} 24
試したこと
多重ループを組み、正規表現で部分一致させながら集計したが、ファイルの量が膨大なため多重ループを組まない方法を模索中
ループが終了後の変数の保持がうまない
回答2件
あなたの回答
tips
プレビュー