###(問)
機械翻訳の精度指標の一つであるBLEUについて、
BP(brevity penalty)を用いる中で、機械翻訳の精度を算出する際、英文ではよくn=1~4におけるmodified n-gram precisionの値の対数加重平均とBPを用いる。
機械翻訳の精度を加重平均ではなく対数加重平均で評価するとどのような利点があるか。
正しい選択肢を選びたいです。
1.機械翻訳の妥当性と流暢性を考慮した安定的な評価ができる。
2.機械翻訳の一文一文の長さを厳密に評価し参照翻訳に近いかどうか評価できる。
3.n-gramのnが大きくなるほど指数的にスコアが高くなってしまうのを平坦化し評価できる。
4.意味は同じでも異なる字面の翻訳も正しく評価できる。
###(質問)
調べた結果、3の指数的にスコアが高くなることについてが正しいのではないかと考えたのですが、
正しい選択肢とその理由をできれば教えて頂けないでしょうか。
あなたの回答
tips
プレビュー