自然语言处理评价指标学习

自然语言处理评价指标学习

  • 博客
  • BLEU
  • MENTOR
  • ROUGE
  • CIDEr

博客

【NLP】机器翻译常用评价标准 (BLEU & METEOR)

在NLP当中,不同的评价指标,BLEU, METEOR, ROUGE和CIDEr的逻辑意义?

机器翻译与自动文摘评价指标 BLEU 和 ROUGE

BLEU

BLEU - bilingual evaluation understudy,最早提出的机器翻译评价指标,用于度量同一源语句的自动翻译与一个或多个人工创建的参考翻译之间的差异。

BLEU 算法将自动翻译的连续短语与它在参考翻译中找到的连续短语进行比较,并以加权方式对匹配项数进行计数。 这些匹配项与位置无关。 匹配度越高表示与参考翻译的相似度越高,分数也越高。 不会考虑可理解性和语法正确性。

BLUE只在乎准确率,不在乎召回率。

你可能感兴趣的:(算法,自然语言处理,nlp)