质检工具目前支持25个检查项。

检查项 严重级别 描述
Numeric Mismatch Minor 原文和译文内的数字一致性检查,原文有的数字译文内没有,或者原文没有的数字而出现在译文内。即原文和译文双向都检查,包括数字的内容、个数是否一致。
All UPPERCASE Mismatch Major 原文和译文内的“全大写”单词一致性检查。若原文的全大写单词未出现在译文内,或原文没有的全大写单词而出现在译文内。即原文和译文双向都检查,包括全大写单词的个数和内容是否一致。
CamelCase Mismatch Major 原文和译文内的驼峰字(单词内含有两个及以上的大写字母,同时含有小写字母)是否一致。若原文的驼峰字单词未出现在译文内,或原文没有的驼峰字单词而出现在译文内。原文和译文双向都检查,包括驼峰字个数和内容是否一致。
Alphanumeric Mismatch Major 原文和译文内的字母+数字组合的单词是否一致,即原文和译文双向都检查,包括组合单词的个数和内容是否一致。
Inconsistency in Source Minor 译文相同而原文不同的多个句子。
Inconsistency in Target Minor 原文相同而译文不同的多个句子。
Target Same as Source Minor 原文和译文一样。
Punctuation Minor 存在连续两个及以上重复的标点符号(忽略省略号)。
Repeated Words Major 译文内存在连续重复两次或以上的单词。
Multiple Whitespaces Minor 译文内存在连续两个或以上空格(包括Tab健) 。
Spelling Minor 译文内存在拼写错误。
Tag Mismatch Major 原文和译文内的tag数量、名称不一致。Tag标记对目前仅包括<x attr="value">这样的XML格式标记对。
Tag Error Critical 译文中的标记对不成对的情况。
Untranslated Major 漏译,即译文为空。
Term Consistency Minor 术语一致性检查,若原文某个单词出现在术语表,而译文不存在对应语种的术语,则报错。
MT Compare Minor 提高BLEU测试集结果的客观性,将机器翻译结果与人工翻译结果比对,越相似,分数越高。
Length Ratio Minor 原文和译文的单词长度的比例,返回一个浮点数。可以设置上下阈值来确定是否有问题。
Source Target Similarity Minor 原文和译文的相似性。使用编辑距离来计算相似度。
Html Tags Check Minor 检查原文或译文中是否有html标签,比如<div>。
Html Escape Token Check Minor 检查原文或译文中是否有html转义字符,比如 &nbsp;
Large Token Check Minor 超长单词检查,比如超过20个字符的单词。
URL/Email/Order Number consistency check Major 原文和译文之间的URL、Email的一致性。
FULL WIDTH CHARACTER Minor 检查句子中的全角字符(译文语言为中/日/韩/泰时检查)。
STYLE Minor 检查译文中的特定样式。
GRAMMAR Minor 检查句子中的预发错误。