全部产品

管理热词

更新时间:2020-10-10 15:30:47

在语音识别服务中,如果在您的业务领域存在一些特有词汇,默认识别不准确的情况下,可以使用热词功能。

概述

热词可以是姓名、公司名称或某领域的专有名词。如人名“王晓铭”(通常会识别为“王小明”),司法领域的“被上诉人”,电商领域的“包邮”。

热词不建议过长,不支持标点符号。设置后可测试识别效果,不满意再进行调整。

热词的时效性:设置后,新建的语音识别请求立即生效;已经运行的识别请求无法使用该热词。

热词分为名称类和业务类:

  • 名称类:支持人名地名。一个词表中只能包含人名或只能包含地名。

  • 业务类:业务领域内特有词汇。一个词表中不限制热词的类别,如“苹果”、“哈士奇”、“小明”可以放在同一热词文件中。

使用限制

通过管理控制台添加热词时,有如下限制:

  • 目前仅支持中文热词识别。

  • 文件为TXT格式,100 KB以内,UTF-8(无BOM)编码。

  • 每行一个热词,最多128行,每个热词不超过10个字。

  • 两类热词可各创建10组。

  • 词语中的数字需要按照发音替换为对应的汉字。例如:“58.9元”需要替换为“五十八点九元”。

  • 语料中请不要出现除空格、制表符、换行、换页之外的其他特殊字符。

创建热词

关于创建热词的操作,请参见创建热词

热词管理

智能语音管控台左侧导航栏的自学习平台 > 热词中管理已创建的热词表。

如下图所示,关联项目表示哪些项目正在使用该热词表,一个热词表可以被多个项目使用。您可以预览、更新、下载或删除已创建的热词。

管理热词