全部产品
阿里云办公

知识挖掘

更新时间:2018-06-29 16:38:43

知识挖掘

1.基于模型的相似问法发现

  • 对于用户的语料进行聚类,得到相似的问法。输入为在模板相似问法未处理的数据(输入源包含系统未发现的会话历史、标准问法、或是人工选择跳过的)

  • 人工确认及标注相似问法

    1) 对结果可以进行多项勾选,确定Q的相似问法。

    2) 系统自动标记输入的标准Q,并支持编辑

    3) 将确认的标准Q作为后续知识库导入的Q进行展示。

    4) 对其他相似问法支持进行编辑和保存,保存后支持进入下一步。记录标记和修改的数据。

    5)支持整体跳过该步骤。

    6)通过模型获取相似问法列表,包含字段:标准问题,可编辑(随机选择一个相似问法作为标准问法);相似问法;操作(确认、跳过、忽略);修改时间

  • 点击下一步保存并进入下一个流程

  • 不支持跳过

    2. 核心词挖掘

    用户可以对语料结果进行标注处理

  • 包括如下字段:标准问题;句子本体;操作;保存时间
  • 每行仅显示聚类后选取的核心Q(标准问题)和本体词的关系列表
  • 用户可以点击本体词对结果进行编辑和清空,并进行保存,记录标记和修改数据。
  • 操作动作:

    采纳:

    1) 用户点击“确认”则表示其确定问题和本体的关系。

    2) 点击后操作栏状态改变为“确认”,后附加“修改”状态入口。

    3) 可以通过点击修改重新编辑标注状态。

    忽略:

    1) 点击忽略表示这条数据并不不需要进行标准,操作栏状态变为“忽略”,可操作状态切换。

    2) 忽略的数据一旦进行下一步确认后就无法再继续使用。

    关联

    1) 点击合并后激活后续输入框,可以支持本体列表中同义词的合并。

    2) 支持输入多个同义词本体,用空格隔开。

    3) 关联后标准问题随机选择显示一条,句子本体归一。

    4) 关联后操作状态选项不变。

  • 不支持跳过

  • 支持下一步,系统将标注信息保存。

    3. 同义词挖掘

  • 支持用户选取“上一步”语料素材,使用系统进行同义词推荐
  • 用户可以直接使用“上一步”的语料结果作为处理(上一步的任务可以是多个结果)
  • 本体词去重后进行同义词推荐
  • 推荐出来的同义词支持修改和编辑,记录标记和修改数据。
  • 保存后进入下一步
  • 不支持跳过