评分卡预测组件对原始数据根据评分卡训练组件产出的模型结果进行预测打分。

组件配置

PAI-Studio支持通过可视化或PAI命令配置评分卡预测组件的参数:
  • 可视化方式
    页签 参数 描述
    字段设置 特征列 选择用于预测的原始特征列,默认选择全部。
    原样添加到结果表 选择不进行任何处理,直接附加到预测结果表中的列。例如ID列和目标列等。
    输出变量分 是否输出每个特征变量所对应的分数,最终的预测总得分为截距项的得分加所有的变量分。
    执行调优 核数目 使用的CPU Core数量,默认系统自动分配。
    每个核的内存大小 每个CPU Core所用的内存大小,默认系统自动分配。
  • PAI命令方式
    pai -name=lm_predict
        -project=algo_public
        -DinputFeatureTableName=input_data_table
        -DinputModelTableName=input_model_table
        -DmetaColNames=sample_key,label
        -DfeatureColNames=fea1,fea2
        -DoutputTableName=output_score_table
    参数 描述 是否必选 默认值
    inputFeatureTableName 输入特征数据表。
    inputFeatureTablePartitions 输入特征表选择的分区。 全表
    inputModelTableName 输入的模型表。
    featureColNames 输入表选择的特征列。 所有列
    metaColNames 不进行转换的数据列,选中的列会原样输出。可以在此指定Lable和sample_id等。
    outputFeatureScore 预测结果中是否输出变量分,取值包括:
    • true:输出变量分。
    • false:不输出变量分。
    false
    outputTableName 输出预测结果表。
    lifecycle 输出表的生命周期。
    coreNum 核心数。 默认自动计算
    memSizePerCore 内存大小,单位为MB。 默认自动计算

组件输出

评分卡预测组件输出的打分表示例如下。打分表示例其中churn列为用户选择的原样添加到结果表中的列,与预测结果无关。其它三列为预测结果列,其含义如下表所示。
列名 列类型 列描述
prediction_score DOUBLE 预测分数列。线性模型中特征值和模型权重值直接相乘相加的结果,对应到评分卡模型中,如果模型进行了分数转换,则该分数输出转换后的得分。
prediction_prob DOUBLE 二分类场景中预测得到的正例概率值,原始得分(未经分数转换)经过Sigmoid变换后得到该值。
prediction_detail STRING 用JSON格式描述的各类别概率值,其中0表示负类,1表示正类。例如{“0”:0.1813110520,”1”:0.8186889480}