实时计算Flink版广泛应用于大数据实时化的场景,本文从部门场景和技术领域场景进行介绍。

已有流处理系统

如果您本地已安装Flink、Storm或Spark Streaming系统,可以直接迁移或改造后迁移到实时计算Flink版产品。migration

部门场景

从企业部门职能的角度,可以将实时计算Flink版划分为以下场景:department
  • 业务部门:实时风控、实时推荐、搜索引擎的实时索引构建等。
  • 数据部门:实时数仓、实时报表、实时大屏等。
  • 运维部门:实时监控、实时异常检测和预警、全链路Debug等。

技术领域

从技术领域的角度,实时计算Flink版主要用于以下场景:
  • 实时ETL和数据流
    实时ETL和数据流的目的是实时地把数据从A点投递到B点。在投递的过程中可能添加数据清洗和集成的工作,例如实时构建搜索系统的索引、实时数仓中的ETL过程等。ETL
  • 实时数据分析
    数据分析指的是根据业务目标,从原始数据中抽取对应信息并整合的过程。例如,查看每天销量前10的商品、仓库平均周转时间、文档平均单击率、推送打开率等。实时数据分析则是上述过程的实时化,通常在终端体现为实时报表或实时大屏。Realtime Analysis
  • 事件驱动应用
    事件驱动应用是对一系列订阅事件进行处理或作出响应的系统。事件驱动应用通常需要依赖内部状态,例如欺诈检测、风控系统、运维异常检测系统等。当用户行为触发某些风险控制点时,系统会捕获这个事件,并根据用户当前和之前的行为进行分析,决定是否对用户进行风险控制。Evnet Oriented
说明 以上技术领域场景流程图来自Apache Flink官网