6.5. AI 中台¶
6.5.1. 智能化需求¶
随着业务的不断发展,业务处于不同的发展阶段,对数据的需求也从刚开始的可用-满足BI分析,到后来的易用-敏捷化分析,到现在的好用-数据智能化。例如前台系统提出客户细分、个性化推荐、智能问答、模型预测等需求,后台数据探索需要进行关联分析、聚类分析、持续分析等,这些都向我们提出了数据智能化的需求。5
面对利润下滑和经营成本增加的压力,领先的企业已经进入智能化阶段。企业价值链的每环节都存在可利用AI改善盈利的空间。企业在推进智能化应用落地过程中,面临技术能力不足、资源重复建设、业务敏捷响应度低和投入产出比低四大难题。8
6.5.2. 中台¶
所谓的“中台”,与前台、后台相对应,在系统中被共用的中间件的集合。它存在的目的就是更好的服务前台, 在数据信息化的时代不断地发展到数据、业务、人工智能等各个领域。包含技术中台、业务中台、组织中台、数据中台等一系列的数据平台带来共享和便捷性,中台的一个核心就是共享性,使得公有的部分通过中台的开发来完成,其余多条的业务线共享中台的三方面的内部能力,包括数据、计算资源、软件服务的共享。
中台关注的就是能力复用,异构体系协同。11
中台其实就是为前台而生,通过加入中台,而对前台实现“瘦身”,提升前台的规模化服务与创新能力,实现开发的敏捷性。进而更好的服务用户,使企业真正做到自身能力与用户需求的持续对接。4
特点:10
能力沉淀:将原有分散的的能力,以某种形式沉淀在一起。
服务共享:将沉淀的能力,以服务的形式,为不同前台等提供服务共享的能力。
快速响应:为满足业务快速变化、探索和创新,能够实现快速响应用户的需求,以占领市场。
6.5.2.1. 数据中台¶
数据中台对一个企业,起着至关重要的作用,各个业务系统经年累月以烟囱架构形式存在而导致的数据孤岛、数据隔离、数据不一致等等。因为这些问题实在是过于繁杂,因此数据仓库、数据湖、主数据治理等一系列的工作职能应运而生。
一个企业各个应用源源不断的产生数据,各个业务模块的数据汇总,经过统一的清洗、归类、纠错、标注、定义、颗粒化及构建索引,形成数据中台。6数据中台为智能化应用开发提供了数据和模型的存储和计算的能力,但未涉及AI工程能力建设问题。此外,数据中台的数据治理依赖于人工操作,且难以满足不同场景的个性化需求。
6.5.2.2. AI中台¶
AI中台是一个在数据中台基础上,再加上各类算法及机器学习,来构建大规模智能服务的基础设施,对企业需要的算法模型提供了分步构建和全生命周期管理的服务,让企业可以将自己的业务不断下沉为一个个算法模型,以达到快速复用、组合创新、规模化构建智能服务部署效率的目的。2
AI 中台是为企业智能应用提供 AI 能力支持的统一共享服务平台, 主要包括硬件层、开发平台层、资产层 (算法库&样本库)、业务逻辑层和平台管理层。
硬件层:成千上万的 GPU/CPU/FPGA 提供算力。
开发平台层:主要负责数据处理、模型训练&发布。数据处理主要包括访问数据中台、数据库或其他数据存储系统的数据,并提供数据淸洗、数据标注、数据分析、和特征工程等能力;模型训练提供多种建模方式,如可视化拖拉拽建模, Notebook建模等,兼容多种高性能训练和推理引擎框架,如TensorFlow、 Pytorch、 MXNet等。不同A模型框架可以采用相同存储模型数据格式并交互转换。
资产层:包括算法库&样本库,内置特征工程、机器学习、深度学习和NLP等A算子和大量 Auto ML模块。随着开发场景数的积累,算法库&样本库内置算子数量增加。企业可将算法封装为独立算子,可供直接调用、或进行二次开发。
业务逻辑层:主要是指根据对业务需求的理解,将业务问题转化为数学问题,提供可复用的建模方案模板、服务编排等能力。此外,业务逻辑层能够将算法能力包装成A组件,如通用A组件有OCR、人脸识别、语义识别和图像识别等,场景化A服务组件有输电本体缺陷识别、变电站设备缺陷识别(针对能源行业场景)等。随着场景开发经验积累,企业可将组件沉淀为模板,针对相似场景的开发,企业可通过AP丨直接调用已有模板。
平台管理层:负责角色权限管理、账户管理、资源统一管理等功能。如,资源统一管理是指对CPU、GPU资源的管理和整合,以容器化方式对算力虚拟化,实现弹性扩容、性能加速等功能,且不同部门和项目之间可共享集群资源,避免了资源浪费。此外,AI中台支持对接不同云平台上进行模型训练,训练完成后模型可一键部署至云平台API、设备端SDK和私有服务器部署等不同运行环境。
在实际落地过程中,AI中台多采取分布式微服务架构,各模块间耦合度较低,企业会结合自身业务需求,调整AI中台架构。
未来是一个比拼数据、算力的时代,只有把这些资源更好地集中在一起,模型才能更好地发挥作用,而中台就是一个很好的选择,同时也是组织架构层面很好的一次实践,我们依托中台实现从数据、算力到模型,再到人才的聚集。9
6.5.3. 实例¶
6.5.3.1. 快手¶
来自快手 AI 平台部、Ytech 西雅图人工智能实验室、FeDA 商业化智能实验室的负责人刘霁讲述了 “ AI中台 ” 在快手公司内部的实践。1
数据中台:数据收集——>数据管理——>特征提取
模型/算法设计: 推荐、CV、NLP、Speech、RL等
AI中台: 模型训练——>模型推理上线——>结果监控和反馈
6.5.3.2. 金融7¶
不同行业的AI中台应用落地进展差异化较大,AI中台在金融行业的进展最为迅速。AI中台在消费品与零售、政府与公共服务和工业与能源行业落地较为缓慢,目前头部企业已有最佳实践案例。
目前,大型银行在金融科技领域的预算约为上一年度营收的2-3%,针对A的预算每年约在3000万以上,支持金融机构部署跨部门A平台,并基于平台进行大规模应用开发。并且,出于安全性和保密性考虑,金融机构对系统的自主可控性有较高要求。因此,金融机构,尤其是大型银行更倾向于自行构建独立的AI中台纳管不断增加的A场景数。
目前,头部企业已经基本完成了AI中台架构的搭建,中长尾企业也开始尝试AI中台构建。但实际投产的A应用较为有限,主要集中在营销和风控领域。例如,某国有银行的AI中台建设规划涉及五大场景,预测授信、OCR(身份证和营业执照识别)、反洗钱、手机银行精准营销和客服智能外呼情景分析。现阶段,仅OCR项目已经投产,其他项目仍处于研发阶段。