人工智能基础层企业案例分析课件(PPT 20页)

上传人:re****.1 文档编号:571600424 上传时间:2024-08-11 格式:PPT 页数:20 大小:16.22MB
返回 下载 相关 举报
人工智能基础层企业案例分析课件(PPT 20页)_第1页
第1页 / 共20页
人工智能基础层企业案例分析课件(PPT 20页)_第2页
第2页 / 共20页
人工智能基础层企业案例分析课件(PPT 20页)_第3页
第3页 / 共20页
人工智能基础层企业案例分析课件(PPT 20页)_第4页
第4页 / 共20页
人工智能基础层企业案例分析课件(PPT 20页)_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《人工智能基础层企业案例分析课件(PPT 20页)》由会员分享,可在线阅读,更多相关《人工智能基础层企业案例分析课件(PPT 20页)(20页珍藏版)》请在金锄头文库上搜索。

1、人工智能基础层企业案例分析技术创新,变革未来第1页,共20页。人工智能基础层定义来源:根据公开资料自主研究绘制。智能智能计计算集群算集群支撑人工智能支撑人工智能应应用的算力用的算力资资源源数据基数据基础础服服务务及治理平台及治理平台面向人工智能的数据面向人工智能的数据资资源生源生产产与治理与治理人工智能基人工智能基础层础层定定义义支撑各类人工智能应用开发与运行的资源和平台算力、算法、数据是人工智能产业发展的三大要素。据此,人工智能基础层主要包括智能计算集群、智能模型敏捷开发工具、数据基础服务与治理平台三个模块。智智能能计计算算集集群群提供支撑AI模型开发、训练或推理的算力资源,包括系统级AI芯

2、片和异构智能计算服务器,以及下游的人工智能计算中心等;智智能能模模型型敏敏捷捷开开发发工工具具模块主要实现AI应用模型的生产,包括开源算法框架,提供语音、图像等AI技术能力调用的AI开放平台和AI应用模型效率化生产平台;数数据据基基础础服服务务与与治治理理平平台台模块则实现AI应用所需的数据资源生产与治理,提供AI基础数据服务及面向AI的数据治理平台。AI基础层企业通过提供AI 算力、开发工具或数据资源助力人工智能应用在各行业领域、各应用场景落地,支撑人工智能产业健康稳定发展。人工智能基人工智能基础层础层涵盖涵盖AI算算力力、算、算法法平台平台与与数据数据资资源模源模块块人工智能人工智能应应用

3、用层层异构智能异构智能计计算算服服务务器器AI技技术术开开放平台放平台AI基基础础数据服数据服务务系系统级统级AI芯片芯片AI应应用模型用模型效率效率化生化生产产平台平台面向面向AI的数据的数据治理治理平台平台人工智能人工智能计计算算中中心心包括应用于云端服务器、边缘及终端设备的AI芯片采用异构形式的服务器,支持X86、GPU、ARM、ASIC及FPGA加速卡等,以提升数据处理能力整合智能计算集群为企业或科研计算等需求提供AI算力服务以深度学习或机器学习为主的一站式模型生产平台,含满足零代码或低代码开发需求的解决方案为AI算法训练及优化提供的数据采集、清洗、信息抽取、标注等服务,以采集和标注为

4、主通过汇聚盘点数据、提升数据质量,增强数据可用性和易用性,进一步释放数据资产价值AI开源框架开源框架智能模型敏捷开智能模型敏捷开发发工具工具帮助帮助实现实现人工智能人工智能应应用模型生用模型生产产一般包括大量的机器学习或深2度学习算法,为多种编程语言提供API提供计算机视觉、智能语音、NLP等各类AI技术能力调用第2页,共20页。满足业务需求的数据采集高效数据标注数据统一管理高质量数据集挖掘数据关联信息人工智能基础层价值来源:根据公开资料自主研究绘制。识别业务问题数据采集标注数据治理特征工程模型训练模型评估调优模型部署运维监控数据输入运算端到端设计AI基础层是支撑AI应用模型开发及落地的必要资

5、源开发一项人工智能模型并上线应用大致需经历从业务理解、数据采标及处理、模型训练与测试到运维监控等一系列流程。过程中需要大量的AI算力、高质量数据源、AI应用算法研发及AI技术人员的支持,但大部分中小企业用户并不具备在“算力、数据、算法”三维度从0到1部署的能力,而财力雄厚的大型企业亦需高性价比的AI开发部署方案。依靠AI基础层资源,需求企业可降低资源浪费情况、规避试错成本、提高部署应用速度。作为支撑AI模型开发及落地的必要资源,AI基础层可在多环节提效AI技术价值的释放;其工具属性也标志着AI产业社会化分工的出现,AI产业正逐步进入低技术门槛、低部署成本、各产业深度参与双向共建的效率化生产阶段

6、。AI应应用开用开发发上上线线流程与流程与AI基基础础层层资资源源价价值值点点结合开发流程模板确定最优模型性能评估及模型持续优化开发态流程运行态流程迭代调优AI基础层资源价值点数据基础服务及治理平台智能模型敏捷开发工具智能计算集群数数据据资资源源可视化建模、交互式模型仓库管理建模、自动建模提供算法工程化服务实现分布式训练框架易用的模型部署、运行监控平台提高算法建模效率实现模型的持续集成、持续交付、持续部署算算 法法 开开 发发 资资 源源CPU、GPU容器服务计算资源统一管理算算力力资资源源提高资源利用率提高执行效率AI专用芯片;实现软硬一体优化,突破性能瓶颈3第3页,共20页。基础层初步成型

7、是AI产业链成熟的标志AI技技术层术层供供应应端端一站式数据治理平台厂商数据采集厂商数据标注厂商智能计算平台AI芯片厂商AI服务器厂商AI基础层供应端数据基 础服务 及治理平台提供模型训练的生产资料智能计算集群提供产业链的生产驱动力智能模型敏捷开发工具输出AI技术服务能力一站式AI开发平台厂商AI开放平台厂商计算机视觉自然语言处理语音识别机器学习知识图谱深度学习AI应用需求端G端需智慧城市、高校学术科研求智慧政务、和学科建设智慧警务等B端需AI模型部署AI基础层资求需求源调用需求直接供直接供应应:不经过中游技术层,上游直接提供基础层资源供自研需求的客户调用注释:绿色箭头代表需求传导链,黄色箭头

8、代表供应传导链,需求端与供给端的传导链并不完全独立,可同时并存。AI企业可具备AI技术层供应和AI基础层供应双重角色。来源:研究院自主绘制。间间接接供供 应应 将 基 础 层 资 源 传 输 到 技 术层在解决方案中供 应 基 础 层 资 源对技术层传递基础资源需求转达基础资源需求基础层资源促进AI产业链各环节价值传导顺畅、分工明确现阶段,已初步成型的AI基础层资源可有效缓解下游行业用户逐渐增长的、从感知到认知多类型的AI应用模型开发及部署需求。细看基础层内部,一方面,数据资源、算力资源和算法开发资源三者之间的分工更为明确和有序。数据基础服务及治理平台企业为AI产业链供应数据生产资料;智能计算

9、集群产出高质效的生产力;智能模型敏捷开发工具则负责模型开发及模型训练等,输出AI技术服务能力,提高AI应用模型在各行业的渗透速率与价值空间。另一方面,基础层厂商的数量保持增长、厂商业务范围持续扩大,可提供专业定制化或一站式的基础资源服务。由此,基础层完成AI工业化生产准备,通过直接供应和间接供应的形式,将基础层资源传送到下游的AI应用需求端,产业链向顺畅的资源输送及价值传导方向演进。AI产业链产业链价价值传导值传导机制示机制示意意图图应应用需求直接用需求直接传传达到基达到基础层础层4第4页,共20页。11AI基础层解决人工智能生产力稀缺问题来源:研究院自主绘制。 来源:2020年中国人工智能产

10、业研究报告大中型企业CTO/CIO调研,N=41,2020年9月。 数据数据资资源源算力算力资资源源算法开算法开发资发资源源数量多数量多、标标准准不不统统一一:数据量激增,半结构化与非结构化数据难以标准化,数据价值有待发掘,数据开发缺少统一标准标标注成本高:注成本高:海量数据标注耗费大量时间与人力风险隐风险隐患患:数据存在违规违法泄露风险,数据共享隐患多算力需算力需求求强强劲劲但但利用利用率率较较低低:各业务实时性算力需求攀升,业务与算力适配难度较大算力算力资资源源部署部署难难、调调度度难难:硬件采购成本高以及交付周期不可控,计算资源调度门槛高算力集算力集群群操作操作系系统统复复杂杂:各类异构

11、算力的操作系统自动化水平低,交互友好性低产产品二品二次次开开发发:由于企业业务特性不同,长尾化的AI开发需求难以满足。产品二次开发普遍存在,需要定制化的AI能力沟通不沟通不畅畅:开发涉及多团队沟通、沟通对接冗余43.9%34.1%9.8%12.2%完成全部完成全部ROI指指标标仅仅达成部分达成部分ROI指指标标未未设设定明定明确确ROI未完成未完成ROI指指标标基础层资源缓解甲方在对待人工智能投资上的“矛盾”根据2020年执行的CTO调研,2019年超过51%的样本企业AI相关研发费用占总研发费用比重在10%以上,2020年65.9%的企业AI研发占比达到10%以上。一方面是甲方企业不断增长的

12、对智能化转型的强劲需求,一方面则是在AI应用开发与部署过程中企业普遍面临的数据质量(49%)、技术人才(51%)等基础资源配置难点。且目前只有少数企业可以完成AI项目实施前设定的全部投资回报率(ROI)标准,因此甲方企业在投资AI项目时相对审慎。AI基础层资源则可有效缓解甲方利用AI技术重塑自身业务时的投资矛盾,提升模型生产效率,降低部署成本:数据资源集群具备数据采标与数据治理能力,且一站式的数据平台可对实时数据进行统一管理,提高数据利用率;高效的AI算力集群与调度系统可满足模型训练与推理需求,降低总拥有成本(TCO,Total Cost of Ownership);基于算法开发平台演化出的语

13、音识别、计算机视觉、机器学习等专业的AI模型生产平台,可提供高效、一站式的AI模型生产服务。甲方企甲方企业业部署部署AI基基础层资础层资源源面面临临难难点点2020年中国甲方企年中国甲方企业业AI项项目目投投资资回回报报率率实实现现情况情况第5页,共20页。人工智能基础层产业图谱注释:以企业主营业务为主,展示部分行业代表性企业。图谱中所展示的公司logo顺序及大小并无实际意义,不涉及排名。来源:根据公开资料研究绘制。2021年人工智能基年人工智能基础层产础层产业业图谱图谱智能模型敏捷开智能模型敏捷开发发工具工具数据基数据基础础服服务务及治理平台及治理平台片及服加务速器卡芯计异算构服智务能器AI

14、终端芯片智能智能计计算集群算集群智能云算力AI开放平台AI效率化应生 用产 模平 型台AI基础数据服务AI面向的数据治理平台横琴先进智能计算平台、国家超级计算中心、地区人工智能计算中心先知先知Brain+PAIModelArtsAI云云AI开源框架TIAIStation企业自建/第三方AI数据中心等6第6页,共20页。设备与基础设施供应智能计算集群产业链及图谱中AI服务器比例逐渐增高。CPU/GPULAN芯片组DRAM内存RAID控制器服务器零部件SSD/HHD电源/其他ODM厂商芯片原材料与设计制造半导体材料:硅片及耗材生产制造设备:光刻机、蚀刻机等EDM设计宽带网络温度/通风基础设施机柜/

15、光纤电力供应ICT设备国家/地区级超算中心国家超算中心地方超算中心第三方数据中心厂商自建数据中心人工智能计算中心上上游游材材料料与与基基础础设设施施数据中心/超算中心异构智能计算服务器厂商品牌厂商企业自建数据中心需求增长,AI服务器占比逐渐增高智能计算集群的产业链结构为:1)上游:材料与基础设施;2)中游:智能计算集群供应商;3)下游:各行业算力需求企业。中游的三类服务商中,系统级AI芯片厂商为服务器厂商提供异构计算所用的芯片或板卡;异构智能计算服务器厂商则为各类型数据中心/超算中心提供服务器。值得注意的是,智能云、互联网等领域企业的自建数据中心需求增长,且其注释:图谱中所展示的公司logo顺

16、序及大小并无实际意义,不涉及排名。来源:研究院结合公开资料自主研究绘制。智能计算集群供应商中游智能数据集群智能数据集群产业链产业链及及图图谱谱下游:各行下游:各行业业算力需求企算力需求企业业地区人工智能计算中心封测代工系统级AI芯片厂商:IDM模式系统级AI芯片厂商:Fabless模式晶圆代工IC设计7第7页,共20页。27智能模型敏捷开发工具产业链及图谱术的发展。注释:图谱中所展示的公司logo顺序及大小并无实际意义,不涉及排名;来源:2020年中国人工智能API经济白皮书;研究院自主研究绘制。AI能力开放互通,技术与业务协同前进智能模型敏捷开发工具的上游与中游重合,AI技术服务商、智能云厂

17、商与其他厂商或企业通过自有或外部的开源框架开发出AI应用模型,将模型放入AI技术开放平台或AI应用模型效率化生产平台中。从能力输送的方向看,一方面,AI技术平台与AI应用模型效率化生产平台均开放API接口,将对应能力输送给下游,并吸收下游更新的产品与技术,从横向与纵向拓展业务的广度与深度;另一方面,AI技术开放平台与AI应用模型效率化生产平台之间也会进行能力的互换,共同促进AI技智智能能模模型型敏敏捷捷开开发发工工具具服服务务商商上上 游游&中中 游游AI开源框架开源框架智能模型敏捷开智能模型敏捷开发发工具工具产产业链业链及及图谱图谱TIAIStationAI应应用模型效率化生用模型效率化生产

18、产平台平台AI技技术术开放平台开放平台PAIEasyDL专业专业版版ModelArtsAI云云深度学习为主Brain+机器学习为主先知先知API接口下游:各行下游:各行业业AI应应用开用开发发企企业业、个个人开人开发发者或者或企企业业使使用用者者智能云厂商智能云厂商AI技技术术服服务务提供商提供商其他厂商或企其他厂商或企业业API接口AI基础能力输送输送训练好的AI模型并更新AI技术开发能力输送AI基础能力,如人脸识别、语音识别,文字识别等能力交互环节AI基础能力回流AI应用模型开发能力输送AI应用模型开发能力回流以定制化解决方案方式交互以API调用方式交互第8页,共20页。AI数据基础服务与

19、数据治理产业图谱中游服务商提供可用数据助力AI落地AI基础数据服务与数据治理产业链结构为:1)上游:数据源与数据产能;2)中游:数据产品开发工具与管理服务;3)下游:人工智能应用。处于中游的两类服务商中,AI基础数据服务商使用数据采集与标注工具处理图片、语音、文本等非结构化数据,面向AI的数据治理服务商则负责使用数据治理的各组件管治多源异构数据,使其形成数据资产,从而提高数据质量。二者处理后的数据可直接为下游的AI训练所用,使AI应用落地能够省时省力。AI数据基数据基础础服服务务与数据治与数据治理理产业产业图图谱谱AI基础数据服务商(含采集与标注)数数据据产产品品开开发发工工具具与与管管理理

20、服服 务务中中游游人人工工智智能能应应用用下下游游多源数据个企政其业府他人数数数数据据据据产能资源供应方数据源与数据产能上游硬件资源供应商服务器厂商云服务厂商IDC厂商其他网络设备厂商AI基础数据服务商具备标注基地或全职标注团队个人资源外包提供商个人劳务提供者标注资源提供方面向AI的数据治理平台服务商智慧政务智慧公安智慧城市智慧金融智慧工业自动驾驶智慧零售智慧教育智慧农业智慧旅游注释:图谱中所展示的公司logo顺序及大小并无实际意义,不涉及排名。9第9页,共20页。47典型人工智能基础层企业案例目录第10页,共20页。商汤科技SenseCore AI大装置推动人工智能通用型技术研发商汤科技是领

21、先的人工智能平台公司,是科技部指定的“智能视觉”国家新一代智能开放创新平台。为满足深度学习网络模型不断攀升的算力需求、多行业长尾细分的应用需求以及摆脱人力密集型的开发模式,商汤构建了新型人工智能基础设施SenseCore商商汤汤AI大大装装置置。其通过整合强大的算力基础和领先的算法能力,致力于拆解与碰撞海量数据、深入挖掘数据的潜在价值、打破认知和应用的边界。在该装置的架构组成中,算力层以商汤自主建立的新型人工智能计算中心(AIDC)为基础,整合AI芯片及AI传感器,集训练与推理于一体,可支持海量数据与算法模型的计算;平台层融合了商汤数据平台、深度学习训练框架、深度学习推理部署引擎和模型生产平台

22、,打造创新的人工智能通用算法开发平台,实现从数据存储、标注到模型训练、生产、部署、测试的全链路、批量化过程;算法层则基于平台层生产的创新算法模型,向企业开发者提供算法工具,为企业赋能,助力其实现智能化升级;同时商汤通过与香港中文大学商汤联合实验室(MMLab)打造算法开源计划(OpenMMLab),与社区开发者共同构建创新生态。SenseCore商商汤汤AI大装大装置置驱动驱动因因素与素与架架构构组组成成AI大装置大装置驱动驱动因素因素算力算力需求需求应应用用需求需求深深度度学学习习网网络络模模型型的参数规模越来越大,其对算力的需求迅迅速速翻翻了了几几百百万万倍倍,甚至超超过过对算法精度增长的

23、需求不同行业长长尾尾需需求求增多,拥有巨大商业价值,是打通行行业业价价值值闭环闭环的关键技技术术需求需求技术需求由原先的单单一一开开发发路路径径演化为通通用用模模型型加加行行业业属属性性的开发路径算算 力力 层层平平台台层层算算法法层层模型生产平台数据平台实现数据存储和调用,保障数据安全深度学习训练框架(SenseParrots)计算机视觉算法训练框架,高效利用GPU集群算力深度学习推理部署引擎(SensePPL)支持各种深度学习算法模型在多种后端架构的高效推理工业级模型算法仓提供提供强强大的算力基大的算力基础础,支撑,支撑对对海量数据和算法模型的分析、海量数据和算法模型的分析、训练训练和推理

24、和推理SenseCore商商汤汤AI大大装置架构装置架构算法工具箱(已开发17000+个算法模型)算法开源框架(GitHub上超30000颗星)基于平台基于平台层层生生产产的的创创新算法模型,向企新算法模型,向企业业开开发发者提供算法工具,助力其者提供算法工具,助力其实现实现智能化升智能化升级级;打造算法开;打造算法开源源计计划划(OpenMMLab),),与社区开与社区开发发者共同构建者共同构建创创新生新生态态三三位位一一体体的的工工作作联联通通与与集集成成化化打造打造创创新的人工智能通用算法开新的人工智能通用算法开发发平平台台,实现实现从数据存从数据存储储、标标注到模型注到模型训练训练、生

25、、生产产、部署、部署、测试测试的全的全链链路、批量化路、批量化过过程程自建AIDC(ArtificialIntelligenceDataCenter)AI芯片AI传感器商汤于上海临港建设的新型人工智能计算中心,目前看将是亚洲最大的人工智能算力中心,总算力可达3740Petaflops,1天内可处理时长23600年的视频11第11页,共20页。商汤科技来源:研究院自主绘制。平台平台层层个人生活个人生活算力算力层层算法算法层层AI芯片芯片+AI传传感器感器+AIDC数据平台数据平台+训练训练框架框架+推理部署推理部署引引擎擎+模型模型生生产产平台平台算法工具箱算法工具箱+开源框架开源框架智慧健康智

26、慧健康智慧文旅智慧文旅AR特效SenseCare智慧诊疗平台医院综合解决方案加速AI规模化落地,降低算法模型的生产成本,加速人工智能规模化落地全面覆盖长尾应用场景,打通商业价值闭环打造全新商业模式,构建物理空间的数字化搜索引擎及推荐系统实现高效率、低成本和规模化的AI创新与赋能SenseCore商汤AI大装置是商汤打造的新型人工智能基础设施,作为三位一体的业务智能化发动机,其构建了一整套端到端的架构体系,打通算力、平台和算法之间的连接与协同,能够大幅降低人工智能生产要素的成本,从而实现高效率、低成本、规模化的AI创新和赋能。商汤AI大装置的推出将实现人工智能以自动化、自适应的方式进行生产和落地

27、,解决城市管理、企业服务和个人生活中的长尾应用问题,打通商业价值闭环,进而构建物理空间的数字化搜索引擎和推荐系统。通过SenseCore商汤AI大装置,商汤科技致力提高人工智能的生产效率的本质,推动人工智能进入工业化发展阶段,向着“AI赋能百业”的目标砥砺前行。SenseCore商商汤汤AI大装大装置置致力致力“AI赋赋能能百百业业”行行业业价价值值企企业业服服务务智慧零售AI数字员工旅游区管理AI+AR游览智慧机场智慧酒店智慧车站智慧校园城市管理城市管理智慧城市智慧城市智慧交通与自智慧交通与自动驾驶动驾驶智慧人群管理危险行为/物体/垃圾等检测城市治理闭环一网统管自动扶梯安全智能响应系统道路积

28、水道路识别行人检测车辆检测道路空间识别生命通道占道共享单车倾倒疲劳驾驶检测图像处理美颜美体发动发动机机驱动驱动SenseCore商商汤汤AI大装置大装置12第12页,共20页。第四范式来源:根据公开资料整理绘制。来源:根据公开资料整理绘制。企企业级业级AI操操作系作系统统提供覆盖软硬一体算力、数据治理及模型开发的AI基础资源第四范式成立于2014年,是人工智能平台与技术服务提供商。依托国际领先的机器学习技术与丰富的行业实践经验,第四范式可解决企业在智能化变革中面临的AI应用门槛较高、落地价值受阻、算力投入激增等实际难题。其SageOne软件定义算力平台、Sage AIOS 2.0 人工智能平台

29、底层操作系统、HyperCycle ML/CV等应用开发工具为下游客户提供了覆盖算力、数据治理与模型开发部署等各模块的AI基础资源。第四范式通过助力下游客户轻松落地AI应用并降低AI总体拥有成本,全面支撑企业智能化能力构建,目前已在金融、零售、制造、医疗、能源、互联网等领域成功落地上万个AI应用。第四范第四范式式SageOne-软软件定件定义义算力算力平平台台第四范式第四范式SageAIOS2.0企企业级业级AI操作系操作系统统AI时时代数据、代数据、应应用、算力高效用、算力高效联联接接数据数据联联邦邦安全发挥更高数据价值算力算力联联邦邦轻松释放异构分布式算力应应用用联联邦邦高效组装个性化解决

30、方案数据全生命周期能力构建,让数据变得即插即用多元异构数据统一接入时序数据分组管理“时序、闭环、一致”,提供面向AI的数据治理将PC操作系统中“文件格式”概念引入到AI领域中,使用者可一键获取高质量数据自自动动化的大化的大规规模、分布模、分布式式、异、异构构计计算算资资源管源管理理与与调调度度。为了应对AI异构资源(CPU/GPU/FPGA/ASIC/NPU)及AI大规模、分布式特点,基于容容器器冻冻结结与迁与迁移移技技术术,自动化地根据任务运行与资源支持情况对资源进行动态管理与调度使AI平稳运行,大幅提升资源利用率与任务成功率,高效直达业务价值定义软件集成标准,快速开发和集成应用,通过集成丰

31、富的第三方生态APP,端到端的解决各种业务的智能化问题3200智能智能应应用用丰富的数据形式丰富的数据形式广告点击率预估精彩内容推荐交易反欺诈逾期预测开放数据治理标准与规范MLCVNLPKGBIHyperCycle开放应用集成标准与规范1台台SageOne运行运行2-3天天高高级级科学家科学家0.375人天人天汽汽车电车电商平台推荐商平台推荐场场景景SageOne节节省省离离线训线训练练TCO达达93%单场单场景成本景成本3461RMB可可节节省省44032RMB1台台8卡卡GPU服服务务器器TensorFlow高高级级科学家科学家16人天人天单场单场景成景成本本47493RMB单场景成本高V

32、S餐饮零售场景(日活200W+)SageOne节省线上推理TCO超40%高级版SageOnePK1通用服务器推理引擎成本节省42%高级版SageOnePK2通用服务器存储引擎RTIDB节省48%的成本对比GPUSageOne大幅缩短机器学习训练&AI端到端建模时间SageOneTensorFlow+GPUXGBoost+GPUSageOne实现实现效果效果LR训练时间缩短12倍倍;机器学习端到端建模时间缩短6倍倍以上以上GBM训练时间缩短7倍倍13企企业级业级APPStoreAIOS2.0第13页,共20页。第四范式自动决策类机器学习平台赋能企业加速实现智能化转型AI技术在各领域多业务环节的落

33、地应用可有效驱动营收增长、降本增效、优化业务模式,为企业带来显著收益。现阶段甲方企业对AI应用模型开发的诉求日益增长,但同时面临着AI技术门槛高、规模化落地效率低;模型效果不佳、AI难以提升业务表现;AI整体成本投入昂贵等痛点。第四范式自动决策类机器学习平台基于HyperCycle ML技术架构,可自动完成从数据引入到模型应用的AI闭环全流程,帮助企业降低应用门槛,赋能业务专家参与AI建设;实现高维、实时、闭环自学习的模型效果;从AI全流程出发提升算力应用效率,助力企业端到端解决AI落地难题、加速抢占市场机会、维持领先优势。来源:根据公开资料自主研究绘制。来源:根据公开资料自主研究绘制。Hyp

34、erCycleML技技术术架构架构实现实现AI全全流流程程业务业务系系统统智能推荐智能营销智能风控智能合规智能运营存储引擎Kafka中间件层数据管理数据全生命周期管理进程管理提供AI调度、计算平台服务管理高实时、高稳定性的AI运行环境监控管理AI应用监控运维引擎HDFS计算引擎MySQLRTIDBFlinkFEDBSparkGDBT面面向向用用户户HyperCycle场景模块场景定义数据蓄水数据蓄水数据回流数据回流场景蓄水场景管理全流程自动建模模块自动数据清理自动特征工程自动算法调优自动模型选择在在线线模模块块预估模块数据建模方案实时预估批量预估自学习模块增量自学习全量自学习&模型数据回流模型

35、行为数据反馈数据辅助数据行为数据打分结果 反馈数据数据数据HyperCycle ML服服务务画像客户风险识别智能智慧营销运营HCML平台助力金平台助力金融融客客户户加加速速实实现现AI规规模模化化落地落地某大型国有某大型国有银银行行2019年落地年落地100+业业务务场场景景数据化业务运营安全智能生活信用增值客服服务管理服务指标服务数据数据资产管理数据开发主题/贴源/知识数据治理依托HCML快速实现AI应用场景的落地,加速业务AI转型基于AutoML技术的模型效果媲美人类数据科学家模型效果,为业务带来真正的价值帮助客户将上万名数据分析人员转化为AI数据科学家,实现人才梯队培养模型效果模型效果提

36、升近20%某股份制某股份制银银行行落落地地手手机机银银行行APP组组合合推推荐荐项项目目数据回流闭环,模型效果持续提升0.7520.7490.82在同样的验证集下,一期人工建模AUC=0.719模型评估指标AUC(Area under the cerve)实施周期实施周期缩短近70%2018&2019年组合推荐一期单模型上线时间三个月2020年组合推荐项目单模型上线时间一个月人力成本人力成本节约近60%科学家开发架构师1人月4*1=1人月1人月2*3=6人月4*2=8人月1.5*2=3人月14第14页,共20页。爱数智慧三大业务基石共同赋能下游五大行业,战略布局升级爱数智慧是一家多模态数据服务

37、商,为从事语音识别、语音合成、自然语言理解等人工智能领域企业和机构提供数据服务,迄今已与上百家伙伴达成合作。为更好服务下游企业,爱数智慧布局了MagicHub.io开源社区、对话式AI训练数据集与Annotator5.0智能化标注平台三大业务基石。MagicHub.io开源社区提供多元、海量的开源数据集,让AI开发者迅速适配训练数据、达到开箱即用的效果;AI训练数据集累计时长超15万小时,覆盖60多种语种,包含ASR、TTS等训练数据集,且采集设备、对话场景多样,保障数据的广覆盖、多维度、强时效、高精度与合规性;Annotator5.0智能化标注平台分为企业私有化部署版和个人SaaS版,在企业

38、端部署时具备简单快捷、易运维、AI辅助高效标注等特点,预计可降低近50% 的综合成本,提升100%的数据标注工作效率。三大业务基石相互辅助,共同为下游五大行业提供相应的数据解决方案,赋能下游各行业的场景应用。虚拟助手语音输入法机器翻译智智能能终终端端五大行五大行业业解决方案解决方案爱爱数智慧数智慧战战略布局略布局三大三大业业务务基基石石覆盖覆盖五五大行大行业业Annotator5.0智能化智能化标标注平台注平台MagicHub.io数据开源社区数据开源社区多模多模态标态标注注可可视视化管理化管理标标注注项项目目任任务务可拆分可拆分辅辅助智能助智能化化标标注与注与质检质检30+方言方言20+场场

39、景景100+语语言言5000+小小时时政府政府企企业业科研科研机机构构MagicHub.ioAI开开发发者者优势:覆盖性、多维度、时效性、高精度、合规性智智慧慧金金融融智能客服智能电销智能会议智能质检对话机器人客 服 场 景智智慧慧出出行行电话营销 智能客服智能质检智能座舱车内交互车内唤醒模式命令控制内容检索异常监控 天气预报智智能能家家居居内容审核实时字幕智能推荐语音翻译智智能能社社交交对话式AI训练数据集特点与优势采集设备对话场景电脑麦克风对话式录音笔朗读式智能手机麦克风阵列自发式采集环境数据集种类语种数量录音间室内室外车内ASRTTSNLP常用语种中/英/日特色语种印尼/泰/八大方言四川

40、/粤/来源:研究院自主绘制。15第15页,共20页。爱数智慧交付质检方式采集清洗标注成为首批首批通过ISO/IEC27701:2019标标准准认证认证企业质检两大助力:数据配比2-8原则与ISO/IEC 27701认证为帮助下游企业在AI应用模型开发环节中降本增效,爱数智慧提出数据配比2-8原则,即数据配比需考虑80%数据的通用性与20%数据的定制性。数据识别率包括三个等级:第一等级为0-90%,第二等级为90%-95%、第三等级为95%-99%。第一等级的大多数场景只需使用标准化训练数据集即可满足开发要求;第二等级的场景可搭配使用标准化训练数据集与定制服务,第三等级才真正需要定制的数据服务。

41、在实际任务开发中,若客户基于数据通用性的考虑、搭配标准化训练数据集,就可满足其大部分的业务需求,节省完全定制所消耗开发成本,提升开发效率。此外,爱数智慧加密与监控数据的整个生产流程,这为其通过ISO/IEC27701:2019标准认证创造了必要条件之一。在采集环节,爱数智慧对数据进行实时审核,确保数据来源的可靠性;在质检环节,爱数智慧采取人工与AI协作的方式对数据进行检验,NLP模型、机器学习等AI技术提升了质检效率的同时,也保证了审核的准确性。数据配比数据配比2-8原原则则与数据与数据加加密密监监控控加加密密与与监监控控数数据据生生产产流流程程对数据进行实时审核人 工 进 行 比 例 抽 样

42、模型、AINLP抽模取型,、包机 括器语学音习数据配比数据配比2-8原原则则帮助企帮助企业实现业实现降本增效降本增效9095%数据数据识别识别准确率准确率标标准化准化+定制服定制服务务090%标标准化准化训练训练数据集数据集9599%定制服定制服务务客客户户所所需需数数据据配配比比比比率率指导通用数据集耗时0h总时长总时长投入投入:1000*4+0=4000h单单任任务时长务时长:1000h定制定制定制定制耗时耗时耗时耗时1000h1000h1000h1000hVS 总时长投入降低,开发成本降低;单时长提升,任务处理效果更好数据安全与数据安全与隐隐私私通用数据集耗时1600h总时长总时长投入投

43、入:400*4+1600=3200h单单任任务时长务时长:400+1600=2000h任务A任务B任务C任务D100%定制0%通用通用20%定制80%通用通用定制定制定制耗时耗时耗时400h400h400h定制耗时400h3200h任务A任务B任务C任务D4000h80%通用性通用性来源:研究院自主绘制。1620%定制性第16页,共20页。54人工智能基础层发展洞察目录第17页,共20页。一站式基础层资源平台泛在需求下AI模型生产模式的变迁与资源集成在人工智能由技术落地应用阶段向效率化生产阶段转变的背景下,认为人工智能基础层的各模块工具有望走向集约型的生产模式。该模式主要能赋予开发企业以下价值

44、:1)开发方式改进:从客户需求分析到解决方案部署形成独立的闭环,构建端到端的工作流。在强大算力的支持下,完成数据采集、数据标注、数据治理、数据应用、模型设计、参数调优、模型训练、模型测试、模型推理的全栈式流水线生产。2)管理效率提升:将数据、算法与算力委托给专业的服务商,实现一站式托管,打通三者之间的衔接壁垒,提高交互友好性,让开发者专注于业务。3)部署成本降低:集成数据、算法、算力的各个软件与硬件,企业可在一个平台内按需选择自己所缺失的模块组件并自由搭配,有效避免因采购不同供应商的产品或服务而带来的隐性成本损失与显性成本损失。一站式基一站式基础层资础层资源平台源平台生生产产模模式式展望展望智

45、能交通系统数据血缘关系容器服务低时延通信精准营销数据面向AI的数据基础服务与治理组件数据数据资产资产化化搜索推荐GPU远程获客工业质检自动化智慧展厅各各类类下游需求下游需求部署一站式基部署一站式基础层资础层资源平台源平台效果效果对对比比主数据管理数据标准建设数据标准建设带宽NPUTPU数据智能XPU算力资源管理XPU内存与存储VPUFPGA疾病预测搜索推荐反欺诈ASICIPU数据权限设置直播带货边缘计算端边缘协同虚拟化AfterBefore单点式工具一站式开发功能模块分裂功能模块衔接部署成本高部署成本低18第18页,共20页。基础层全栈自主可控展望来源:研究院结合公开资料自主研究绘制。算力算力

46、算法算法服服务务器安全器安全OS安全安全交交换换机安全机安全路由器安全路由器安全芯片安全芯片安全云安全云安全开源框架商用版限制开源框架商用版限制自研框架外泄自研框架外泄风险风险数据数据库库系系统统安全安全OS安全安全OA系系统统安全安全ERP系系统统安全安全办办公公软软件安全件安全内内 部部 策策 略略 :在各模块内部以内循环为主,主要是在涉及自主控制风险与安全的节点加强自研力度数据数据 外外部部策策略略:以双循环为主,加强外部交互,学习国内外先进企业、前沿开 发者的技术能力,在“前人“的基础上加深理解,寻求突破与创新GoogleTensorflow百度PaddlePddle自主可控稳步向前,

47、内外兼修信创产业涉及到核心技术问题,受到国家的大力扶持。比如,2020年12月,财政部、发改委、工信部等部门就联合发布了关于促进集成电路产业和软件产业高质量发展企业所得税政策的公告,文中明确指出:国家鼓励的集成电路线宽小于130纳米(含),且经营期在10年以上的集成电路生产企业或项目,第一年至第二年免征企业所得税,可见国家对国产芯片的重视。在信创产业稳步推广的的趋势下,人工智能基础层的各模块也在逐个突破“卡脖子”的关键点,朝着全栈国产化的方向迈进。算法模块相对其他两个模块而言,因开源框架协助,算法开发相对容易,但依然面临开源框架商用版限制的潜在风险,同时,使用开源框架难以友好对接到AI企业的业

48、务逻辑,基于这两点,部分企业已开始自研开源框架并取得一定成效;数据模块的各类操作系统与应用软件在较大程度上仍以国外企业为主导,而国产的操作系统与数据库等软件配套设施正在稳步崛起,已存在相应的产品与服务可供客户选择;算力模块的智能服务器的国产化率逐步提升,AI芯片虽然仍以英伟达的GPU为主导,但国内部分企业开始自研AI芯片,产生了一批针对通用GPU、ASIC与FPGA的先行玩家。总的来说,基础层全栈的自主可控建设还处在萌芽阶段,未来将在“可用”的建设要求上打好根基,向“好用”的状态演变,并且从以政府政策引导为主的局面向以企业产品自由竞争的局面转变。人工智能基人工智能基础层础层所面所面临临自自主控主控制制风险风险与与应对应对策策略略源代源代码码缺失缺失FacebookTyPorchNvidiaCUDA寒武纪TPUGoogleTPURISC-V指令集交互学交互学习习Linux操作系统Unix操作系统注注 意意:此 处 的 内 外部 策 略 同 时 指 代 国内 策 略 与 企 业 内 部 的 策 略; 加 强 自 主 研发 能 力 并 非 重 新 开 始 与闭门造车19第19页,共20页。第20页,共20页。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号