市场研究公司Omdia在一篇最新报告中针对中国电信(601728)人工智能研究院(TeleAI)的AI Flow(智传网)进行了深入解读与分析,称其所具备的创新使中国电信成为电信基础设施和服务智能转型方面的领导者。
以下为这篇Omdia报告的全文内容:
生成式人工智能(GenAI)的快速发展带来了人类生产力的范式转变。基础模型现在展现出前所未有的多功能性,能够处理从文本、语音到图像、视频和代码等多模态输入,并生成高度准确的结果。这种类人理解和生成能力使基础模型实现了高度任务自动化和员工能力增强。
实现这些能力需要巨大的计算资源,迫使基础模型驻留在提供弹性可扩展性的云环境中。然而,云中心方法带来的效率和灵活性被严重的延迟成本和数据安全风险所抵消。当所有交互必须通过云服务器时,不同设备之间的协调效率低下。
因此,网络边缘的许多关键业务应用和关键任务应用无法承受这种延迟、隐私或可靠性问题,导致企业将模型处理保留在本地设备和企业内部。然而,以设备为中心的方法完全将设备用户与GenAI提供的好处隔离开来。基于基础模型的设备上GenAI应用在推理过程中需要大量计算和存储资源。从模型角度看,主流的基于transformer的基础模型并非为信息共享和知识传输而设计,严重限制了网络边缘推理工作负载的优化。随着模型被整合到复杂的智能体AI系统中,缺乏无缝协调限制了它们的潜力。
Omdia观点
在边缘实施GenAI带来巨大的挑战,包括计算资源有限、能源限制、和跨异构设备分配AI工作负载的复杂性。云中心和以设备为中心的方法都不是很适合实现高效的边缘GenAI部署。虽然芯片组厂商、硬件制造商和模型开发者提供了能够极大地提高本地GenAI处理能力的先进技术,包括专用AI芯片组、小型语言模型(SLM)、键值(KV)缓存和模型压缩(蒸馏、量化和剪枝),但是当部署在异构环境中时,这些技术仍受到前述不足之处的限制。类似自动驾驶和无人机以及具身智能等新的GenAI驱动的应用受欢迎程度迅速增长,这创造了对能够跨异构计算环境高效运行的分布式智能解决方案的迫切需求。
为什么追踪TeleAI?
TeleAI,即中国电信人工智能研究院,通过其AI Flow(智传网)框架首创了分布式GenAI部署的多学科方法。AI Flow是TeleAI在中国电信首席技术官兼首席科学家李学龙教授的领导下开发的一种创新框架。该框架通过设备-边缘-云的层次架构集成信息技术和通信技术,该架构由家族模型和协作模型操作支持。通过跨设备、边缘节点和云服务器分配推理工作负载,适应动态网络条件,以及优化推理过程,这些创新使AI Flow能够直接在网络边缘集成智能能力。这种创新方法使中国电信成为电信基础设施和服务智能转型方面的领导者。
市场现状
GenAI前景广阔
GenAI是一种变革性技术,可改变用户对AI能力和可能性的认知。自2022年底GenAI出现以来,该领域经历了快速的演变:
·由大型语言模型(LLM)驱动的对话式AI工具(如ChatGPT和通义千问)提供类人的响应和交互。这些工具还能够执行大规模网络搜索,生成详细的长篇报告,并相当准确地翻译多种语言。
·认识到其商业潜力后,厂商开始集成多模态能力,开发的基础模型通过视觉语言模型(VLM)处理和生成文本和语音以外的输出,如代码、图像和视频。
·纳入诸如强化学习、思维链推理和测试时扩展等新技术使模型能够支持复杂任务,包括数学推理和编码。除了这些应用,拥有增强的推理能力的模型还整合视觉和语言信息,从而提高通过视觉和文本输入进行推理的能力。
·利用基础模型的任务完成和推理能力,可将基础模型用于创建智能体,以执行特定领域任务,如客户服务、商业智能、运营自动化和增强个性化。为促进智能体的部署,厂商推出了模型上下文协议(MCP)和Agent2Agent(A2A)等开源协议,以创建一个能够执行复杂、跨领域任务的多智能体系统。
云中心计算方法面临的挑战
这些进步改变了许多行业,并解锁了在先进自动化和增强方面的巨大潜力。然而,这些GenAI应用和赋能它们的模型为云环境而设计,且在云环境中构建。云中心的方法通常无法高效地平衡性能要求与资源限制。没有强大、灵活的计算资源,这些复杂的GenAI模型就不能正常工作,在完成基本任务时举步维艰。
随着AI应用日益普及,对智能能力更靠近数据生成位置的需求也在不断增长。在需要实时处理、隐私保护或在带宽受限环境中运行的场景中,集中式方法显露出局限性。因此,行业需要实施边缘GenAI的新方法。
目前,行业愈发专注于通过轻量级模型和专用AI芯片组支持设备上GenAI处理,这是芯片组厂商和设备制造商所青睐的主流方法。轻量级GenAI模型与用于设备上推理的专用AI芯片组结合减少了能耗,降低了对云推理的依赖,并带来增强的隐私性。自从模型嵌入设备或本地服务器,处理就高度本地化,并需要模型和AI芯片组的高度优化。
因其架构,本地化GenAI模型重度依赖于本地AI计算资源,从而限制了模型的规模和性能。诸如自主无人机、自动驾驶汽车和人形机器人的先进应用不断需要更多计算资源,因为从各种来源(包括自动驾驶系统、驾驶舱和环境传感器)持续收集的高清数据流被输入到复杂的VLM和视觉语言行动模型(VLAM),以生成高度准确的输出。这些模型的大小从几十到几百千兆字节不等,因此无法在大多数设备上部署。
此外,现有模型压缩方法,如量化、蒸馏和剪枝,通常为追求性能和成本优化而牺牲模型能力。该方法削弱了这些模型的能力,影响了它们的性能和可靠性。
需要新的GenAI计算范式
注意到上文提到的不足之处,其它行业参与者快速转为建议实施边缘GenAI的新方法。减少对云基础设施的依赖和寻找更多超越设备限制的资源引发了对边缘计算基础设施的考虑。电信运营商位于这一想法的前沿。大多数不足之处可以通过紧密集成信息计算和通信技术解决。
目前,边缘计算架构广泛部署于内容分发网络(CDN)、工业云和无线电信基础设施中。这些服务器部署在云基础设施的边缘,主要用于缓存、高级数据采集与处理以及托管轻量级应用。作为云服务器与边缘设备的中介,它们作为工作负载处理的额外层,减少带宽使用并增强可靠性,因此,当配有AI推理芯片组时,这些服务器能够作为本地基础设施实现分布式智能。
另一个关键组件是连接。通过确保无缝工作负载交接与经稳定和低延迟连接协议分配智能工作负载,GenAI模型能够适应不同的网络条件、设备能力和应用要求,同时维持性能和效率。稳定可靠的连接还对确保多智能体系统的性能至关重要。不同设备上的智能体能够共享信息和洞察以执行超越单个智能体能力的任务,因为它们能够动态地调整、协调和合作以应对现实世界的应用。
简言之,异构计算资源与无缝连接的集成能够带来分布式智能方面的大幅提升。由于在管理复杂网络协议方面数十年的经验,电信运营商位于实现这一趋势的前沿。除了利用其丰富的网络资产,电信运营商有良好的定位,可交付企业级网络管理、流量管理和安全运营,从而确保无缝和可靠的服务。
AI Flow概述
AI Flow是TeleAI提出的一种新型计算方法,通过结合信息技术和通信技术解决边缘GenAI实施挑战。该方法引入了跨越边缘设备、边缘服务器和云服务器的层次架构。基于这一架构,TeleAI设想推理工作负载可以在不同层之间共享,同时不影响速度和质量。AI Flow引入了几种协作推理范式,包括:
·需要中等计算资源的任务的设备-边缘协作
·需要大量计算能力的复杂任务的设备-边缘-云集成
实施策略将每个推理步骤放置在最合适的硬件上,优化性能和效率。
最重要的是,这种结构实现了推理任务的灵活分配,初始数据处理发生在网络边缘,而更复杂的计算在必要时利用云资源。这允许基于任务需求和可用资源进行动态工作负载分配。
为确保信息流和知识共享的无缝进行,该框架依赖于一种称为家族模型的模型架构。家族模型是具有高度灵活参数配置的基于transformer的基础模型的子集。这种新型模型架构支持对总参数数量进行精细调整,通过transformer块内线性层的自适应权重分解实现。这一特性使其能够轻松部署在各种设备上。
家族模型的灵活性使用户能基于实时网络条件进行自适应资源分配。具体而言,AI Flow架构在云端基础设施的强大计算集群上部署了具有数百亿参数的大模型,同时在资源受限的用户设备和边缘服务器上部署了更轻量级的家族模型。这些模型共享可跨设备传输的相同特征,从而使工作负载分区更有效地满足计算需求和提高数据传输效率。
该设计支持分段式推理,边缘设备的较小模型生成初始推理输出,传输至邻近的边缘服务器进行改进以增强准确性,最后返回至用户。由于交换是近实时的,用户将收到大幅改进的输出,因为该架构能够从托管在边缘服务器上的大型模型获得更丰富的响应,而不是仅依赖于托管在用户设备上的较小模型。
AI Flow促进无缝的智能流动,允许设备级智能体克服单个设备的限制,实现增强的功能。相同的通信网络能够跨异构节点连接先进的LLM、VLM和VLAM。通过促进实时的协同集成和这些模型之间的动态交互,该方法实现了超越单一模型能力的涌现智能。AI Flow的核心是利用部署在网络边缘协作多智能体系统(MAS),在那里互连的智能体一起解决需要适应能力和快速响应的复杂、现实世界任务。边缘计算与基于智能体的系统的协同效应提高了AI应用的可扩展性和效率,因为这些智能体能够共享中间表示、上下文信息和反馈信号。TeleAI认为AI Flow会改变具身AI、可穿戴设备和智慧城市应用等新兴GenAI应用的游戏规则。
公司介绍
背景情况
中国电信成立于2000年9月,是一家在《财富》杂志“世界500强企业”中有极大影响力的国有电信巨头,拥有超8000亿元资产,年收入超721亿美元。该公司历来是移动通信网络方面的领导者,最近将其战略重心转向AI和数字化转型。TeleAI(中国电信人工智能研究所)在建立该公司的“1+1+1+M+N”AI系统框架方面起重要作用。该框架指1个智算云底座、1个数据底座、1个星辰基础模型、M个内部大模型以及N个行业特定大模型应用。该基础模型已在政务、医疗保健、教育等50多个行业中部署,赋能全球超600个项目,且服务超过100个国家和地区。
现状
TeleAI于2024年5月成立,并于2024年7月正式揭牌。在在中国电信首席技术官兼首席科学家李学龙教授的领导下,TeleAI正在加速AI Flow研究,同时拓展AI治理、AI智能体和智能光电子(重点关注具身AI)等关键领域。该研究所是GenAI领域的重要创新者。它建立并发布了星辰基础模型系统,涵盖语义、语音、视觉和多模态能力四个关键领域。此外,TeleAI还完成了中国首个利用超过10000个国产图形处理单元(GPU)训练的万亿参数大模型。
2025年2月,该研究所发布了AI Flow的研究成果,这是一个旨在通过有效利用设备、边缘节点和云服务器之间的异构资源来优化推理过程的新型框架。通过各种GenAI模型之间的创新连接和交互范式,AI Flow实现了超越任何单一模型能力的涌现智能,使强大的AI应用能够在网络边缘运行。
未来计划
展望未来,TeleAI将扩展AI Flow在边缘智能、LLM、多模态AI、联邦学习和智能网络管理等先进领域的范围和能力,以推动AI Flow在现实世界部署中的能力进步。通过其结合信息技术和通信技术的多学科方法,中国电信正在重塑行业格局,实现不同领域中智能技术的大规模应用。该公司认为AI Flow能够帮助弥补GenAI应用的高要求与边缘设备受限本质之间的差距,同时促进跨异构系统的协作。
为推广其GenAI能力,TeleAI正积极与全球行业参与者建立合作伙伴关系,以创建一个开放的AI生态,探索更多智能应用场景,并加快AI技术的全球采用。该公司的全球AI生态合作计划代表朝着建设下一代全球数字基础设施迈出的重要一步,它将利用AI技术深度赋能各行各业,推动数字经济向前发展。中国电信还在通过全球云网宽带产业协会(WBBA)等各种行业组织推广其GenAI议程,以加快GenAI技术的全球采用和实施。
分析师点评
GenAI的进步已导致其在多个行业的广泛采用。根据Omdia的人工智能软件市场预测,全球GenAI软件收入预计将在2025年达到263亿美元,到2029年增长至1013亿美元。领先市场包括零售、金融服务、医疗保健、自动驾驶和媒体娱乐。在所有用例中,人形机器人、自动驾驶和自主无人机等边缘GenAI应用是增长最快的领域之一。不幸的是,这些设备资源受限,需要超低延迟以实现准确推理和多智能体协调。
Omdia认为AI Flow在这些复杂应用的实现中扮演关键角色。作为结合计算和通信技术的框架,AI Flow展示了负载平衡、工作负载调度和高效资源分配的复杂方法。随着边缘AI部署规模扩大和多样化,这些能力将变得越来越重要,需要跨异构环境进行智能编排。设备-边缘-云计算架构战略性地将每个推理工作负载放置在最合适的硬件上,优化性能和效率。家族模型的引入实现了用户设备和在线服务器之间的协作推理,而AI Flow的三层架构支持分布式智能系统中的可扩展多智能体协作。
随着这些技术的成熟,该框架的灵活架构将能够整合新的计算范式和通信协议,确保长期相关性和适应性。AI Flow也有良好的定位,可以与6G和量子计算等新兴技术集成,以解决未来在安全、隐私和可扩展性方面的挑战.
广源优配-广源优配官网-十大配资公司排名-线上股票炒股配资提示:文章来自网络,不代表本站观点。