本文作者:访客

腾讯云李力谈同源同构AI原生云,打造贴近企业Agent的解决方案

访客 2025-09-23 17:13:46 80791
腾讯云李力表示,他们坚持同源同构的理念,致力于为企业打造更贴近Agent的AI原生云,这意味着他们致力于构建一个与人工智能Agent紧密集成的云环境,为企业提供更加智能化、高效化的解决方案,这种AI原生云能够更好地适应企业的需求,提升业务运行效率,助力企业在数字化时代取得更大的成功。

9月17日,在2025年腾讯全球数字生态大会Agent+Infra专场,腾讯云副总裁李力宣布腾讯云智算全面升级。腾讯云智算面向更贴近Agent的AI Infra建立包括Agent Infra解决方案Agent Runtime+云专家服务智能体Cloud Mate与全链路安全能力为一体的完整解决方案,帮助Agentic AI 从实验室走向生产级。

李力表示,同源同构是贯穿腾讯云产品设计与服务能力的核心原则,也是其应对行业需求、面对技术变革、支撑全球化布局的关键逻辑。这一原则包含双重核心内涵:一方面,以一致的代码体系、服务标准与产品特性,同步服务腾讯微信、QQ、游戏等自研业务与外部客户,通过自用自验提前解决技术痛点,向行业客户交付成熟的技术与服务;另一方面,实现公有云、专有云、边缘计算、分布式云及国内外服务的能力统一,即便海外开区,机房标准与功能体验也与国内完全一致,保障全球化服务的一致性。

腾讯云李力谈同源同构AI原生云,打造贴近企业Agent的解决方案

这一云计算时代坚守的原则,在智算领域展现出更大的价值:例如在存储层面,腾讯云凭借十年来打磨的CBS、CFS等存储产品,即可完美匹配AI对存储的性能需求,而无需推导重构一套适配于智算时代的存储底座。可以说,智算的兴起进一步凸显AI原生云的优势。李力强调,同源同构是腾讯云IaaS体系的核心调性,它不仅是产品技术层面的标准,更是腾讯云在AI Agent时代为客户提供稳定服务、支撑全球化拓展的底层逻辑,也为客户降低跨场景、跨区域的技术适配成本。

他认为,与AI时代相比,Agent时代对Infra的需求出现了全新的变化。未来两年,部署AI Agent的企业数量将翻番,相关支出增幅将达到192%。按照行业惯例,云基础设施的建设支出,将会比AI Agent的支出更大。大量企业将会提前投资、储备云基础设施,已适配业务需求的重大变化。但部分企业仓促落地的智算中心,往往采购大量高端硬件设备,但却因为配套设施(存储、网络、安全、运维等)建设上的之后,陷入闲置风险。这不仅导致成本与时间的巨大消耗,也会导致错失关键市场窗口期。

要解决这个现状,就需要注意到AI Agent时代对Infra提出的新要求。一是更快的模型推理效率。这意味着除了提供又快又稳的底层能力之外,Infra还需要具备更贴近业务、从底层向上辐射的价值。为了让模型推理更快,可以基于云的角度去做一些探索,在Infra底层技术和工程创新上帮助AI落地更加顺畅。二是更灵活的工具集成。实际上在部署和运行Agent的过程中,Agent本身就是一个工具,能调用哪些工具,是否好用也没有明确的目标。但最终的目的,是像人的手脚一样,能够形成工具的集合,在一个工具自动运行的时候,其他工具能够协同辅助,让Agent延展的更广,得以体现它的智能优势。三是稳定的系统保障。在通用计算场景下,业务和底座是分离的。但到了智算时代推理阶段,模型和业务天然绑定在一起。假设企业的核心业务已经在云上跑,要把它迁移到智算平台,那就会对存储、网络、中间件提出巨大挑战,对平台的系统保障提出了非常高的要求。

腾讯云李力谈同源同构AI原生云,打造贴近企业Agent的解决方案

针对智算时代的新需求、新挑战,腾讯云智算提出要成为更贴近Agent的智能引擎。它包括AI Infra灵活底座+AI Infra多元硬件、AIinfra高性能软件,以及全新升级发布的Agent Infra解决方案Aggent Runtime、云专家服务智能体Cloud Mate以及全链路安全能力。

在底座上,腾讯云智算持续进行优化提升,成为更贴近Agent的AI原生云。在硬件层面,支持一云多芯、软硬协同,支持多样硬件生态,支持自研及第三方交换机;在软件层面,提供大语言模型加速(TACO-LLM推理效率提升100~130%)、文生图模型加速(TACO-DIT推理效率提升122%)、推理集群即服务(HAI分钟级拉起满血模型,高缓存命中)等核心升级。他举例说,基础设施的升级能够显著影响客户体验。例如在游戏场景频繁扩缩容、或者终端厂商提供模型服务切换底层模型的场景,都高度依赖云平台的扩缩容速度。而腾讯云历史上沉淀的创建速度快的优势,在智算时代继续成为了客户认可的禀赋。

腾讯云李力谈同源同构AI原生云,打造贴近企业Agent的解决方案

在模型推理层面,腾讯云智算高性能软件的升级,能够助力推理集群性能发挥到极致。一方面,实现模型启动效率的飞跃——依托HML去中心化加速模型拉取、RDMA高速网络与GooseFS等,大规模扩容场景下整体服务拉起时间从10分钟大幅压缩至34秒,模型启动速度提升17倍,让AI服务能像消费电子设备般即开即响应;另一方面,在多模态推理加速上实现突破:腾讯自研的TACOKit推理加速引擎,通过文生图并行化处理等技术,使生文、生图、生视频模型,在大部分场景下性能提升4倍以上,有力支撑客户海量图像生产、快速创意迭代的需求。借助全局共享KV缓存、TRMT通讯协议、PD分离部署、模型量化等底层技术优化,客户无需额外适配,就能获得极致推理速度,大幅降低AI推理能力落地的技术门槛。

腾讯云李力谈同源同构AI原生云,打造贴近企业Agent的解决方案

在工具集成层面,腾讯云智算全新发布Agent Runtime云沙箱,为Agent提供安全隔离的执行环境。Agent Runtime脱胎于腾讯云原生已有的体系,实现Infra服务的极致无缝化。它能快速创建运行环境,支撑大规模Agent应用落地;它将基建运维做到极致无感,用户无需关注底层资源调度逻辑,计算资源会按需凭空出现,完成任务后自动释放,全程无需手动开关机或配置环境。

腾讯云李力谈同源同构AI原生云,打造贴近企业Agent的解决方案

在系统守护方面,腾讯云智算发布Cloud Mate云专家服务智能体,基础设施向主动服务跃进。李力说,AI让Infra变得更智能,更可靠,具备主动服务的特性。Cloud Mate 云专家服务智能体以实时监控、操作审计、资源配置、日志等基础能力为底座,结合预测与诊断模型,再通过自动化执行工具,构建起源头风险预防-运营风险规避-智能运维的全链路主动服务能力。一方面,能对云环境中SQL性能瓶颈、潜在安全漏洞等进行智能预判与精准诊断提前拦截高峰扩容等场景下的隐性风险;另一方面,借助AI从海量日志中自发挖掘潜在问题并推动专家响应,让海量服务器与算力资源的管理更可控、更智能。在实践中,Cloud Mate已经能够实现3分钟快速诊断,准确率超过95%。

腾讯云李力谈同源同构AI原生云,打造贴近企业Agent的解决方案

机器人正在成为AI发展落地的重要方向,但具身智能也面临着显著挑战。一方面,具身智能缺乏大语言模型所具备的天然、开放、海量的数据,而具身数据和硬件高度绑定,对数据质量的要求极高;另一方面具身智能依赖的多模态感知,需要整合图像、文字、声音甚至触感等多元信息,实现综合交互的作用。腾讯依云通过HAI推理集群联合自研具身智能产品Tairos,提供具身感知与规划模型服务,以多模态、全托管、独享算力、安全稳定为核心特性,为机械臂、人形机器人等设备打造专属、跨本体的云上大脑。

腾讯云李力谈同源同构AI原生云,打造贴近企业Agent的解决方案

李力介绍说,腾讯云智算还在通过一些基于AI的特性解决开发领域中的一些难题。推出OrcaTerm AI原生智能终端,以AI整合服务器环境信息为核心,支持脚本生成、应用部署、业务排障等全流程操作,让服务器带内操作如自然对话般简单。这个探索产品上线后,很快就实现了数万日活、用户平均停留数个小时的好成绩。在轻量云服务器等产品探索AI化服务,解决传统海量文档对用户的过度消耗。

腾讯云李力谈同源同构AI原生云,打造贴近企业Agent的解决方案

李力表示,目前,腾讯云智算已经服务了国内90%的大模型厂商,并为交通出行、工业制造、教育培训、具身智能、医疗健康、金融保险等千行百业提供了高效、好用的云智算解决方案。腾讯云希望,通过Infra让AI变得更好,也通过AI让Infra变得更好。

阅读
分享