快手AI技术稳定性提升
快手AI技术已经在不断进步,但仍需更稳定的表现,快手公司正在致力于提升其AI技术的稳定性和性能,以满足用户的需求,通过不断的技术研发和优化,快手AI有望在未来实现更加稳定的表现,为用户提供更好的使用体验。
2026年元旦刚过,韩国社交平台掀起了一场“静态图片动起来”的挑战赛。只需上传一张照片,用可灵APP绘制简单轨迹,就可以生成流畅的动态视频,比如卡通人物跳女团舞、宠物跳街舞、流动的云朵等等,这些充满创意的内容已获得超数亿播放量。
得益于这个在2025年12月推出的“Motion Control”(动作控制)功能,可灵APP 在海外可谓“屠榜”。据SensorTower数据显示,截至2026年1月初,可灵在韩国图形设计类应用榜单登顶,在美国、土耳其等市场跻身前十,单月下载量突破50万次,日流水峰值较12月中旬暴涨150%。
可灵的表现带动了快手股价的强劲反弹,今年至今已上涨了18%。
从2024年初OpenAI发布Sora震撼全球开始,视频AI赛道便进入了前所未有的军备竞赛。
如今,将近两年过去,行业格局已经初步清晰:OpenAI的Sora虽然技术领先但商业化进展缓慢,反倒是国内的快手可灵和字节即梦凭借本土化优势和流量生态迅速崛起,在2025年的使用份额中分别占据30%和显著市场份额;海外老牌玩家Runway凭借Gen-3系列保持竞争力,Luma Dream Machine以性价比抢占中小创作者市场。
而曾经风光一时的Pika Labs、部分初创公司则逐渐淡出主流视野,成为这场技术狂欢中"昙花一现"的注脚。
然而,即使是身居前列的领跑者,也并不轻松。2025年到2026年交替之际,包含可灵在内的快手AI业务,一方面用户量、使用量等的快速增长,刺激了股价回升;另一方面内部暗流涌动。
日前,有消息显示,快手副总裁、基础大模型及推荐模型负责人周国睿即将离职。这已经不是第一次快手AI业务的核心高管离职,人事动荡往往是业务状态的侧写,它至少说明,已经站上潮头的快手AI业务,在解决了快的问题后,还要面对稳的挑战。
01
摊开快手近一年的财务数据,AI业务的处境一目了然。2025年第三季度,快手研发投入超过34亿元,但AI相关收入仅3亿出头,这个投入产出比看着确实让人心疼。并且,AI收入占快手整体营收的比重长期徘徊在1%左右这个低微区间。
其中的深层的问题在于,可灵AI与快手主业之间,还没有真正实现协同效应。
可灵的定位偏向专业创作者和影视制作人群,其技术能力更多体现在生成高质量视频上。
然而,快手的核心用户却是下沉市场,“老铁”们更务实,玩快手主要是赚钱(直播带货、电商、短剧分账),对AI需求是“帮我快速出素材、省钱、直接变现”,可灵虽然技术过硬,但早期没完全对准这些痛点——生成视频质量高但时间长、成本高,用户觉得“好是好,用起来不顺手”。
而2025年底那场直播被黑产攻击的事件,则暴露了快手AI的另一个短板。2025年12月22日晚间,快手平台遭遇大规模AI生成违规内容攻击,数万”僵尸账号”涌入直播间传播低俗内容,平台直播功能一度被迫关闭近1小时。
而屋漏偏逢连夜雨的是,快手AI核心团队的高管,去年出现了密集的离职潮。
从2025年8月开始,快手副总裁、大模型负责人张迪在可灵营收破亿后确认离职。据报道,张迪是快手可灵从0到1的关键推手,可灵早期版本的突破几乎都由他操盘,动作一致性控制和视频质量提升都离不开他的主导。他离开快手加入B站担任技术条线负责人后,今年11月又从B站离开,出任淘天集团旗下“未来生活实验室”负责人。
张迪走后,周国睿也传出离职消息。周国睿在快手四年,带领团队探索生成式AI在推荐系统中的应用,核心成果是端到端大模型推荐系统OneRec,该系统已在快手主站和极速版全面部署。
这两位副总裁级大牛的变动,只是冰山一角。据不完全统计,两三年下来快手已有十几位核心AI高管陆续出走,覆盖多模态、推荐、算法等多个关键方向,
对于快手AI来说,技术一号位的连续空缺是个蛮严峻的挑战。尽管张迪离职后,其职责很快由高级副总裁盖坤兼任,但长期来看,没有全职负责人盯战略、定方向,团队的稳定性、战略的连续性和创新的驱动力,都会受影响。
02
张迪、周国睿、王仲远这些人的变动,绝不是简单的一句”钱没给够”能解释的。根据公开资料,快手E10-E15职级年薪约80-500+万元,30%-40%的员工获得股权激励,副总裁级别的技术高管年薪(含股权)通常在数百万到千万级别。
这些技术精英们的变动,反应出快手在AI战略上的锚点还没找到确定感,它究竟是受技术信仰驱动,还是被变现盈利驱使?
近年来,快手在研发投入上的规模有所下降,资源更多地向商业化倾斜,这是现实所迫。但2025年,这种情况有了明显改观,当季研发支出同比增加了21.2%。并且,快手还将2025年资本支出指引从120亿元上调至140亿元,主要用于可灵AI和广告技术投入。
众所周知,预算是一个组织的牛鼻子,投入重心的转移,一般会在短期内,通过组织的层层传导,造成一定的迷惑和摇摆,现在究竟应该是技术为先,还是利润为先?
战略的摇摆同样也反映在了可灵的发展路径上。从一开始的服务专业影视创作者,做高端市场;到后来的做大众化工具,降低门槛。这种摇摆不是修改定位那么简单,需要整个技术团队重新修改产品,适配市场,其中产生的损耗是非常大的,包括对于技术团队人员的心力损耗。
说到底,这是商业诉求与技术理想之间平衡问题,当然,也是所有科技企业都必须要平衡的。
技术精英们希望快手能在视频AI这个赛道上建立真正的技术壁垒,成为行业的引领者而非跟随者,但他们也明白,战略耐心是有时间期限的,快手管理层需要向资本市场交答卷,需要在财报上看到AI业务的贡献。
张迪和周国睿的离开,对于快手来说损失不小。3年的大模型军备竞赛已经让业界发现,大模型不仅是门实验科学,更是一门十分依赖经验与直觉的“手艺活”。
CVPR 2025上,快手可灵AI事业部万鹏飞博士展示了可灵团队在视频生成领域的四大技术方向布局,包括首次建立视频生成领域超参数等的精确数学关系等突破性成果。这样的整体性布局,不仅需要经验性的工程实践,更需要系统化的理论支撑,以及一号位对架构、算法、训练流程的整体把握和直觉判断,需要团队在长期实践中积累的“手感”和默契。
03
从国内视频AI赛道的态势来看,字节与快手,显然更像是同一物种的竞争者。
然而,尽管同样靠短视频发家,但二者在视频AI方面,却呈现出了不同的面貌。
从总体上看,快手目前在纯技术和生成质量上领先一头,可灵在国内外评测里经常登顶或前三,真实性、视频长度、细节处理这些分项得分高,甚至在某些基准里超Sora 2一头。
但在商业化和生态这头,却是字节略胜一筹。
通过抖音、TikTok、剪映这些超级流量池,字节得以将即梦直接嵌进自身商业闭环,用户规模和分发优势巨大,长期来看后劲也许更足。
从用户规模来看,两者差距悬殊:2025年3月的QuestMobile数据显示,即梦AI月活用户达893万,而可灵AI仅为180万;到2025年二季度,即梦AI月活已突破千万级别,可灵AI的MAU仅为113.3万,不足即梦的八分之一。
但尽管如此,我认为快手AI现在的处境,更像是整个视频AI赛道上的”黎明前黑暗”——最难的时刻可能正在过去,而转机已经若隐若现。
虽然图灵奖巨头杨立昆反复强调,纯自回归的大语言模型离真正理解物理规则、生成完美符合现实世界的视频,还有很远的距离。但这并不意味着视频AI赛道被判了死刑。
通过工程优化——包括数据质量的提升、算力配置的精细化、迭代技巧的打磨,让视频AI达到商业可用,乃至商业好用的水平,这是看得见、摸得着的目标,大概率就在2026年到2027年这一两年内实现。
快手新推出的Motion Control功能就是一个强烈的信号。
这个功能允许用户直接在图像上绘制运动路径,将静态图片转化为动画视频,操作门槛极低但创意空间极大。2025年12月可灵推出2.6版本,实现了“音画同出”的功能,能够在一次生成中输出包含自然语言、动作音效及环境音的完整10秒视频。
这种可控性是视频AI商业化的关键突破,因为它解决了专业创作者最核心的痛点——AI生成内容的不可预测性。
Sensor Tower数据显示,2026年1月3日可灵AI的单日流水是12月均值的2.5倍,2025年12月,可灵单月下载量达到50万次,创造90万美元收入。受此推动,快手股价持续回升。
这说明,只要工程整合能力过关,视频AI在实用场景——短剧制作、广告创意、营销内容,是可以率先爆发的。完美的、物理级的AI视频或许还要再等等,但“足够好”的AI视频现在已经能打了。
快手恰好卡在这个窗口期,它的生态优势(短视频平台基础、海量用户数据、创作者生态)还在,撑过这段青黄不接的时期,迎来柳暗花明的概率并不小。
然而,这一切的关键,都在于快手是否能站得“稳”一点。
04
自从Sora发布后,业内迅速达成了一个共识:U-Net架构已死,DiT (Diffusion Transformer)才是未来。
因为Transformer已被LLM证明了具有极强的Scaling Law——只要堆算力、堆数据,效果就能线性提升。
目前,几乎所有第一梯队的玩家(OpenAI Sora、快手可灵、Luma Dream Machine、Runway Gen-3、字节即梦)都收敛到了 DiT 架构。
在这一点上,快手没有掉队。
然而,如果认为“反正路线已经确定了,只要不断地砸资源就行”,这反而是一种非常危险的误判。
DiT架构虽然确定了,但它在工程实现上极其复杂,充满了“玄学”般的细节。
例如,Token的压缩率怎么定?时空切片的大小怎么切?注意力机制该怎样优化以降低显存占用?
这些参数没有教科书,全靠核心技术人员在无数次失败中积累出来的经验与直觉。
快手AI 业务就像一个带着旧伤跑步的运动员,仍在奔跑,但人才流失、组织不稳都是亟需治疗的病痛。
如果管理层能多把资源砸回技术侧,并稳定组织架构,快手的生态壁垒和数据用户循环优势,别人短期内是抢不走的。
倘若快手能站稳,并撑到2027年到2028年,那么其迎来“视频AI春天”的概率依然很大。但如果继续“急功近利”,商业压技术、内部不稳、人才接着流失,则恐怕前路将阴晴不定。
总体来看,虽然时间窗口正在收窄,但现在的快手AI依然有大机会,而一旦技术优势的惯性丢失,再想找回来,代价可能就是加倍的了。
