在短视频行业日均处理超千亿级数据的战场中,快手AI平台算法负责人盖坤正带领团队书写着技术突围的新篇章。这位同时兼任可灵AI事业部负责人与社区科学线负责人的技术领军者,向我们揭示了快手在AI基建、视频生成与商业化落地的三重战略布局。
一、架构演进:千万级QPS下的平衡术
面对日均4亿日活用户的冲击,快手主站架构团队在余昭辉的带领下,正进行着"拆分与聚合"的辩证实践。"当微服务架构拆分到千万级QPS时,每个节点的IO放大效应都会成为定时炸弹。"余昭辉坦言,团队通过自研的Perf-Insight持续性能分析平台,将性能优化规则固化成系统能力。该平台能自动检测代码中的性能瓶颈,在某电商大促期间成功将核心链路CPU占用率降低37%,相当于每年节省数亿元的服务器成本。
在存储层,快手正将用户关系链从传统缓存迁移至字节跳动ByteGraph团队同源的图数据库架构。这项迁移涉及超200亿条关系数据,采用分片预加载与动态扩容技术,使复杂关系查询延迟从秒级降至毫秒级,为社交裂变玩法提供了基础设施支撑。
二、视频生成:可灵AI的技术跃迁
作为估值200亿美元的独立业务,可灵AI的2.5Turbo模型正在重塑内容生产范式。该模型通过三维注意力机制与时空压缩编码技术,将视频生成速度提升4倍的同时,将API调用成本降至行业平均水平的1/3。"我们正在构建视频生成的'乐高模块',"万鹏飞透露,团队将运动控制、光影渲染等子任务解耦为独立模型,使创作者能像拼接积木般组合特效,某影视公司利用该技术将动画制作周期从3个月压缩至2周。
在架构层面,可灵AI采用动态批处理与混合精度训练技术,在单张A100显卡上实现4K视频的实时生成。这种技术突破直接反映在商业化数据上:2026年Q1其ARR达5亿美元,其中企业客户API调用收入占比超60%,某汽车品牌通过AI生成1000条个性化广告视频,使线索转化率提升220%。
三、商业化闭环:从技术到场景的跨越
"AI的价值不在于模型参数,而在于场景渗透深度。"盖坤强调。在电商领域,杨一帆团队开发的商品理解大模型,通过解析视频中的商品属性、使用场景与用户情绪,使直播带货的转化率提升18%。该模型在服装品类实现97%的款式识别准确率,能自动生成搭配建议与促销话术。
更值得关注的是AI与社交的深度融合。可灵AI推出的"AI漫剧"功能,允许用户上传照片自动生成个性化漫画视频,该功能在2026年春节期间创造单日2000万元的营销消耗峰值。其背后的多模态对齐技术,通过联合训练图文编码器,使生成内容与用户人设的匹配度提升40%。
四、技术领导力:第一性原理的实践
当被问及架构师的核心能力时,盖坤引用余昭辉的"第一性原理"观点:"在推荐算法领域,这意味着要穿透流量指标,理解用户行为背后的真实需求。"他举例说明,团队通过分析用户滑动轨迹的马尔可夫链,发现30%的"无效浏览"源于信息过载,由此开发出智能内容裁剪功能,使人均观看时长增加2.3分钟。
这种思维模式同样体现在开源生态建设上。快手将QMQ消息队列的核心代码开源后,吸引超过200家企业参与共建,形成包含多语言客户端、跨云部署方案的完整生态。"开源不是简单的代码共享,"盖坤强调,"而是通过社区反馈反哺技术演进,我们的最新版本就采纳了社区贡献的流控算法优化方案。"
站在2026年的技术拐点,快手AI团队正面临新的挑战:如何让大模型理解短视频的"情感密度",如何构建跨模态的创意生成框架,如何在算力成本与用户体验间找到最优解。正如盖坤在GIAC大会上的演讲主题所言:"当AI进入深水区,真正的创新往往诞生于技术约束与商业需求的夹缝之中。"这场关于效率与创造力的博弈,或将重新定义短视频行业的未来格局。