AI短剧带来的极致成本优势与工业化生产效率,引爆了资本热情,也让AI视频赛道格局重构。
4月初,一匹黑马杀出:视频生成模型HappyHorse-1.0在第三方测评平台Artificial Analysis登顶,文生视频Elo得分1333、图生视频Elo得分1392,双双超越字节跳动Seedance 2.0与快手可灵,成为不容忽视的新变量。
4月10日中午,阿里下场“认领”HappyHorse为“ATH事业群”旗下的AI创新事业部自研,API将在4月30日开放。
此前,阿里并非视频生成的核心玩家。但3月16日,阿里新成立以Token 为核心的“ATH事业群”后,提升多模态能力变成了拉高Token效率的抓手——而HappyHorse可视为这场战略大转向的重磅成果之一。
不只阿里,科技巨头正在视频生成赛道集体压境。
凭借Seedance系列的生成质量与成熟商业化,字节跳动已构筑起显著壁垒。据了解,火山引擎面向企业开放的Seedance API接口,有些机构得到的最低年消费门槛高达1000万元。
以高门槛开放API的底气,来自市场的极度供不应求。《中国企业家》获悉,在火山引擎近期的招商会上,许多城市与火山引擎和视频生成业务洽谈合作,有城市为此投入了数千万、上亿元资金,将算力支持作为招商引资的重要配套。
另一巨头腾讯也已下场。知情人士向《中国企业家》透露,腾讯挖走了Seedance开发团队中的数名核心成员,计划在5月推出混元视频大模型新版本,与Seedance正面对垒。“5月的视频模型赛道,将会格外热闹。”
阿里认真了
HappyHorse亮相之前,阿里虽有通义万相视频模型,但表现始终不温不火。作为大模型生态的附属功能,万相此前在清晰度、运动连贯性、长视频稳定性等核心指标上,与Seedance、快手可灵等有明显差距,也未打通专属商业化场景。
这一次,阿里好像认真了。HappyHorse采用150亿参数,将文本、视频、音频三种模态Token置于同一序列联合建模,从底层解决了音画不同步、语气与表情不匹配等问题。
“它的物理模拟更贴近真实环境。”一位测评人士告诉《中国企业家》。另外,HappyHorse原生支持七国语言唇形同步,词错误率显著降低。同时,它在成本与速度上表现优异:单张H100生成5秒1080p视频约38秒,DMD-2蒸馏技术将去噪步骤压缩到了8步。
但HappyHorse的短板同样突出。测评人士表示,在完成复杂动作与多人交互时,HappyHorse易出现肢体错乱、轨迹不稳。相比于Seedance,HappyHorse更擅长镜头呈现,不擅长动作叙事。
在应用方面,HappyHorse的API尚未开放,在内测中,其支持的时长仅为5~10秒,场景上限较低,更适合做短视频、广告、AI漫剧素材,还难以支撑剧情长片。其本地部署也有门槛,需配备H100或A100显卡,消费级显卡无法运行。
阿里突然在视频模型战场投入火力,意欲何为?相关人士表示,HappyHorse诞生于淘天未来生活实验室,或许意味着阿里希望其能与电商场景碰撞融合。
阿里拥有完整的商品、商家、交易与广告生态,但商品视频一直是中小商家的痛点:场景搭建、拍摄剪辑成本高,白底图难以展现卖点。而AI视频可批量生成多版本、多场景、多语言内容,大幅降低了创作门槛。
更关键的是,阿里的商品详情、用户评价、搜索行为、转化数据、直播表现等全链路信息,也可反向训练电商专属视频能力,让HappyHorse成长为懂电商、能带货的内容生产引擎。
但这条商业闭环要跑通,除了技术攻坚,还必须先解决阿里的算力问题。
接近阿里的人士向《中国企业家》透露,目前阿里内部GPU分配非常紧张。“此前,像月之暗面作为阿里云大客户,虽然与Qwen存在竞争,还是能获得比较充足的算力。现在阿里要支持基模研发、电商、云服务多条战线,未来要重新考虑GPU的投入产出比了。”
而视频生成是算力消耗大户,如果HappyHorse逐步开放推广,算力需求更将指数级增长。这匹黑马能跑多快、多远,很大程度上取决于阿里能否破解算力这一核心瓶颈。
Seedance的好生意被盯上了
尽管挑战重重,各大厂商仍争相涌入AI视频赛道,只因这是一门想象空间极强的生意。
目前,红果短剧等平台收一部剧的最高价格约2000元/分钟,一部常规短剧的时长约120分钟,价格约24万元。而市场上AI短剧的外包制作报价已经低至400元一分钟,甚至有团队用自动化工具实现了一天800~1000分钟的漫剧内容产出。
巨大的成本优势和生产效率,让AI短剧成为资本追逐的热点。有AI视频制作公司负责人告诉《中国企业家》,短短半个月,就有好几家资本来谈收购、并购,目前给他们的估值已超5亿元,但他们和合伙人都觉得,这个出价还不够“美丽”。更有地方政府直接找上门来,希望直接独家买断公司的AI漫剧自动化生成工具。
Agent技术的进展,也正让一人公司(OPC)大量涌现。几个擅长高效使用AI工具的员工,便能顶得上过去一个甚至几个团队的工作量。各地政府敏锐地捕捉到了这一趋势,纷纷对AI视频、AIGC、AI短剧推出算力补贴、内容奖励、园区集聚等扶植政策,吸引OPC进入。
2月27日,武汉东湖高新区发布“微短剧八条”,对重大产业项目最高支持5000万元,爆款短剧单部奖励50万元。
3月10日,上海市徐汇区发布《“AI+微短剧”产业扶持意见》,对头部企业最高给予1000万元发展支持,同时发放最高100万元算力券、100万元语料券,并为OPC减免工位费用。
3月13日,深圳市施行新版微短剧扶持政策:AIGC微短剧单项目最高资助200万元。
需求的旺盛和政策扶植,让字节成为最早尝到甜头的公司。据《中国企业家》了解,虽然火山引擎向大型影视公司、内容制作公司、特定机构等开放的Seedance API接口“白名单”,有些机构被要求“最低消费”1000万元/年,客户仍趋之若鹜。
接近火山引擎的人士告诉《中国企业家》,地方政府已将算力扶持作为招商引资的重要配套。一些AI短剧公司以“拼盘”接入API,不少算力费用由政府出面解决,以吸引相关公司落地。
“有些城市采购了火山3000万、7000万,甚至过亿的费用,用于内容扶植。当然其产出的内容也将对本地税收和GDP产生极大拉动,这个账很好算的。”
清晰可见的变现路径,叠加千亿级的市场增量,点燃了巨头间的竞争热情。阿里、腾讯纷纷加码AI视频赛道,试图从字节手中分走一杯羹。
接近腾讯的相关人士向《中国企业家》透露,混元视频模型其实早就有了,“只是效果很差”。近期,腾讯痛下决心,“开出高薪,差不多把Seedance开发组整个挖走了”。新款模型大约5月上线,有望和Seedance掰掰手腕,在短时间内实现技术突破。
依托腾讯生态,混元新视频模型还有望深度融入到视频号的内容生产、分发、商业化全链路,放大腾讯的内容生产力与商业变现空间。
视频模型的高风险抉择
虽然所有人都看到了AI视频在短剧、电商、广告等领域打开的万亿级商业潜力,但这条赛道的烧钱速度,也远超想象。投入矛盾与定价分化,以及摆在巨头面前的规模化盈利困境,正在考验着各家的平衡智慧。
虽然火山引擎的收入不菲,但其算力成本负担依然沉重,收入中的绝大部分,都要用来采购GPU和支付电力成本。
4月,火山引擎总裁谭待告诉《中国企业家》:“我们去年已经修改了商业计划,把目标提升了不少。但目前我们还没有做3年的盈利规划,暂时没有这方面的具体安排。”
OpenAI关停Sora,更给狂热的市场泼下一盆冷水。视频生成的算力消耗,是大模型的上百倍甚至上千倍,即便全球最具财力的科技公司,也难以承受这种无底洞式投入。
OpenAI虽宣称,关停Sora是为了将资源转向企业智能体、编码工具与具身智能等方向,但业内普遍认为,成本与付费严重倒挂才是核心原因:Sora单条1080p的视频生成成本约0.5~1美元,而用户平均付费意愿不足0.1美元,根本无法支撑持续运营。
更深层的挑战,还来自于科技大厂技术路线的高风险抉择。业内人士向《中国企业家》指出:多模态任务过度消耗算力,在Token用量已经暴涨的情况下,厂商有再多算力依旧不够烧,要把算力留给谁,就成了关键问题。
由于忌惮视频的无底洞式算力投入,Google始终不敢大规模开放API,也未推出独立的视频生成C端应用。“去年Google的多模态路线备受推崇,但今年便在Agent浪潮下被Anthropic赶超,现在只能说勉强留在牌桌上。大模型的核心技术路线,往往需要提前一两年布局,效果却要滞后显现。有时候真的像玄学。”
行业成本与收入失衡,近期利益和远期发展,迫使所有玩家重新审视视频模型的商业模式与定价逻辑,这也直接催生了行业内的定价策略分化。
摩根大通曾判断:头部领先模型可以维持溢价,追赶者则不得不通过降价抢占市场份额。
Sora停服后,字节率先选择涨价。4月8日,即梦宣布:基础、标准、高级会员的月度积分分别从1080、4000、15000下调至725、2210、6160,积分缩水近六成,相当于变相涨价。
相比之下,Google和快手则选择用降价换市场:谷歌在3月底放出的Veo 3.1 Lite版本,将720p视频生成价格压至0.05美元/秒。可灵紧随其后,推出会员限时8折优惠,部分图片生成功能甚至完全免费。
定价的两极分化,本质上是竞争烈度的直接体现。长期来看,平台、API、广告、电商都只是外层变量,决定胜负的关键因素仍然是:强化模型本身的同时,谁能在效果和成本之间找到最佳平衡点,谁能结合自身生态,找到不可替代的落地场景。













































