【浙商计算机】字节的AI军备竞赛——大模型行业点评
时间:2024-12-27 11:30
上述文章报告出品方/作者:浙商证券,刘雯蜀、 刘静一、 李佩京等;仅供参考,投资者应独立决策并承担投资风险。
1、豆包用户规模与市场影响力具备与GPT竞争的实力
字节跳动免费向公众开放性能领先的豆包大模型,我们认为从投入力度以及市场占有的角度,均展现了字节跳动有望引领行业的迹象。截至2024年11月,根据AI产品榜数据,豆包App的月活跃用户数已接近6000万,仅次于 OpenAI 的 ChatGPT,位列全球第二,MAU增速达到16.92%。其海外版 Cici的MAU也达到 1267 万,位列第 22 位。豆包用户粘性较高,3 日留存率达28%。调用量方面,12月18日火山引擎CEO谭待表示,豆包大模型日均tokens使用量超过4万亿,自发布以来七个月增长超过33倍。近3个月来,豆包大模型在信息处理场景调用量增长了39倍、客服与销售场景16倍、硬件助手场景13倍、AI工具场景9倍,拥有梅赛德斯-奔驰、广汽集团、华泰证券、招商银行、浙江大学等合作伙伴。
2、字节研发投入显著领先同行,类比于微软加力投资OpenAI,字节之于中国或可类比OpenAI之于美国
资金上:字节跳动在AI上投入巨大,2024年资本开支达到800亿元,接近百度、阿里、腾讯的总和(约1000亿元)。2025年字节跳动资本开支有望达到1600亿元,旨在打造自主可控的大规模数据中心集群,其中约900亿元将用于AI算力的采购,700亿元用于IDC基建以及网络设备如光模块、交换机。海外大模型蓬勃发展离不开巨大的算力投入,而字节巨量的算力开支有望带动整体中国AI产业的发展。字节跳动对未来Token消耗估计较高,预计将持续加大算力投入。2024年9月字节跳动火山引擎智能算法负责人吴迪曾表示, 2027年豆包每天Token消耗量预计超过100万亿,是原来的100倍以上。人才上:据证券时报,公司创始人张一鸣不仅亲自负责从竞争对手公司招揽AI人才,还多次在内部强调追求"通用人工智能"的目标。大模型成员来自字节的核心部门,语言部分由搜索团队牵头,图像部分由产品研发与工程架构部下属的智能创作团队牵头。
3、豆包大模型家族全新升级,产品对齐GPT-4
2024年12月18日,字节火山引擎冬季FORCE原动力大会召开,豆包大模型家族全新升级。豆包通用模型pro:综合任务处理能力较5月份提升32%,全面对齐GPT-4o,使用价格仅为后者的1/8。豆包视觉理解模型:可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务,千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%。豆包文生图模型 2.1 版本:支持“一键P图”、“一键海报”,可以高精度指令理解。豆包音乐模型:可生成 3 分钟的完整作品,让音乐创作变得更加轻松自如。豆包3D 生成模型:支持文生3D、图生3D及多模态生成。即梦 AI:通过即梦AI,用户可以轻松生成高质量的图片和视频,为社交媒体平台注入更多新鲜和有趣的内容。除了模型的升级,火山引擎还对火山方舟、扣子和 HiAgent 三款平台产品进行了升级,帮助企业构建自身的 AI 能力中心,高效开发 AI 应用。
4、字节天然具备AI基因,多元应用场景可供大模型落地
字节跳动作为由AI算法驱动的公司,下游拥有丰富多元的AI应用场景,可供大模型技术落地。1)推荐算法:大模型作为更强大的AI,有望提升推荐、广告、搜索算法的效果,从而赋能抖音、今日头条等字节核心业务。2)内容创作:AIGC赋能UGC与PGC。抖音联合出品的AIGC科幻短剧集《三星堆:未来启示录》在抖音及全平台上线。抖音等平台的创作者还可通过使用豆包“一键P图”、“一键海报”等功能辅助创作。番茄小说植入角色机器人,可模拟小说中的角色与读者进行对话。3)办公应用:飞书上线智能伙伴,实现会议要点提炼,生成文档、表格、导图,数据分析等等功能。
产品研发不及预期、市场需求不及预期、算力供给不及预期、大模型商业落地不及预期。
1 豆包用户规模与影响力有望与GPT媲美
字节跳动免费向公众开放性能领先的豆包大模型,我们认为从投入力度以及市场占有的角度,均展现了字节跳动有望引领行业的迹象。截至2024年11月,根据AI产品榜数据,豆包App的月活跃用户数已接近6000万,仅次于 OpenAI 的 ChatGPT,位列全球第二,MAU增速达到16.92%。其海外版 Cici的MAU也达到 1267 万,位列第 22 位。豆包用户粘性较高,3 日留存率达28%。调用量方面,12月18日火山引擎CEO谭待表示,豆包大模型日均tokens使用量超过4万亿,自发布以来七个月增长超过33倍。近3个月来,豆包大模型在信息处理场景调用量增长了39倍、客服与销售场景16倍、硬件助手场景13倍、AI工具场景9倍,拥有梅赛德斯-奔驰、广汽集团、华泰证券、招商银行、浙江大学等合作伙伴。
2 字节研发投入显著领先同行,类比于微软加力投资OpenAI
AI战略总览:加大流量投放、扩大资本开支、大力扩张团队。
推广策略:字节跳动在推广其AI产品上采取了大力度的广告投放。例如,豆包智能助手在2024年4月至5月的广告投放金额接近1800万元,6月上旬更是飙升至1.24亿元。同时,公司利用抖音等平台的内部流量优势,为AI产品引流。在许多大模型付费的环境下,豆包大模型在保障性能的前提下免费向公众开放,有助于快速提升用户数量,起到了扩大市占率以及获取庞大训练语料的作用。资本开支:字节跳动2024年资本开支达到800亿元,接近百度、阿里、腾讯的总和(1000亿元)。2025年字节跳动资本开支有望达到1600亿元,旨在打造自主可控的大规模数据中心集群,其中约900亿元将用于AI算力的采购,700亿元用于IDC基建以及网络设备如光模块、交换机。字节跳动对未来Token消耗估计较高,预计将持续加大算力投入。2024年9月字节跳动火山引擎智能算法负责人吴迪曾表示, 2027年豆包每天Token消耗量预计超过100万亿,是原来的100倍以上。未来豆包大模型日活跃用户数以及token调用量有望持续增加,算力缺口巨大。我们基于此对豆包大模型带来的算力产业链的GPU/服务器、数据中心设备需求进行了测算。假设2027年日活达到5000万,日均token使用量达到50万亿,为了满足用户需求,在2.5倍峰值token倍数的假设下,2027年算力需求达到1.4E 21 FLOPS,假设未来字节能采购320 TFLOPS的芯片,则需要565.1万个GPU,缺口巨大。人才投入:公司创始人张一鸣不仅亲自负责从竞争对手公司招揽AI人才,还多次在内部强调追求"通用人工智能"的目标。字节跳动从零一万物引进了算法副总裁黄文灏,以及面壁智能的核心成员秦禹嘉。公司内部实行赛马机制,鼓励团队间的竞争,以提升人才密度和创新能力。大模型成员来自字节的核心部门,语言部分由搜索团队牵头,图像部分由产品研发与工程架构部下属的智能创作团队牵头。2024 年 12 月 12 日,字节跳动和北京大学共同宣布成立豆包大模型系统软件联合实验室,双方科研人员将共同围绕大模型的训练、推理开展研究,北大学生还将进入实验室实习,实现理论与实践的结合。成立Flow和Seed部门,专门攻坚大模型和AI应用。为发展AI战略,字节跳动于2023年成立Seed团队与Flow团队。Flow团队致力于开发基于大模型的AI原生应用,由产品与战略副总裁朱骏和字节跳动技术副总裁洪定坤领导,产品包括豆包、扣子、猫箱等。Seed团队主要负责大模型底层技术的研发,曾担任TikTok产品技术负责人的朱文佳领导,Seed团队的产品包括豆包大模型。2024年12月18日,字节火山引擎冬季FORCE原动力大会召开,豆包大模型家族全新升级。豆包通用模型pro:综合任务处理能力较5月份提升32%,全面对齐GPT-4o,使用价格为0.003元。
豆包视觉理解模型:可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务,千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%。豆包文生图模型 2.1 版本:支持“一键P图”、“一键海报”,可以高精度指令理解。豆包音乐模型:可生成 3 分钟的完整作品,让音乐创作变得更加轻松自如。豆包 3D 生成模型:支持文生3D、图生3D及多模态生成。即梦 AI:通过即梦AI,用户可以轻松生成高质量的图片和视频,为社交媒体平台注入更多新鲜和有趣的内容。除了模型的升级,火山引擎还对火山方舟、扣子和 HiAgent 三款平台产品进行了升级,帮助企业构建自身的 AI 能力中心,高效开发 AI 应用。
产品全方位布局,饱和式攻击。字节跳动在AI领域采取“全方位布局”的策略,在产品上采用“头部产品集中力量,新型产品快速迭代”的打法。从生态上看,字节在对话、助手、虚拟社交、图像、视频、智能体、办公、社区、音乐、编程、教育、电商、硬件等几乎全领域都有布局。公司运营约20款AI应用,豆包作为国内用户量最大的原生AI,月活跃用户已达6000万,目标是年底实现1亿月活。
海内外同时布局,核心产品豆包日活全球第2。字节的头部AI应用为豆包大家族,包含多个通用及垂类大模型,以及同名AI助手产品。
4 字节天然具备AI基因,多元应用场景可供大模型落地
字节跳动作为由AI算法驱动的公司,下游拥有丰富多元的AI应用场景,可供大模型技术落地。1)推荐算法:大模型作为更强大的AI,有望提升推荐、广告、搜索算法的效果,从而赋能抖音、今日头条等字节核心业务。2)内容创作:AIGC赋能UGC与PGC。抖音联合出品的AIGC科幻短剧集《三星堆:未来启示录》在抖音及全平台上线。抖音等平台的创作者还可通过使用豆包“一键P图”、“一键海报”等功能辅助创作。番茄小说植入角色机器人,可模拟小说中的角色与读者进行对话。3)办公应用:飞书上线智能伙伴,实现会议要点提炼,生成文档、表格、导图,数据分析等等功能。
产品研发不及预期:如果豆包大模型或者大模型应用研发不及预期,可能影响字节对算力的需求以及对下游的带动。市场需求不及预期:如果市场需求不足,则影响对算力需求及AI应用推广。算力供给不及预期:如果字节无法找到充足的GPU等算力相关部件,则大模型未来难以更大规模、更多活跃用户。大模型商业落地不及预期:如果大模型未能找到足够多的商业落地场景,则可能影响大模型的盈利并影响产业界对大模型乃至算力的投资。