“百模大战”即将迎来一轮应用淘汰赛
来源:钛媒体 | 2023-08-03 12:12:03
图片来源 @视觉中国

文 | 互联网江湖,作者 | 志刚

这年头,不做大模型就不好意思说自己是科技公司。

这不," 百模 " 大战打了几个月之后,又有新玩家入场了,京东、携程都加入了大模型 " 战场 "。


(资料图)

相比京东、携程发发布大模型布,这两天的大模型发生了一个更重量级的事情:Meta 发布新一代 AI 模型 LLama V2,并宣布 LLama V2 开源,并可直接商用。

傅盛发朋友圈评论:" 这一下不知道多少公司笑醒在深夜,多少公司哭晕在厕所…… "

据传,LLama V2 性能超过了 GPT-4、Microsoft 和 Google 的 AI 模型,能够生成语言、代码和图像。最重要的,相比 GPT4,LLama V2 开源,并且可以直接商用。

消息一出,不少人都在感慨:一夜之间大模型变天了。

要说大模型行业变天,恐怕还有点早,但 LLama V2 开源可商用、再加上国内这么多大模型落地," 百模 " 大战,恐怕要迎来第一个 " 淘汰赛 " 阶段。

" 百模 " 大战之后,大模型迈进应用驱动阶段

大模型赛道,做通用模型的都是大公司。

Open AI 背后站在微软,文心一言背后是百度,通义千问背后是阿里,混元大模型背后是腾讯……再加上商汤、讯飞等 " 本土 " 玩家,留给后来者的舞台其实并不大。

而这个不大的舞台,如今却显得有些拥挤。此前一份国产大模型列显示,目前国内的大模型已经有近百家。

这么多大模型落地,说明 AI 大模型可能即将进入产品驱动阶段。

互联网江湖认为,大模型的发展会经过三个阶段。

第一阶段,模型数据、数据为核心的技术驱动阶段。

从 ChatGPT 到 GPT3 阶段,大模型是由技术驱动,这时候关键是算法,和数据训练。

GTP3 之后,差距就在于数据量,这不难理解,这好比是一个有着超强学习能力的孩子,在咿呀学语之前,进步不大,一旦掌握了世界的 " 数据语言 ",那么大模型的进展是飞速的。

而做通用大模型的玩家,需要尽快度过这个阶段,并建立自己的核心优势。

目前来看,百度文心、腾讯混元、阿里通义千问、商汤大模型、以及讯飞火星等,国产主要大模型都走到这一阶段。

这些大模型,都是大公司做出来的,能走到这个阶段的大模型,要么算法更先进,要么有足够的数据参数和训练量。

以百度为例,5 月份上线的文心大模型 3.5,能力已经超出 ChatGPT 3.5,虽然官方没有公布具体的数据量级,但大量的数据、算法优化训练是必经之路。

这个阶段,拼的其实就是硬实力,拼的是数据生态,人才技术和资金投入,创业公司很难真的从底层做起来。

第二阶段,是产品驱动阶段。

当国产大模型不断涌现," 百模 " 大战的格局上演之后,行业其实就已经走到了产品驱动阶段。

产品驱动阶段," 百模 " 大战会经历一轮淘汰赛。

大模型从业者普遍认为,400 亿 -500 亿参数量级是模型能力 " 质变 " 的门槛。 换言之,对于资本市场来说,百亿参数量级之前,一些大模型项目很可能会首先遇到 " 生存问题 "。也就是说,对于一些后来者、在遇到生存问题之前,必须要有足够应用落地。

也因此,产品阶段的大模型,核心在落地场景。

大模型其实没有什么路线之争,垂直或者通用,与其说是路线之争,倒不如说是落地的场景之争。

我们认为产品驱动阶段,大模型落地的重点在于,大公司底层做起,打造行业大模型基础设施,在此之上,垂类的创业公司去做应用端的垂直创新。

其实现在已经有企业走在这条道路上了,比如商汤 SenseChat 大模型,在不少领域已经开始与品牌合作落地。

" 表面上看通用大模型和垂直大模型代表了两种技术方向,但实际上两者相辅相成,可以并行发展。更强的通用大模型具备更强大的学习能力,可以快速融合不同行业领域的知识,支持垂直大模型的训练和开发。" 商汤科技相关人士表示。

在大模型领域,商汤扎根很深。

4 月份,商汤 " 日日新 SenseNova" 大模型体系公布,并迅速落地。在自动驾驶行业,商汤构建了业内首个感知决策一体化的端到端自动驾驶解决方案 UniAD,,使车道线的预测准确率提升了 30%,预测运动位移的误差降低了近 40%,规划误差降低了近 30%。

天眼查 APP 显示,商汤科技 2021 年在香港上市,彼时上市募资 55 亿港元。

科大讯飞落地也很快。此前科大讯飞曾表示,随着星火认知大模型的不断迭代,其诊后康复管理平台将逐步实现对所有病种、病程的精细化管理等能力。科大讯飞的大模型最大的特点是更 C 端,有自己的产品矩阵,接入大模型之后,更容易触达 C 端用户。

大模型领域,最先产生商业价值不一定是通用的 ChatGPT4,反而更可能产生在应用端走得更快的领域。

实际上,在科技进步的浪潮中,并不是所有的价值都会被先发的企业拿走,技术商业化的价值,往往会被更成熟的企业拿走的更多。

就像微信不是最先出现的社交应用,但无疑是最成功的。

第三个阶段,是用户驱动阶段。

有了场景之后,最重要的是能够获得用户的认可。从过去 AI 技术的落地来看,由 ToB 到 ToC,是大模型落地的最终路径。所以,首先为大模型买单的一定是 B 端。

不过,从底层商业逻辑上,谁是最终的 " 受益者 ",也就会是最终的 " 买单者 ",说到底,大模型应用的最终结果还是要服务用户。长期来看,也最终会走到用户驱动的阶段。

只不过,与现在大家所熟知的移动应用不同," 大模型应用 " 的用户驱动会更快更直接,因此,有大量 C 端用户的公司(百度、阿里、腾讯)的进展速度可能会超出想象。

大模型应用爆发的黎明,商业化拐点已至?

虽然大模型很火,但真正躬身下沉的玩家都是大公司,投资市场的交易数量与去年淡季没有什么变化。

很明显,市场有顾虑。

比如,现在下场了,将来如何退出?大模型毕竟是个需要长期投入的项目,募资难,想要退出也难。再比如,比较有潜力的大模型项目其实都在大公司手里,这不是说创业公司没有机会,但市场还是在观察。

" 大模型的终局会是什么呢?我认为对于大模型来说,终局会集中在少量的几个大模型 "。百度集团副总裁吴甜表示。

吴甜认为,大模型产业生态可类比芯片代工厂,把大数据、大算力、大算法都封装,建设自动化、数字化、标准化的生产模式。

一方面,从底层做起来的大模型,成本非常高,需要多年积累。另一方面,应用层面,几个少量大模型,就会有非常广泛的应用生态。换句话来说,其实并不需要那么多大模型来做重复的应用。

大模型领域,可能也会有一个新的 " 二八定律 ":两成的大模型玩家掌握真正的底层核心技术,而八成的大模型企业都在各个领域创新,去做大模型的应用。

可以预见的是,Meta 的 LLama V2 大模型开源、放开商业化之后,大模型应用端的创新会迎来一个高潮,而国内大模型产品集中爆发,应用端也会迎来许多的新变化。

过去的十年,以用户关系为中心,互联网完成了内容消费、服务消费、商品消费的中心化。

大家看视频到抖音、快手、B 站,买东西到淘宝京东拼多多,本地生活到饿了么美团。于是,搜索广告之后,短视频、本地生活、电商,成了互联网技术创造价值的主要方式。

而大模型,正在用新技术和新交互,重新改变价值的创造方式。

这种改变分为几个方面:

一、过去的互联网是分发内容,而大模型则是在分发的过程中创造内容;

你向大模型发出一个提问,AI 不是事先给出答案,而是在实时生成答案,这样的信息交互方式,本身是分发,也是在创造。

如果应用到广告领域,就可以通过大模型实时生成广告,广告内容、呈现方式触达用户更精准,不再是所谓的 " 精准投放 " 而是真正意义上的 " 一对一 " 的制作、传播广告。

在过去,一千读者心中有一千个哈姆雷特,而在未来,一千个用户面前同时展示的,则是一千个不同定制的品牌广告。用户更能接收到品牌关键信息,广告的转化率也就更高。

在广告领域,已经有相关的尝试,百度基于大模型推出 " 擎舵 "、腾讯推出 " 混元 ",阿里妈妈的 AIGB 出价模型,都是这个方向上的应用尝试。

进一步来看,这种 " 黑镜 " 式的信息分发、创造,可能会改变整个互联网的内容生产逻辑。

二、大模型的交互设计,有新的商业化机会;

大模型的应用,浅层的是强调功能性,深层的是改变成本结构。

一个基本的判断是,大模型商业化应用首先会改变的一定是广告、营销行业,因为广告行业对用户获取信息的方式变化更敏感。

因此,在营销、内容创造等行业,一些新的商业机会可能会被发现。

几乎可以确定的是,在初期的应用阶段,商业化的机会一定与交互有关。

比如,Copy.AI 和 Jasper 这两个营销创意工具,以 GPT-3 作为底层接口实现了持续的规模化变现。他们提供了交互界面和插件、API 接口,让大模型能更好的去服务某个领域的客户。

当然,这只是解决最基本的功能性问题,大模型真正的价值在于改变垂直行业的成本结构,比如自动驾驶大模型的商业化价值,就是在于改变了人们的出行成本结构。

营销只是一个方面,商业化方面,其实还是得看具体细分领域的应用。

对于不同的领域,大模型会不断的被垂直细分,去满足更小、更细微的场景应用。而这些更细微,更小的场景,可能会有率先商业化的机会。

比如,文本生成,比如图片生成。能够先让编剧、漫画家的工作变得更容易?能不能把文案从做 PPT 的日常循环中给解放出来,这些细小的场景,能够率先变现。

大公司,和创业公司,在应用层差别可能不是很大,应用层是创业机会最多的大模型领域,未来行业内也可能会跑出几家专注于大模型应用的公司。

互联网江湖认为,新技术应用,找到专有价值链要素,嵌入行业,是一个必经之路。因此在应用上,找场景的公司,比练算法、堆参数的公司更有机会。

大模型的成功有阶段性质变,就像是 GPT3 到 GPT4,但接下来这种变化会越来越不明显。也就是说,数据训练的边际收益会降低,

大模型能力的进阶需要数据量做支撑,而商业化则需要考虑成本问题,如何解决这个问题,颇为关键。

商业化拐点已至,大模型的商业化短期看 B 端,长期机会可能还是在 C 端。

大模型,有点像前几年火的 ToB,不仅是要看自身的成熟度,也得看行业端的适配。

大模型的成本很高,商业化首先就要到合适的场景中,并且能够真正赚到钱,只有真正在 AI 应用场景中挣到钱,并且能够真正与行业适配,大模型才有商业化的竞争力。

能够承载大模型商业化的,只有降本需求更迫切的 B 端。

事实也的确如此,以商汤为例,在金融领域,商汤与银行、保险、券商等客户展开合作,利用数字人进行智能客服、智慧营销等工作,并通过接入大语言模型能力,提供投研分析、研报撰写等新功能,试图帮助银行金融机构降本增效。

在医疗领域,商汤中文医疗语言大模型 " 大医 ",也能够提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力。

进一步来看,B 端之外,未来的大模型也可能会承载更多的商品和服务分发。

移动生态中,触达用户的方式其实就是网页、APP、小程序,那么未来的大模型生态中,如果用大模型来分发内容,那么流量的分发会更加去中心化。

实际上,一旦语言大模型成熟,并且有了足够多的用户习惯,那么,承载商品与服务分发的 APP、小程序,可能就会被大模型取代。

也就是说,在 ToB 应用的阶段之后,未来大模型长期的价值和商业化机会,更多其实还是在 C 端。

只不过,以当下的视角来看,很难去定义 AI 应用的 " 新场景 ",这就像是当你身处 90 年代,你不可能预测到如今的微信、抖音崛起。

如今的大模型也同样如此。

结语

从公元元年到 18 世纪,人类经济增长曲线几乎是平的,也只有在近三百年才出现工业革命,近几十年才有了信息技术。

人类历史上第一台计算 ENIAC 最初诞生,并不是用于个人计算,而是用于大量军用数据的计算,但数十年后,它却彻底改变了人们的生活方式。

如今的大模型,就如同当年的 ENIAC。

当泡沫散去,大模型究竟是不是 " 比互联网更伟大 " 的机会?或许人们心中早已有了答案。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App

精彩推荐
再见,李玟
[08-02]