据张帅_ 的报道
• 17 小时 • 5 分钟读取
2024年的百度大模型,离「钱」越来越近© 张帅_
大模型谈钱,不寒碜。
前些日子朱啸虎和杨植麟的隔空对话,代表了市场派和技术派的两种观点。朱啸虎不看好大模型创业,认为现阶段大模型公司缺乏场景和数据,估值过高,且面临开源模型的竞争,投资风险大。他更倾向于投资能快速商业化、变现的应用层项目。
杨植麟坚定看好大模型创业,认为这是未来十年唯一有意义的事,并将其视为一个结合科学、工程和商业的系统,需要长期投入和坚持,最终目标是实现AGl。
虽然两者观点看起来针锋相对,但有一点并不冲突,不论是在通向AGI的过程中“沿途下蛋”,还是现在就投资能看到产出的大模型应用公司,今年大模型的商业化,一定是离钱越来越近。
若论国内对大模型商业化最热衷的企业,百度一定是其中之一。据此前报道,2024年百度创始人李彦宏在百度智能云方向的OKR就是,跑通以大模型为核心智能云发展路径,并且在收入和利润方面都有要求。
百度智能云是百度AI能力的输出口,海外市场大模型与云服务结合得比国内更紧密,这也是百度智能云希望努力的方向。
3月21日,百度智能云千帆大模型平台就一口气发布了5款新模型,包括3个轻量级大模型、2个垂直场景大模型,并且千帆ModelBuilder以千帆AppBuilder也同步升级。钛媒体App了解到,百度后续还将发布大模型应用产品,譬如销售、客服、办公等产品。
可以说,目前百度大模型商业化只有一条主线,让尽可能多的一部分人先用大模型,由此改变自己的产品和面向客户的服务。
大模型落地“值不值”
初期大模型的火热,未必能转化为实实在在的订单,在大模型技术和产业的高速发展期,有些厂商已经被历史的车轮碾过,但却丝毫不起一丝波澜。
“惨烈,我觉得是很惨烈,从去年到现在有很多基础模型厂商参与到市场竞争,也有很多的企业资金链受到了一些挑战,也反映出新技术发展过程中的一些矛盾。”百度智能云AI与大数据平台总经理忻舟说道。
这其中一个很重要的因素,就是大模型供需之间的错位,大量企业没有掏出真金白银,而是处在观望阶段。从企业使用大模型的角度,主要关注三个因素,一是效果好不好,二是成本是否足够低,三是效率,因此多数企业并不关心大模型或者小模型,只会结合自己的预期评估大模型落地到自己的场景“值不值”。
百度也提出了自己“效价比”的理念,除了极少的大客户对大模型有极致的效果追求,更多的企业和机构往往要综合考量大模型的使用效果、性能以及成本,即“效价比”
https://images.tmtpost.com/uploads/images/2024/03/9dc7857c12a1e2c3240aaec6a0d0ce71_1711186926.png© 张帅_
面向大模型如何落地,业内想了各种各样的技术方法,比如RAG、插件、MoE、小型化、大小协同等等各种各样的问题,轻量级模型就是公认的“效价比”突出的方案。
“业界也逐渐形成一个共识,模型不见得是参数规模越大越好。在很多实际的场景当中,用小尺寸的专家模型也能够达到我们通用大模型的效果,小尺寸专家模型的推理成本会更低,更便宜。”百度副总裁谢广军表示。
他还提到,本次发布的三款模型都是开发专家模型的基座模型,主要面向两个场景:一是客户、合作伙伴结合自己的数据,去做垂类场景模型。二是百度也会基于这些小的基座模型,去开发第一方的行业垂类场景模型,比如做教育行业的教辅答题和解题,可以用一个小尺寸的模型加上一些数据,精调出一个效果很好的解题助手模型。
“3+2”,5款新模型
一月初,OpenAI发布了多款新模型,价格下降,性能提升,百度本次也是同样的策略,百度智能云千帆ModelBuilder发布了包括ERNIE Speed、ERNIE Lite、ERNIE Tiny在内,参数量由大到小的三款轻量级大模型。千帆ModelBuilder的概念就是生产平台,提供整个模型训练的工具链,让模型开发变得更简单。
对于轻量级模型,谢广军表示,基座模型本身的效率一定要好,百度基于文心大模型的技术领先优势积累,再把尺寸做小,模型的效果就会做得很好,在很多场景它能够达到大模型的效果。
同时,百度发布的轻量级模型具备再生产能力,比如支持post-pretrain、sft、lora精调能力,基座模型加上精调数据来达到垂直场景下的效果,同时成本更低。
https://images.tmtpost.com/uploads/images/2024/03/c9d7e608c8dbd67d691d5f0fde8dcda7_1711186927.png© 张帅_
具体来看,ERNIE Speed在推理场景下拥有最高128k的上下文长度,在处理知识问答等任务时,能够更好的处理上下文的依赖关系,同时,针对特定场景可以将ERNIE Speed作为基座模型进行精调,模型效果可以追平甚至超过旗舰级大参数规模大模型,效价比大幅提升。
ERNIE Lite的参数量则更小,更适合搭载在低算力的AI加速卡上处理推理任务,作为ERNIE-Bot-turbo模型的升级版,ERNIE Lite在情感分析、多任务学习、自然推理等场景下的应用效果提升了20%,推理调用成本大幅下降了53%。
参数量最小的ERNIE Tiny则主打极致低成本、低延迟,可用于检索、推荐、意图识别等高并发、低延时等应用场景中,在某对话推荐业务场景中,精调后的ERNIE Tiny在搜索引擎推荐词激发环节,相比ERNIE 3.5,对话轮次增长了3.5%,成本下降了32%。
此外,百度智能云千帆ModelBuilder还推出了ERNIE Character和ERNIE Functions两款垂直场景大模型,分别适配客户在角色扮演类应用场景(如游戏NPC、客服对话等)和工具调用场景(对话中使用外部工具、调用业务函数等)中的使用需求。
结合企业实际使用大模型的过程,有些企业起初就用最好的模型看最好的效果,再决定投入的资源程度。有些场景需要快速验证,企业可以先上轻量级模型,轻量级模型总结一句话——“轻归轻,可破冰”,在一些场景下完全可用,作为大模型落地的先锋军。
对于注重私有数据的企业和行业,私有数据跟大模型结合也可以先用轻量级模型,不管是知识资产还是数据分析,都可以跑出效果。
“把大模型应用,喂到企业嘴边”
千帆大模型平台上的客户需求主要分为三种,第一类是在AppBuilder开发应用;第二类,直接调用百度的基座模型的,比如直接调用文心4.0、 3.5版本;第三类是生产模型,客户数据和百度基座模型结合做一个新的垂类模型。
AppBuilder去年年底推出,从应用的视角让开发者能够便捷地开发基于大模型的AI原生应用,百度第一方也做了非常多的AI原生应用,也是基于这套平台做的,本次AppBuilder也进一步升级,进一步降低应用开发门槛。
升级后的AppBuilder开放的工具组件多达55个,包括基于百度多年技术积累和自有业务沉淀的大模型组件、AI能力组件,也包括搜索等百度特色的业务组件、和多场景的第三方API工具,另外还提供了 RAG(知识检索问答)、GBI(生成式数据分析)等根据典型应用场景深入调优的高级能力组件。
https://images.tmtpost.com/uploads/images/2024/03/033199d9497cdd396708c05216677813_1711186928.png© 张帅_
在组件之上,千帆AppBuilder推出的Agent(智能体)应用框架,具备精准的任务自主规划能力,对多种应用工具的自动编排准确率超过90%。AppBuilder还支持开发者接入自定义工具,实现更复杂场景应用的需求定制。
谢广军介绍,AppBuilder分两个形态,一个是代码态,百度提供SDK,甚至提供底层的组件和能力,这种是大B端的场景下的典型客户画像。另一个是零代码态,以小企业、个人开发者为主,现在零代码态开发者的数量比较多,百度这两条路都要走。
根据百度智能云公布的数据,千帆大模型平台已经服务8万企业用户,累计帮助用户精调1.3万个大模型,帮助用户开发出16万个大模型应用,自2023年12月以来百度智能云千帆大模型平台API日调用量环比增长97%
大模型未来一段时间还会不断快速演进,百度AI团队主抓基础模型,智能云团队主抓商业落地,构成了百度自己的大模型商业落地模式。
(本文首发钛媒体APP 作者|张帅,欢迎添加作者mr3right爆料、交流)
贝瑞基因CNV-seq试剂盒获批上市,一线产前诊断技术“迎新”
发表回复