本报记者 孙奇茹 赵语涵
今年的科创圈“顶流”非大模型莫属。科技部新一代人工智能发展研究中心5月底发布的《中国人工智能大模型地图研究报告》显示,我国10亿参数规模以上的大模型已发布79个,几乎进入“百模大战”。
作为全球人工智能竞赛的“主战场”,大模型的下一个“赛点”在哪里?多位业内人士提到了创新与效率。北京智源研究院院长黄铁军表示,大模型时代,通过创新来提高效率、降低成本将会是行业的长久课题。
(资料图片仅供参考)
科技公司逐鹿大模型
今年3月,基于文心大模型3.0打造的百度新一代知识增强大语言模型“文心一言”公开邀测。紧接着,阿里通义千问、讯飞星火大模型、智谱AI的ChatGLM 等纷纷发布。此后,美团、百川智能、云知声、美图、腾讯……新加入大模型赛道的国内科技公司此起彼伏,一场围绕大模型的“军备竞赛”已趋白热化。
作为最早发布者,文心一言正在“跑步”迭代。近日,公司首席技术官王海峰向记者透露,文心大模型目前已迭代到3.5版本,在此前知识增强和检索增强的基础上,进一步提出了“知识点增强技术”,显著提升大模型对知识的掌握和运用,从而提升其在各种任务中的表现。
记者梳理发现,从已发布的情况来看,通用大模型为主,主要聚焦自然语言处理、计算机视觉、语音识别等技术领域。此外也有针对或更偏重于金融、汽车、医疗、工业等垂直领域的金融风控、自动驾驶、医疗诊断预测、工业质量控制等大模型。
推动应用落地成新课题
大模型纷纷涌现,然而百行千业,各有考量,如何加速落地“最后一公里”成为新课题。
作为一名教育规划领域公司创始人,林先生对于在教育规划中引入大模型的态度是“让子弹再飞一会儿”。“目前大模型层出不穷,既不知道选哪个更好,也不知道哪种更适合教育垂直领域。”林先生坦言,引入大模型的效果和成本是要考虑的关键因素。
正如林先生所顾虑的,垂直大模型的训练、精调以及形成多个大模型的组合等都成为“落地战”的关键,而经过特定训练的垂直领域中小模型,表现可能并不逊色。
例如,微软以医学文章数据精调了生物领域的BioGPT-Large模型,仅有15亿参数,其在PubMedQA(生物医学研究问答数据集)基准测试中的准确率却优于有着千亿级别参数的大型通用语言模型。“这种中小规模模型,推理成本可以降低到原来的十分之一。”火山引擎的业务算法负责人吴迪表示。
为了加速推动大模型落地,提供安全计算、模型精调、评测等服务的平台也开始出现。近日,火山引擎就发布了“火山方舟”,首批集成百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等7家AI科技公司及科研院所的大模型,意在打造一个大模型“优选店”。公司总裁谭待介绍,基于“方舟”,企业可同步试用多个大模型,选用更适合自身业务需要的模型组合。
未来之争聚焦创新提效
“百模大战”的下一个“赛点”在何处?百度创始人、CEO李彦宏近日在公开演讲中提出,新的国际竞争战略关键点不是一个国家有多少个大模型,而是大模型上有多少原生的AI应用,这些应用在多大程度上提升了生产效率。“如果我们能挤上牌桌,获得竞赛入场券,中国将拥有更壮大的数字化产业,数字经济规模将获得巨大增长。”
“大模型发展中没有绝对的壁垒和护城河,有了大模型就像人类多年前学会了发电,后续还会有各种各样的‘发电手段’不断演进迭代。”黄铁军认为,大模型时代,通过创新来提高“发电”效率、降低成本将会是行业的长久课题。
对于国内从科技巨头、科研机构到初创企业等一众力量均投身大模型热潮的现象,黄铁军表示,如果类比PC互联网时代和移动互联网时代,全球范围内的大模型底层平台很可能不会超过三个。就像移动互联网初期也曾有很多操作系统,但最后只剩下iOS和安卓。他呼吁,国内的大模型行业参与者应走出“山头林立”、各自为战的思路,加强协作。
谭待则判断,企业使用大模型,未来可能会呈现“1+N”的模式:“1”是通过自研或深度合作,形成1个主力模型;由于成本和场景复杂多元等原因,在这个主力模型之外,还会有N个模型同时应用。
多位投资人也提醒,应审慎看待热到发烫的大模型竞赛。九合创投创始人王啸说,不能太“神化”AI大模型,大模型不能解决所有需求,有些场景用大模型解决的是伪问题,对待大模型创业项目需要拉长周期来看。