【本文仅在今日头条发布,谢绝转载】文|李道哲埃隆·马斯克——这位一直走在科技前沿的特斯拉CEO,竟出人意料地点赞了小鹏汽车发布的新一代IRON机器人,...
2025-11-09 7
英国《经济学人》9月8日文章,原题:对被“神化”的大语言模型的信仰正在崩塌 当科技圈谈及大型语言模型进展乏善可陈时,常用智能手机作类比:早期OpenAI公司推出ChatGPT带来的革命性影响力堪比2007年iPhone问世,但如今大语言模型的迭代更像普通手机的小幅升级。ChatGPT-5最新发布后,热度甚至不及最新亮相的iPhone 17。
更值得关注的是小型语言模型在企业中的崛起。许多公司更倾向于量身定制的AI模型,以满足自身特定需求。一些企业在人力管理等方面无需大语言模型“全知全能”的能力,小语言模型成本低、易部署,反而更经济高效。万国商业机器公司研究负责人大卫·考克斯表示:“你的‘人力资源’聊天机器人并不需要掌握高深物理知识。”
小语言模型不仅能在公司内部IT系统运行,也适合嵌入智能手机、自动驾驶汽车、机器人等对能耗与速度敏感的设备。小语言模型可靠性逐步提高,可能表明苹果等厂商未大举投资云端大语言模型是明智决策。
何谓“小语言模型”?业内并无明确界定。两者区别主要在于训练参数数量:大语言模型可达数千亿,小语言模型通常在40亿甚至低于1亿。训练方式的改进,使小语言模型逐渐缩小与大语言模型的差距。例如,英伟达最新推出的9亿参数新款AI模型,在多项测试中超过“元”公司今年4月发布的40倍参数的模型。市场研究公司的阿格拉瓦尔表示:“今天的小模型,比去年的大模型更强大。”
企业需求推动了小语言模型发展。信息技术研究和咨询公司高德纳表示,大语言模型的“AI幻觉”等问题导致用户疲劳,企业更青睐在行业数据上微调的专业模型。今年企业对小语言模型的需求增速预计是大语言模型的两倍。
成本考量也促使小语言模型受欢迎:重复、可标准化的任务可用小语言模型完成,而无需调用资源消耗巨大的大语言模型。万国商业机器公司的Docling产品便是例子:仅用约2.5亿参数的小语言模型即可执行转化数据的任务,用大语言模型反而不划算。小语言模型也可以在更便宜的芯片上运行,能降低硬件成本。
小语言模型在AI代理中也具优势。英伟达公司的研究认为,小模型有潜力成为“代理型AI”的核心,能以更低成本完成任务,并支持“乐高式”组合——用多个专业小模型替代单一大语言模型。这一点凸显了小语言模型在经济与灵活性上的吸引力。未来,大语言模型仍将主导如ChatGPT等消费者应用,但企业与设备端AI可能更多采用小语言模型。OpenAI自身也在内部使用不同规模模型,以任务复杂度分配资源。(蒋礼译)
相关文章
【本文仅在今日头条发布,谢绝转载】文|李道哲埃隆·马斯克——这位一直走在科技前沿的特斯拉CEO,竟出人意料地点赞了小鹏汽车发布的新一代IRON机器人,...
2025-11-09 7
2023年7月3日,王秀珍的世界突然崩塌,清晨她像往常一样准备去田里割草,可这一切都变了样。她的邻村村民熊某出现在她面前,两人之间并没有什么异常,熊某...
2025-11-09 9
1973年出生的舅舅,小时候穿着带补丁的裤子数粮票,现在天天抱着手机给孙子抢早教课优惠券。这跨度放在全人类历史上,怕是没哪代人能比70后更有体会,他们...
2025-11-09 4
把“不完美”留给对方,反而让大脑给你送拥抱。这就是哈佛2023年发现的诀窍:每周至少三次,把素颜、打喷嚏或工作骂人的表情包发给伴侣,就能让催产素分泌飙...
2025-11-09 4
11月2日,在第十五届全运会跳水项目比赛中,广东队全红婵/王伟莹夺得女子团体双人10米跳台冠军。时隔半年重返赛场,全红婵用强大的实力和超高的人气证明自...
2025-11-09 6
阅读此文之前,麻烦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持。本文信源来自权威报道:【《毛雪汪》节目组,纵览...
2025-11-09 4
提起大汉,人们脑海中会想起长安的博大,洛阳的繁华,会想往边塞的猎猎长风,西域的金戈铁马,有辞赋所歌咏的文治,有玉门所见证的武功,有豪迈的帝王,也有不羁...
2025-11-09 6
木叔这篇国际评论,来分析叙利亚总统沙拉访问美国。11月9日,叙利亚总统沙拉开始他就任以来的第一次访美行程,这已经创造了一个纪录,因为历史上从没有叙利亚...
2025-11-09 6
发表评论