C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  少尉

注册:2015-11-142
发表于 2024-11-14 17:23:00 |显示全部楼层


亚星游戏官网-yaxin222


智东西(公众号:zhidxcom

编译|依婷

编辑|Panken

智东西11月14日消息,据外国媒体The Information报道,一位参与工作的内部人士称,GOOGLE最近一直在为提升其聊天机器人产品Gemini的性能而努力,该企业希翼模型性能提升的速度可以与去年相当,这促使研究人员专注于其他方法来勉强取得效果。

这种情况和OpenAI的遭遇类似。此前有报道称,OpenAI模型性能提升速度有所放缓,该企业正改变技术策略来解决问题。

回到GOOGLE本身,上述人士称,GOOGLE在投入了大量算力和训练数据,如来自网页的文本和图像后,并没有实现一些高管所期待的性能提升。当研究人员使用更多的数据和算力来训练模型时,过去版本的Gemini大模型改进速度更快。

GOOGLE的经历是scaling law(缩放定律)受到考验的另一迹象。许多研究人员认为,只要使用更专业的AI芯片来处理更多的数据,模型就会以相同的速度改进。但目前来看,这两个因素似乎远远不够。

这个问题成为GOOGLE的心头大患。因为在开发者和客户数量方面,Gemini模型落后于OpenAI的GPT模型,而GOOGLE一直希翼它在算力资源方面的优势,可以助力它在模型性能方面超越OpenAI。与此同时,两家企业都在开发由现有技术版本提供支撑的新产品,这些产品可以帮助App程序员和其他办公人员,在处理繁琐及复杂工作时,实现自动化。

“大家对在Gemini上看到的进展很满意,在合适的时机大家会披露更多消息。”GOOGLE发言人称,企业正在重新考虑如何处理训练数据并在数据上大量投资。这位发言人说,GOOGLE还成功地加快了模型的响应速度,这“对于以GOOGLE的规模提供AI服务很重要”。

在OpenAI,研究人员发明了推理模型等新技术,以弥补在模型训练阶段,使用传统scaling law技术导致的性能提升放缓问题。GOOGLE似乎也在效仿。最近几周,DeepMind在其Gemini部门内组建了一个团队,该团队由首席研究科学家Jack Rae和前Character.AI联合创始人Noam Shazeer领导,旨在开发类似OpenAI推理模型的能力。

开发Gemini的研究人员也一直专注于对模型进行手动改进。参与这项工作的人说,改进工作包括更改它们的“超参数(hyperparameters)”,或者是决定模型如何处理信息的变量,比如,模型在训练数据中不同概念或模块之间建立联系的速度。研究人员在称为“模型调优(model tuning)”的过程中测试不同的超参数,以检验哪些变量会带来最佳结果。

上述人士说,GOOGLE在其传统方法中遇到的一个问题是,它在用于开发Gemini的数据中发现了相同信息的副本。他们说,这可能损害了Gemini的表现。对此,GOOGLE发言人回复称,此类问题对团队来说并不新鲜。

另外,该人士还透露,GOOGLE研究人员曾尝试使用AI生成的数据(也称为合成数据),以及音视频作为Gemini的训练数据来改进模型性能,但没有产生显著效果。

结语:巨头遇到瓶颈,“AI泡沫”还是AGI?

一周时间,OpenAI和GOOGLE这两大AI巨头接连被爆出模型性能提升缓慢问题,且目前来看两家企业都没有找到有效解法,scaling law的有效性受到挑战。

从企业个体来看,两巨头的技术领先地位将面临极大挑战;从行业来看,技术瓶颈长期无解可能会导向悲观派所说的“AI泡沫”。

世界离AGI还有多远?还要看这些巨头企业们多久突破技术瓶颈。

来源:The Information

来源:智东西

举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2024-12-22 23:56 , Processed in 0.118582 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图