C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  三级军士长

注册:2010-4-285
发表于 2024-11-26 09:02:44 |显示全部楼层
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点先容国外的新技术、新观点、新风向。
编者按:本文是对Claude操作计算机能力的一些思考。编辑认为,组织要高瞻远瞩一点,不能把AI 部署视为纯粹的技术挑战。相反,组织必须思考这些技术对人类的影响。在 AI 达到人类水平的表现之前,其对工作和社会的影响已经十分深远且广泛,必须想清楚如何驾驭和应对。文章来自编译。

AI 实验室完全相信,更大、更强大的 AI 模型即将问世,他们相信这些模型可实现比人类博士更聪明的自主智能体和系统。OpenAI 的山姆·阿尔特曼(Sam Altman)与 Anthropic 的 Dario Amodei,两家领先AI实验室的CEO,他们在各自的博客中均讨论了超级智能机器时代的到来,其信心从中可见一斑。

但这些主张并非没有争议,大家也没法确定他们说得对不对。不过,就很多方面而言,大家并不需要超级强大的 AI 来改变工作的方式。目前第二代/GPT-4 类系统所蕴含的能力已经超过了大家能完全吸取的水平。哪怕今天的 AI 开发停止,大家仍需数年时间来将这些系统融入大家的世界。

今天的 AI 模型已经是多模态的了,能够处理和生成文本、图像、声音等多种媒体形式。它们可以编写代码、操作计算机、访问互联网等。这些能力已然存在,而且大家正开始看到出现了相互结合的迹象。尽管这些模型并不完美,且容易出现不一致性和“幻觉”,但在许多领域已经展现了自己的价值。在对完美准确性要求不高、需要征求第二意见、没人能提供帮助或 AI 表现优于人类的场景下更是如此。

人工智能作为经理、教练或者圆形监狱?

比方说,想想看如果人工智能将图像处理与“推理”能力相结合的话,意味着只需将视频消息交给 AI,便可以为其赋予智能,完成以前无法实现的任务。

又比如,只需将一段建筑工地的 YouTube 视频交给 Claude,并提示说:“这是建筑工地的视频,请对工地进行监理,寻找安全问题、可以改进的地方以及可以提供引导的机会。”不需要任何特殊训练,只需利用 Claude 3.5 Sonnet 的原生计算机能力,每隔几秒截取一次屏幕然后进行“分析”即可。在以下视频中,Claude 分析了建筑工地的各个方面:工人防护设备的使用情况、材料的摆放、工作模式以及潜在危险,并逐一记录。

亚星游戏官网-yaxin222


这些观察非常有趣,但系统可以进一步扩展。我随后问道:“你得出了什么结论?请将你的观察结果写成一个问题清单。”AI 在几秒钟内生成了一张电子表格,总结了观察视频看到的内容,这项任务如果交给人类做的话会很耗时。注意观察它是怎么将视频发现的众多问题按优先顺序分解,并对如何解决问题作出逻辑推断的。

亚星游戏官网-yaxin222


接着 Claude 又问我:“你是不是希翼创建一个跟踪系统来进行完成验证?”听起来不错,于是我同意了。然后,它就做出了一个包含虚拟名字的示例数据跟踪系统。

亚星游戏官网-yaxin222


从视频中回放的结果来看,结果似乎不错,但我不是专家,完全排除严重幻觉的可能性几乎是不现实的。出于这一点及其他许多原因,我绝不希翼该系统被用来对人类进行奖罚。然而,在无人监控潜在危险环境或缺乏引导与建议的场景中,AI 可以提醒人类关注潜在问题或机会,作为一种有价值的资产。

这个系统只用简单的提示词就开发完成了。多做一点工作的话,哪怕没有新模型发布,AI 监工的错误率和成本也会不断下降。这些系统会变得更加完善。组织可能会禁不住诱惑,到处部署这些 AI 观察员,政府也可能效仿。一种本可以充当导师和安全检查功能的系统,可能会变成由 AI 全天候监视和评判每个人的圆形监控系统。企业和政府的选择将决定 AI 是用来帮助大家,还是监控大家——这是大家在充斥着AI的世界里需要做出的诸多复杂调整之一。不过,观察能力只是 AI 已经展现出的其中一项高级技能。

运用大家的工具与规则

在数字世界里,大多数常识工作都是通过计算机完成的——比如浏览网站、填写表格以及完成交易等。现代人工智能系统现在也可以实行这些任务,将以前只能由人类完成的工作给自动化了。这种能力已经不再局限于简单的自动化,连定性评估和问题识别也能完成。

比方说,我让Claude“去沃尔玛的网站,并以一个尝试购买商品的普通用户的身份测试其功能。然后访问AMAZON,做同样的事情,并在一份文档中写下你的发现”。同样,在视频里你可以看到,AI 会访问每个网站,模拟用户搜索和购买商品的过程。

亚星游戏官网-yaxin222


然后,它写下了两份报告——一份叙述性报告以及一份测试报告。

亚星游戏官网-yaxin222


从我的观察来看,报告没有发现任何“幻觉”。虽然这些报告并不算洞察力最强的,但相当可靠。AI 在被赋予任务时,能够迅速高效地完成,并在解决问题的过程中展现出一定的“判断力”。随着模型的改进和操作的简化,可以想象未来的管理者会利用 AI 智能体团队来实行分析和重复性任务。

更加离奇的应用

大家已经看到了多模态输入和工具使用如何改变了 AI 与世界的互动,而当大家加入多模态输出时,情况会变得更加奇特。比方说,我邀请了一位 AI 化身加入 Zoom 会议。从声音到图像乃至于行为,这个化身完全是由 AI 驱动的,——实际上,我给出的提示是让化身以 Zoom 会议最刻板、最官方的方式进行表现,你会发现视频感觉非常的怪异。

亚星游戏官网-yaxin222


尽管“恐怖谷”现象(也就是非常像人类却又不完全像人类的表现)让人感到不适,比如略显不自然的声音,以及如换衬衫等显而易见的问题等,但这种互动基本上反映出典型的 Zoom 会议的情况。这只是第一代工具,其实已经可以了。在不久的将来如果有很多人被这种虚拟任务迷惑的话,我是不会感到惊讶的。

这些能力要求大家马上就得关注政策和实践。哪怕这些系统尚不完美,但从大家如何监控安全到大家如何开展会议,它们已经在重塑工作的基本面。组织今天关于 AI 部署的选择会设定未来很长一段时间内的先例。AI 驱动的监控是用来引导和保护工人,还是用来施加算法控制?AI 助手会增强人类能力,还是逐渐取代人类判断?

组织要高瞻远瞩一点,不能把AI 部署视为纯粹的技术挑战。相反,他们必须思考这些技术对人类的影响。在 AI 达到人类水平的表现之前,其对工作和社会的影响已经十分深远且广泛。从建筑工地监控到虚拟化身,我所展示的例子只是开始。目前最紧迫的任务是确保这些变革能够增强而不是削弱人类的潜力。大家现在所做的决策,不仅会影响未来的工作,还会影响在 AI 增强的世界里人类的未来。

译者:boxi。

来源:36kr

举报本楼

本帖有 3 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2024-12-22 19:47 , Processed in 0.154988 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图