C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  三级军士长

注册:2010-4-285
发表于 2024-10-23 08:34:54 |显示全部楼层
金磊 发自 凹非寺
量子位 | 公众号 QbitAI
就在刚刚,Claude来了波大的——

发布名叫Computer Use的新功能,可以让Claude像人一样使用计算机!

话不多说,直接来看例子:

亚星游戏官网-yaxin222



视频地址:https://mp.weixin.qq.com/s/xUT7ml-V4mURR-eob5sIaQ

在这个填写表格的例子中,由于涉及到的数据分散在了电脑不同的位置,如果人工挨个寻找,那叫一个费时费力。

现在,你只需要跟Claude说一声即可,然后它就会先“看”屏幕,发现所需要的数据不在这份表格里,马上掉头去CRM搜索所需数据。

找到匹配的信息之后,Claude就会自己滚动网页,最后把对应的数据填写到相应的表格栏中。

而整个演示的过程,无需人类任何的参与!

亚星游戏官网-yaxin222



再如跟Claude说一声想看金门大桥的日出,它就会在网页搜索信息地图中找最佳位置规划出行路线,最后把出行的方案塞进你的日历里:

亚星游戏官网-yaxin222



视频地址:https://mp.weixin.qq.com/s/xUT7ml-V4mURR-eob5sIaQ

以及,编程也不在话下!

在下面这个例子中,同样只需要跟Claude说一声“做一个90年代风格的个人网站”,它就会先在电脑网页中打开另一个自己——Claude的网站。

然后让网页版Claude就会唰唰唰地生成代码,并在网页上运行效果。

当然大家还可以继续要求Claude把代码下载到本地,通过VS Code来本地运行,期间诸如发现没有安装Python等情况,Claude都会自行找到错误并解决,直至完成任务!

亚星游戏官网-yaxin222



视频地址:https://mp.weixin.qq.com/s/xUT7ml-V4mURR-eob5sIaQ

不得不说,Claude这次发布的Computer Use功能,直接把电脑变成“自动驾驶”模式了

网友们在惊呼“Amazing”的同时,也表示:

新一轮的竞赛开始了。
亚星游戏官网-yaxin222



而这个新竞赛,就不再仅限于AI的对话和生成能力,更强调的应当是实行操作了。

亚星游戏官网-yaxin222



Claude 3.5也迎来升级

在发布Computer Use功能的同时,Anthropic一道还选宣布:

升级Claude 3.5 Sonnet,推出新模型Claude 3.5 Haiku
亚星游戏官网-yaxin222



首先,从Anthropic官方亮出的评分中不难看出,升级后的Claude 3.5 Sonnet在性能上可以说是有了大幅的提升。

尤其是在编程方面,将 SWE-bench Verified 的性能从33.4%提高到49.0%。

其得分高于所有公开可用的模型,包括OpenAI o1-preview等推理模型和专为编程设计的专用系统。

新版Claude 3.5 Sonnet还将TAU-bench(一种代理工具使用任务)的性能从零售领域的62.6%提高到69.2%,在更具挑战性的航空企业领域从36.0%提高到46.0%。

亚星游戏官网-yaxin222



其次,是这次新推出的Claude 3.5 Haiku,用官方的话来说就是:

这是大家最快的下一代型号。
在与Claude 3 Haiku相同的成本和速度下,Claude 3.5 Haiku在每项技能集上都有所提升,在许多智能基准测试中甚至超过了上一代最大的型号Claude 3 Opus。

同样的,Claude 3.5 Haiku也特别擅长编程,在 SWE-bench Verified中的得分为40.6%,优于许多使用公开可用的最先进模型的代理,包括原始的Claude 3.5 Sonnet和GPT-4o。

目前来看,Claude 3.5 Sonnet已经面向所有用户开放,而且价格和速度没有变化。

至于Claude 3.5 Haiku则将在本月底,通过 API、亚马逊 Bedrock和谷歌 Cloud的Vertex AI提供(先开放纯文本模型)。

One More Thing

在Anthropic搞了这波大的同时,Stability AI也有新动作——

发布Stable Diffusion 3.5,迄今最强模型!

亚星游戏官网-yaxin222



据了解,Stable Diffusion 3.5有三个不同大小的版本——Large、Large Turbo和Medium,可以在消费类硬件上运行。

目前可以从Hugging Face下载Stable Diffusion 3.5 Large和Stable Diffusion 3.5 Large Turbo,并在 GitHub 上下载推理代码。

Stable Diffusion 3.5 Medium则将于10月29日发布。

从官方晒出的评分和实际效果来看,Stable Diffusion 3.5也取得了不错的效果。

亚星游戏官网-yaxin222



最后,不得不说,这一晚上,AI真够刺激的。

参考链接:
[1]https://www.anthropic.com/news/3-5-models-and-computer-use
[2]https://x.com/AnthropicAI/status/1848742740420341988
[3]https://stability.ai/news/introducing-stable-diffusion-3-5
[4]https://x.com/StabilityAI/status/1848729212250951911


来源:网易

举报本楼

您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2024-12-23 20:01 , Processed in 0.207339 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图