当前位置:首页 > 科技资讯 >

首个获得驾照的AI!Agent担任私人助理样样精通,还能帮助考试作弊

作者:王东东 来源:网络整理 发表:2024-04-14 12:28:34 我要点评 作者ID:3

关于当前基于Transformer的LLM能走多远的问题,人们仍在争论不休。与此同时,另一边,能够帮助人们处理各项工作的AIAgent已经悄然走入人们的生活。以前的ChatGPT等大模型,热衷于...

关于当前基于Transformer的LLM能走多远的问题,人们仍在争论不休。

与此同时,另一边,能够帮助人们处理各项工作的AIAgent已经悄然走入人们的生活。

以前的ChatGPT等大模型,热衷于在人类考试中刷分以凸显自己的实力,而不久前,又有一位AIAgent通过了美国加州的驾照考试。

——但与之前不同的是,这次的AIAgent是在监考员的眼皮底下帮助人类成功作弊,通过考试!

从图中我们可以看到,AIAgent完全靠自己审题、作答、并点击下一道题。

对于这样成功的表现,JimFan也是表达了祝贺:

从去年开始,一些加州居民可以在网上参加驾驶考试的笔试部分,免去了他们需要花时间去考试机构所在地的。

首个获得驾照的AI!Agent担任私人助理样样精通,还能帮助考试作弊

为了防止作弊,官方采取了一些相应的措施,要求考生必须允许机动车辆管理局(DMV)访问电脑的摄像头,以记录考试过程;并在考试期间共享屏幕。

——这样参加考试的人就无法在考试中途打小抄了。

还是有人在监考员的眼皮底下作弊成功,而助手正是我们前面介绍的AIAgent(到底谁是助手也不好说)。

首个获得驾照的AI!Agent担任私人助理样样精通,还能帮助考试作弊

这个AIAgent来自一家名为MultiOn的初创公司,由DivGarg创立。

DivGarg是斯坦福大学的博士辍学生,他最初创办MultiOn是为了实现日常任务的自动化,比如从亚马逊订购厕纸或安排日历约会。

MultiOn的产品可以控制用户的浏览器,完成诸如在UberEats上订餐或进行Resy预订等任务。

——需要注意的是,这并不是我们平时会见到的浏览器脚本,Agent背后依托的是AI的能力。

首个获得驾照的AI!Agent担任私人助理样样精通,还能帮助考试作弊

这项服务目前是免费的,AIAgent位于浏览器的右下角,你可以在这里输入命令,这与微软的必应ChatGPT助手完全不同。

这个AIAgent可以作为用户的私人助理,它提供的大部分功能都很有用,即使不能完全改变生活。

上个月在旧金山的一家咖啡馆演示MultiOn时,Garg用它向Facebook上的熟人群发了「生日快乐」信息。

随后又利用MultiOn安排了与记者的下一次会面,目的正是向大众演示如何利用AIAgent通过车管局的正式驾驶考试。

虽然看上去只不过是AI答对了一些问题,但实际上要达成这个目的并不简单。

一般来说,AI需要一段长长的提示,才能选择正确答案,然后点击进入下一个问题,而且AI不能有多余的动作,以免被发现作弊。

平心而论,目前的这个AIAgent仍然需要人的手指随时待命,以防出错。根据设置,MultiOn在出错时会停止运行,这时就需要人类测试者自己按下「继续」按钮。

另外,它也无法解析图像,所以如果遇到了要求识别交通标志的问题,都会回答错误。

当前的AI虽然拥有完善的知识,但通常需要严格的提示才能进行下一步。

对于这场考试来说,答对有关正确驾驶规范的难题是一方面,点击按钮进入下一个问题更体现出它的能力。

Garg认为这依靠了很多运气。这是MultiOn第一次参加正式的州立考,最终,MultiOn在46道题中只错了五六道,正式达到了通过标准。

根据加州法律,以这种方式使用该技术可能构成伪证罪。因为在考试之前会要求考生声明自己将亲自作答。

加利福尼亚州车管局曾在一份声明中写道:「作为一项防欺诈措施,在线考试参与者必须验证自己的身份,并同意在整个考试过程中接受监控。随着技术的发展,DMV将继续更新保障措施」。

人工智能助手的未来

MultiOn在通过DMV考试之前,就已经引起了OpenAI及其首席执行官SamAltman的注意,Garg表示正在与OpenAI密切合作。

但就目前而言,MultiOn对部署采取了谨慎的态度,这次成功的测试与其说是一项关键功能,不如说是一个概念验证。

Garg希望确保对自己产品的控制,从而避免出现恶意使用的情况。他希望人们不要在各种考试中作弊,因此他计划对普通用户禁用任何类似的「灰色地带」功能。

与主要存在于ChatGPT沙盒中的OpenAIGPT助手不同,MultiOn助手是作为谷歌Chrome浏览器的扩展程序自主运行的。用户必须授予它有效控制电脑的权限。

「我们的技术直接在用户的电脑上运行,它实际上是在控制,在做事,很多事情都可能出错」。

目前,大约有3万人注册试用了该应用的测试版。Garg预计MultiOn还会有更多新功能,比如加强版移动语音助手和内置MultiOn技术的浏览器。

——不过,利用它在SAT或ACT等考试中作弊的可能性也不大,因为这两个考试机构都要求学生到考试中心参加考试。

MultiOn的官网上还向我们展示了产品的一些基本而有趣的用途,比如查询天气:

首个获得驾照的AI!Agent担任私人助理样样精通,还能帮助考试作弊

更实用一点的是下面这个例子,用户可以直接告诉Agent帮忙订一个汉堡,后面的所有事情都完全不用操心了。

包括选择店铺、选择商品、下订单和支付等等,Agent一条龙服务,统统帮你搞定——确实称得上是私人助理了。

除了这个演示,官网还列出了其他的一些功能:

比如线上购物、文章摘要、查找并播放音乐和、在线互动等。

有网友使用MultiOn在亚马逊买了一本书,并表示「太疯狂了」。

而另一位网友使用MultiOn自动搜索并播放想要的,还自动进行了评论:

有了这次成功的驾照考试经历,Garg也是野心勃勃地表示,「明年我们的AIAgent就可以驾驶你的特斯拉了」!

不知道大家对于未来的AIAgent又抱有怎样的幻想呢?

本站文章来自网络收集整理和网友投稿,如需申请删除,请与站长联系(挑错)。
优惠网专注全国优惠活动资讯信息及各种实用生活经验分享,更多优惠券限时折扣活动在线免费领取。

相关科技优惠信息推荐
广告
优惠网微信小程序
广告
优惠网新闻投搞