AI智能体,又迎来重磅玩家。
当地时间1月23日,OpenAI发布了首个AI智能体Operator。据官方介绍,Operator是一个研究预览(researchpreview)版本的智能体,可以访问网络为用户执行任务,像人类一样与图形用户界面(人们在屏幕上看到的按钮、菜单和文本字段)进行交互,灵活地执行数字任务,而无需使用特定于操作系统或网络的API。OpenAI的CEO山姆·奥特曼领衔三名团队成员,开启了在线直播,向观众展示Operator如何实现向人类一样操作电脑。
事实上,AI智能体并非一个崭新的概念,在OpenAI之前,一些AI公司已经率先推出了自己的AI智能体。值得注意的是,就在OpenAI发布Operator的前一天,国产大模型独角兽智谱AI正式推出了全球首个面向公众、回车即用的电脑智能体GLM-PC。这一智能体的小名叫做“牛牛”,能够像人类一样操作电脑,完成各种复杂任务。
受益于智能体的火爆,智谱AI概念今日迎来大涨,截至收盘涨近7%。成份股中,值得买涨超13%,凌云光、金现代涨超10%。
AI智能体“接管”人类电脑
据OpenAI官网介绍,Operator由一个名为CUA(计算机使用代理)的新模型驱动,结合了GPT-4o的视觉能力,以及通过强化学习实现高级推理。
简单理解,Operator可以帮助人类操作电脑,不仅可以执行基于网页的操作,例如查看、输入、点击、滚用网页,而且还能进行更复杂的智能操作。根据演示,只需要输入需求,Operator就可以完成餐厅订位、购买商品、预订比赛门票等任务,用户可以实时查看进度,并随时介入。而且遇到付款信息、家庭住址等涉及隐私的信息以及关键步骤,Operator会暂停,让用户接管操作。
Operator使用界面
举例而言,记者看到演示视频中,当Operator被要求预定某家餐厅傍晚7点的座位,它会自动打开网页,进入相应网站并搜索餐厅完成预定。不仅如此,Operator遇到特殊情况还会灵活应用,比如当7点的餐厅座位被订满时,Operator还会询问用户是否改订7点45分的餐厅。
由于Operator的上线,ChatGPT访问量突然暴增,许多用户都想“尝鲜”,这使得ChatGPT一度“宕机”三小时。不过,目前可使用Operator的用户群体还十分有限,从本周周四起,只有每月200美元订阅费的ChatGPTPro美国用户可使用Operator。但据山姆·奥特曼透露,Operator后续计划向ChatGPTPlus、Team、企业用户开放使用,并将很快在其他国家推出,“但欧洲地区可能需要更长时间”。
“2025年是智能体之年”
在Operator发布后,OpenAI总裁格雷格·布洛克曼在其个人社交平台评论道:“2025年是智能体之年”。而更早之前,OpenAI前首席科学家、安全超级智能公司联合创始人伊利亚·苏茨克维也预测,下一代模型将“以一种真正的方式实现代理化(agentic)”,未来的AI智能体将结出硕果,拥有更深入的理解和自我意识,人工智能将像人类一样推理问题。
所谓AI智能体,指的是基于人工智能技术构建的超级智能数字助手,能够学习理解各种信息,并根据需求提供帮助、建议或进行互动。海通证券研报指出,AI智能体的前景十分广阔,随着大模型的发展智能体将从概念走向实际应用,成为各行业的重要助力。通过多模态大模型,智能体能够整合图片、语音等异构数据,提高任务处理效率,并解决跨行业、跨领域的问题。技术方面,智能体具备长期和短期记忆、自主规划、工具使用和自动执行任务的能力。这些能力不仅能提高工作效率,还能为用户提供更好的体验。单智能体通过试错学习适用于简单任务,而多智能体则在复杂环境中通过合作或竞争调整最佳策略。
当前,AI智能体已成为各大科技巨头和初创企业布局的重要领域。从国际上看,OpenAI最大竞争对手Anthropic在去年10月发布了自己的computeruse(电脑使用)功能;谷歌去年底推出智能体Mariner,基于谷歌大模型Gemini2.0,可浏览电子表格、购物网站等,帮助用户装满虚拟购物车。
国产大模型方面,去年10月,智谱AI就发布了AI手机端的AutoGLM,作为其大模型GLM的第一个产品化的智能体,只需接收简单的文字或者语音指令,就可以模拟人类操作手机。从其发布的视频来看,用户向手机语音传递命令后,AutoGLM会经过用户授权,自动打开目标APP,执行相关命令,可以实现的功能包括在淘宝上购买一款历史订单产品、在携程上预订酒店、在美团上点外卖、在微信群里领取老板发的红包等功能。
AutoGLM发布后,迅速引起广泛关注,产生了“智谱AI概念股”。值得注意的是,在OpenAI发布Operator的前一天,智谱AI还推出了可自主操作电脑的多模态智能体新版GLM-PC。作为全球首个面向公众、回车即用的电脑智能体,GLM-PC也被称为“牛牛”,可帮助用户网上购物、发微信拜年、编辑文档等。
例如,在其演示的视频中,“牛牛”能够自动提取图片中的商品数据,存储至Excel,并自动将商品加入淘宝购物车,从而实现一站式购物流程。记者看到在电脑桌面上,“牛牛”在淘宝网站中依次将魔芋爽、薯片、猪肉脯、辣条等零食添加进购物车,实现一站式购物。
业内人士分析称,AI智能体的推出,反映了如今AI开发者更加注重如何帮助用户自动完成日常任务。随着一系列科技公司产品的密集发布,AI智能体正在加速尝试代替人类去做一些力所能及的事情。
Operator目前仍然处于早期研究预览阶段,尚有许多不完美的地方。但山姆·奥特曼在直播中表示,“这是OpenAI向智能体领域进军的开始”。可以预见的是,OpenAI的强势加入必将为AI智能体再添一把火,2025年“智能体大战”正式打响,更进一步改变人机交互方式。