| 首页  |  资讯  |  评测  |  活动  |  学院  |  专题  |  杂志  |  产服  |  
您现在的位置:硅谷网> 资讯> 软件>

快手Kwai Agents系统、模型、数据全部开源

2024-01-05 15:23 作者:Miki 来源:硅谷网综合 关注: 编辑:GuiGu 【搜索试试

7B的模型也能玩转AI Agents了?近期,快手开源了Kwai Agents,亲测发现,问它周末滑雪问题,它不但能帮你找到场地,连当天的天气都帮你考虑周到了。

大语言模型(LLM)通过对语言的建模而掌握了大量知识,并具备一定认知和推理能力。但由于无法跟世界保持实时的交互,在单独使用的情况下,常会出现一本正经地胡说八道的现象。而AI Agents就是解决这个问题的道路之一,它通过激发大模型任务规划、反思、调用工具等能力,使大模型能够借助现实世界工具提升生成内容的准确性,甚至有能力解决复杂问题。

据了解,KwaiAgents是一个先进的AI智能体系统,由快手联合哈尔滨工业大学研发,通过使用大型语言模型来模仿人类认知技能,可应用于自然语言处理、语音识别等领域。Kwai Agents可以使7B/13B的“小”大模型也能达到超越GPT-3.5的效果,目前该项目已将系统、模型、数据、评测全部开源,使得更多的研究人员可以参与其中。

技术报告:https://arxiv.org/abs/2312.04889

项目主页:https://github.com/KwaiKEG/KwaiAgents

从「KwaiAgents」的Github主页中可以看到,本次开源内容包含:

1.系统(KAgentSys-Lite):轻量级AI Agents系统,并配备事实、时效性工具集;

2.模型(KAgentLMs):Meta-Agent Tuning后,具有Agents通用能力的系列大模型及其训练数据;

3.评测(KAgentBench):开箱即用的Agent能力自动化评测Benchmark与人工评测结果。

KAgentBench通过人工精细化标注的上千条数据,做到了开箱即用,让大家能够用一行命令评测一个大模型在不同模板下,各方面的Agents能力。下表显示了经过快手团队调优后,7B-13B模型各项能力的提升,且超越了GPT-3.5的效果:

同时,作者们还请人类标注者在200个事实性和时效性的问题(如“刘德华今年几岁了”),对不同的大模型和Agent系统进行了交叉评估,可以看到KAgentSys系统和MAT之后模型提升显著(百分号前为正确率,括号内为5分制均分)。

通常仅依赖网页搜索对一些长尾问题和热门问题返回结果不佳。比如问到“安东内拉比梅西大多少天?”这类长尾问题,往往搜索结果返回的都是一些两者的八卦新闻,而返回不了一些关键信息。而KAgentSys 通过调用百科搜索工具获取精准的出生日期,再调用time_delta时间差工具算出年龄差,就能精准回答这个问题了。

快手技术人员表示,AI Agents是一条非常有潜力的道路,未来一方面会在这个方向持之以恒地沉淀核心技术,并为整个社区不断地注入新的活力;另一方面,也会积极探索Agents技术与快手业务的结合,尝试更多有趣、有价值的创新应用落地。

【对“快手Kwai Agents系统、模型、数据全部开源”发布评论】

版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
广告
相关
头条
启动盒马调用位置权限13次,叮咚买菜调权限种类最多 启动盒马调用位置权限13次,叮咚买菜调权限种
2023年12 月 11 日,中国网络空间安全协会官网发布一份报告,内容为针对部分 餐饮外卖……
·谷歌就Chrome浏览器“无痕模式”集体诉讼达成
·启动盒马调用位置权限13次,叮咚买菜调权限种
·为逃避欧盟监管,苹果自称提供三款Safari浏览
·微软内部数据:运行Windows 11的月活跃设备已
·国产手机扎堆自研系统,对抗安卓已成趋势
图文
启动盒马调用位置权限13次,叮咚买菜调权限种类最多
启动盒马调用位置权限13次,叮咚买菜调权限
实时化与Serverless是开源大数据3.0时代的必然选择
实时化与Serverless是开源大数据3.0时代的
知米背单词APP那些不为人知的小细节(图)
知米背单词APP那些不为人知的小细节(图)
Realme引入广告什么情况 Realme广告怎么设置关闭?
Realme引入广告什么情况 Realme广告怎么设
热点
·群控、云控时代即将终结,智控时代已到来
·106短信群发平台APP,致力于成为领域内佼佼者
·DT小听App:防偷拍,还是用这款国产app(图)
·软件技术行业发展变化非常快,软件人才要按需
·嗨学网一级消防可靠吗?新手妈妈亲生经历告诉
旧闻
·3款IM云服务即时通讯云产品评测(组图)
·硅谷杂志:基于DSP采集与处理GPS信号的系统设
·掌上看家异军突起 成安防市场一大亮点(组图
·百度手机卫士向iOS10提供精确来电识别功能
·打车软件烧钱战火几近熄灭 快的、嘀嘀再降补
广告
硅谷精选
启动盒马调用位置权限13次,叮咚买菜调权限种类最多
启动盒马调用位置权限13次,叮咚买菜调权限种类最多
实时化与Serverless是开源大数据3.0时代的必然选择
实时化与Serverless是开源大数据3.0时代的必然选择
我用好说 AI 画出了漫画故事
我用好说 AI 画出了漫画故事
腾讯业务瘦身继续 腾讯待办将于2023年12月20日关停
腾讯业务瘦身继续 腾讯待办将于2023年12月20日关停
灵魂交友变身在线荷官——Soul的另类生财之道
灵魂交友变身在线荷官——Soul的另类生财之道
阿里云PAI-灵骏大模型训练工具Pai-Megatron-Patch正式开源!
阿里云PAI-灵骏大模型训练工具Pai-Megatron-Patch正式
关于我们·About | 联系我们·contact | 加入我们·Join | 关注我们·Invest | Site Map | Tags | RSS Map
电脑版·PC版 移动版·MD版 网站热线:(+86)010-57255600
Copyright © 2007-2020 硅谷网. 版权所有. All Rights Reserved. <京ICP备12003855号-2>