| 首页  |  资讯  |  评测  |  活动  |  学院  |  专题  |  杂志  |  产服  |  
您现在的位置:硅谷网> 资讯> 云计算>

阿里云机器学习平台PAI论文入选IJCAI 2022会议

2022-07-25 15:47 作者:Aaron 来源:硅谷网 关注: 编辑:GuiGu 【搜索试试

近日,阿里云机器学习平台PAI主导的论文《Parameter-Efficient Sparsity for Large Language Models Fine-Tuning》,大模型参数高效稀疏训练算法PST被IJCAI(International Joint Conference on Artificial Intelligence)2022录取。论文通过减少模型稀疏训练过程中需要更新的参数量,从而减少大模型稀疏训练的时间以及资源开销。

IJCAI(International Joint Conference on Artificial Intelligence)是人工智能领域的顶级国际会议之一,涉及机器学习,计算机视觉,自然语言处理等多个方向。本年度会议投稿超过4500篇,录用率仅为15%,会议于7月在奥地利维也纳召开。此次入选意味着阿里云机器学习平台PAI在大模型优化方向上的研究达到了全球业界先进水平,获得了国际学者的认可,展现了中国深度学习技术在国际上的竞争力。

首个大模型参数高效的稀疏训练算法PST

论文核心内容是通过减少模型稀疏训练过程中需要更新的参数量,从而减少大模型稀疏训练的时间以及资源开销。近几年,越来越多的大模型被提出,这些模型的参数量从百亿到千亿甚至万亿,虽然它们可以达到很高的模型精度,但是过大的模型体积限制了这些大模型的实际落地应用。稀疏作为一个有效的模型压缩手段,可以将大模型压缩到较小的体积,使得它们能够以较少的资源较快的速度运行起来。然而,稀疏训练本身会引入额外的参数,从而使得大模型的稀疏训练需要占用更多的训练资源以及导致训练速度更慢。

针对这一问题,PST提出了一种参数高效的稀疏训练算法,通过分析权重的重要性指标,得出了其拥有两个特性:低秩性和结构性。根据这一结论,PST算法引入了两组小矩阵来计算权重的重要性,相比于原本需要与权重一样大的矩阵来保存和更新重要性指标,稀疏训练需要更新的参数量大大减少。对比常用的稀疏训练算法,PST算法可以在仅更新1.5%的参数的情况下,达到相近的稀疏模型精度。

PST技术已经集成在阿里云机器学习PAI的模型压缩库,以及Alicemind平台大模型稀疏训练功能中。为阿里巴巴集团内部落地使用大模型带来了性能加速,在百亿大模型PLUG上,PST相比于原本的稀疏训练可以在模型精度不下降的情况下,加速2.5倍,内存占用减少10倍。目前,阿里云机器学习PAI已经被广泛应用于各行各业,提供AI开发全链路服务,实现企业自主可控的AI方案,全面提升机器学习工程效率。

论文名字:

Parameter-Efficient Sparsity for Large Language Models Fine-Tuning

论文作者:

李与超、罗福莉、谭传奇、王梦娣、黄松芳、李深、白俊杰

论文链接:https://arxiv.org/pdf/2205.11005.pdf

【对“阿里云机器学习平台PAI论文入选IJCAI 2022会议”发布评论】

版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
广告
相关
头条
阿里达摩院量子计算突破,新型量子比特有望弯道超车 阿里达摩院量子计算突破,新型量子比特有望弯
7月8日,记者获悉,阿里达摩院开拓新型量子比特平台的研究,在全球物理学顶刊《Physic……
·阿里达摩院量子计算突破,新型量子比特有望弯
·阿里云发布云数据中心专用处理器CIPU,未来将
·中国公有云市场预计未来5年将继续高速增长
·谷歌如何在2030年之前全部使用无碳能源运作数
·苹果iCloud遭遇集体诉讼同意赔偿用户1480万美
图文
DPU如何赋能绿色数据中心实现双碳战略 芯启源董事长给出解答
DPU如何赋能绿色数据中心实现双碳战略 芯启
阿里云发布AnalyticDB数仓升舱解决方案 查询性能大幅提升
阿里云发布AnalyticDB数仓升舱解决方案 查
阿里达摩院量子计算突破,新型量子比特有望弯道超车
阿里达摩院量子计算突破,新型量子比特有望
神策 2019 数据驱动大会举办,大数据行业矩变升级
神策 2019 数据驱动大会举办,大数据行业矩
热点
·阿里达摩院量子计算突破,新型量子比特有望弯
·神策 2019 数据驱动大会举办,大数据行业矩变
·读懂农业大数据 县域农业大脑AI挑战赛发布
·新升级 联通智游文旅大数据平台一键搞定文旅
·联通大数据“药品智慧监管追溯平台”亮相数字
旧闻
·以开放应未来,新华三智能联接AD-NET引领开放
·联通大数据CTO宋雨伦博士:5G+大数据赋能药品
·新华三400G交换机斩获未来网络领先创新科技成
·联通云分布式云 加速算网一体实践(图)
·万物互联时代的边缘计算 让CDN行业充满想象空
广告
硅谷精选
DPU如何赋能绿色数据中心实现双碳战略 芯启源董事长给出解答
DPU如何赋能绿色数据中心实现双碳战略 芯启源董事长给
阿里云发布AnalyticDB数仓升舱解决方案 查询性能大幅提升
阿里云发布AnalyticDB数仓升舱解决方案 查询性能大幅
发现增长新动力,揭开火山引擎一朵新云的底层逻辑
发现增长新动力,揭开火山引擎一朵新云的底层逻辑
构建研发测试与业务共赢生态 神州数码成功搭建大数据测试平台
构建研发测试与业务共赢生态 神州数码成功搭建大数据
亚马逊云科技如何通过智能营销帮助苏泊尔实现年产破亿?
亚马逊云科技如何通过智能营销帮助苏泊尔实现年产破亿
阿里达摩院量子计算突破,新型量子比特有望弯道超车
阿里达摩院量子计算突破,新型量子比特有望弯道超车
关于我们·About | 联系我们·contact | 加入我们·Join | 关注我们·Invest | Site Map | Tags | RSS Map
电脑版·PC版 移动版·MD版 网站热线:(+86)010-57255600
Copyright © 2007-2021 硅谷网. 版权所有. All Rights Reserved. <备案号:京ICP备12003855号-2>