环球快看点丨自然语言处理 Paddle NLP - 预训练模型产业实践课-理论
2023-07-03 14:34:21 来源:博客园
(资料图片仅供参考)
模型压缩:理论基础模型压缩基本方法分为三类:
量化裁剪蒸馏量化裁剪绿线:随机裁剪 30% 已经扛不住了蓝线:60% 还不错蒸馏蒸馏任务与原来的学习任务同时进行.对于没有标注的数据,可以只学习teacher的预测概率Teacher model:教师模型,是已经训练好的,比较不错的模型。Student(distilled) model:学生模型,是重新初始化的小模型,去学生老师的结果设置损失函数,让学生的概率分布,往老师上靠。使得学生能够复现老师的输出,从而获得老师的准确率蒸馏的信号
第一步:A 首先对Student进行学习,不带蒸馏的,一般在无监督数据上进行 lask第二步:把学习的模型拿过来,带一个老师模型,同样进行无监督学习,B第三步:通过通用的老师.. 视频时间:20:00任务无关蒸馏:不需要知道下一步要做什么,蒸完就能直接拿去用3层,比12层更小,更宽。压缩模型最好是压深度,而不是宽度,因为压缩深度可以有效的降低依赖性,使用3步就可以完成计算,宽度有些设备可以高效的并行完成宽度的大小对整个模型的预测时间,是影响不大的中文是没有空格的语言,所以先要分词产业实践案例模型上线,首先要考虑的是模型是不是需要微调,有些模型不需要微调,直接可以上线。
可能没有数据给他微调希望这个模型做为下游模型的输入CPU在线预测应用数据增强
实践案例:搜索问答实践案例:GPU在线预测应用在搜索引擎
关键词:
[责任编辑:]
相关阅读
- (2023-07-03)环球快看点丨自然语言处理 Paddle NLP - 预训练模型产业实践课-理论
- (2023-07-03)在乡村播撒阅读的种子(暖闻热评)_世界信息
- (2023-07-03)资讯推荐:今世缘:公司暂时没有股份回购计划。股价受多重因素的影响,投资有风险,入市需谨慎
- (2023-07-03)今夏首签!官方:国米免签25岁前锋马库斯-图拉姆
- (2023-07-03)石家庄市正定县社会心理服务协会开展心理健康公益讲座 助力市域社会治理
- (2023-07-03)李梦形象彻底扭转:赞助商最新海报她第一排 助女篮夺冠变英雄
- (2023-07-03)焦点播报:哈焊华通:6月30日融资买入403.91万元,融资融券余额3836万元
- (2023-07-03)少女荷-天天快看
- (2023-07-03)当前短讯!马克龙推迟出访坐镇国内,法国骚乱为何持续难平息?
- (2023-07-03)人均消费过百,门店数量全国第三,西安人为什么这么喜欢海底捞? 环球通讯
- (2023-07-03)储能概念强势拉升 上能电气、昱能科技等大幅走高
- (2023-07-03)2023上海黄浦区小学转学对口安排表(暑假) 快报
- (2023-07-03)2023石家庄保障房最新政策 天天日报
- (2023-07-03)河南能源人力资源发展集团有限公司是国企吗
- (2023-07-03)2023年7月10日起进行太原小学入学登记(附入口)
- (2023-07-03)贵州榕江村超怎么停车?|环球聚焦
- (2023-07-03)世界热门:我市两部舞台艺术作品参演第二十届中国·内蒙古草原文化节优秀剧目展演巡演
- (2023-07-03)市消防救援支队无偿献血践行为民担当
- (2023-07-03)全球微速讯:这些高校向公众开放校园参观!预约攻略来了
- (2023-07-03)热点!电动汽车超级快充产业峰会在深成功举办
- (2023-07-03)怎么用u盘做启动工具 u盘启动工具怎么使用
- (2023-07-03)帕金森病患者怎样吃? 环球资讯
- (2023-07-03)高达seed剧场版预售特典公开
- (2023-07-03)超级实用的四大装修秘籍让你不再花钱如流水
- (2023-07-03)抖音白酒品牌库怎么进入?抖音白酒报白开类目怎么弄?
- (2023-07-03)光威复材:6月30日融券卖出15.33万股,融资融券余额6.3亿元
- (2023-07-03)每日热议!《逆水寒手游》何人留字任务攻略
- (2023-07-03)即时焦点:广和通:6月30日融资买入2910.1万元,融资融券余额5.97亿元
- (2023-07-03)环球关注:百川畅银:6月30日融券净卖出3000股,连续3日累计净卖出1.36万股
- (2023-07-03)【天天新要闻】爱仕达7月3日快速上涨
在乡村播撒阅读的种子(暖闻热评)_世界信息
资讯推荐:今世缘:公司暂时没有股份回购计划。股价
今夏首签!官方:国米免签25岁前锋马库斯-图拉姆
石家庄市正定县社会心理服务协会开展心理健康公益讲




