论文笔记：A Simple and Effective Pruning Approach for Large Language Models

04-19 阅读 0评论

iclr 2024 reviewer 评分 5668

1 intro

大模型网络剪枝的paper
- 在努力保持性能的同时，舍弃网络权重的一个子集
现有方法
- 要么需要重新训练
  - 这对于十亿级别的LLMs来说往往不现实
- 要么需要解决依赖于二阶信息的权重重建问题
  - 这同样可能带来高昂的计算成本
——>引入了一种新颖、简单且有效的剪枝方法，名为Wanda (Pruning by Weights and activations）
- 在每个输出的基础上，剪枝那些乘以相应输入激活后幅度最小的权重
- 无需重新训练或权重更新，剪枝后的LLM可以即刻使用
2 方法

2.1 motivation
- 考虑一个带有两个输入及其对应权重的神经元：y = w1x1 + w2x2，其中|w1| ≤ |w2|。
  - 现在假设目标是选择一个权重进行移除，同时使输出变化最小。
  - 标准的幅度剪枝方法总是会移除权重w1
    - 如果输入特征x1和x2的幅度相似，这可能是一个好策略。
    - 然而，最近在LLMs中观察到，两个输入特征的规模可能差异很大。例如，可能|x1| ≫ |x2|，结果是|w1x1| ≫ |w2x2|。
    - 在这种情况下，我们应该移除权重w2，因为这种移除明显对神经元输出y的影响小于移除权重w1。
  - 这个动机示例与最简单的线性层一起暗示了幅度剪枝的一个主要限制：
    - 它没有考虑输入激活，输入激活在决定神经元输出时可能与权重幅度同样重要。
    - 对于剪枝LLMs，这一点尤其关键，考虑到在其中发现的突出大幅度特征。
    - ——>提出了一种专门为LLMs设计的剪枝指标，以处理此类限制，同时也保持了幅度剪枝的简单性
    2.2 剪枝指标
    
    2.3 和现有方法的对比
    
    3 实验
    
    3.1 效果比较
    
    3.2 速度比较
    
    3.3 finetune 剪枝后的LLM可以接近不剪枝的LLM
    
    3.4 校准数据（X）的影响

相关阅读：

1、依爱6000型主机怎么删除编码器(依爱pgm6000a编码器的使用方法)

2、【C语言趣味教程】(6) 作用域：局部变量 | 全局变量 | 局部变量优先原则 | 利用大括号限制作用域 | 变量的生命周期

3、【ARM】MDK出现报错error: A\L3903U的解决方法

4、Jwt（Json web token）——使用token的权限验证方法 &amp；用户+角色

5、一级域名风险提示怎么解除限制(一级域名风险提示怎么解除限制呢)

免责声明

本网站所收集的部分公开资料来源于AI生成和互联网，转载的目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

论文笔记：A Simple and Effective Pruning Approach for Large Language Models

1 intro

2 方法

2.1 motivation

2.2 剪枝指标

2.3 和现有方法的对比

3 实验

3.1 效果比较

3.2 速度比较

3.3 finetune 剪枝后的LLM可以接近不剪枝的LLM

3.4 校准数据（X）的影响

相关阅读

水暖炕主机声音大怎么办啊(水暖炕机子有噪音是怎么回事)

云服务器禁用自动维护怎么办啊(云服务器禁用自动维护怎么办啊手机)

电脑主机启动后风扇转速慢怎么办(电脑主机启动后风扇一直转声音大怎么办)

没有办理异地住院备案怎么办(没有办理异地住院备案怎么办理)

发表评论取消回复

还没有评论，来说两句吧...

目录[+]