度小满联合哈工大推出自适应剪枝算法实现多模态大模型高效优化

多模态大模型是当下很火的一种创新技术，加快对多模态大模型技术的布局，可进一步提高金融服务效率，缓解行业发展困境。为了攻克创新技术领域的难题，度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法——SmartTrim。凭借精细化的剪枝策略，SmartTrim能够在保持模型性能的同时，大幅提升计算效率。

自适应剪枝能力，智能识别并剪除不必要的计算负担

在视觉语言大模型（VLM）的研究和应用中，高计算成本一直是制约其广泛部署的主要障碍。近日，哈尔滨工业大学联合度小满共同研发出一种创新的自适应剪枝算法——SmartTrim。该算法针对多模态大模型的冗余计算进行有效削减，实现了显著的效率提升，相关研究成果已被国际自然语言处理领域顶级会议COLING24接收。

据介绍，SmartTrim技术的核心在于其自适应剪枝能力，通过分析模型中每层的token表示和attentionhead的冗余性，智能识别并剪除不必要的计算负担。这一过程中，SmartTrim不仅考虑了token在单一模态序列中的重要性，还特别强调了跨模态交互中的关键作用。通过这种精细化的剪枝策略，SmartTrim能够在保持模型性能的同时，大幅提升计算效率。

在基于VQA微调的METER的跨模态编码器中，层内不同token（上）和attentionhead（下）表示的相似性。

SmartTrim框架的实施涉及两个关键组件：跨模态感知的Token修剪器和模态自适应的注意力头修剪器。Token修剪器利用多层感知器（MLP）结构，智能地识别并去除那些对于当前层不重要的Token。这一过程不仅考虑了Token在文本或图像序列中的独立重要性，还综合了它们在跨模态交互中的贡献。注意力头修剪器则直接集成在模型的自注意力模块中，评估并修剪那些冗余的注意力头，从而优化了模型的计算效率。

SmartTrim框架结构图

在训练SmartTrim模型时，研究人员采用了一种结合任务相关目标和计算开销目标的双重优化策略。通过重参数化技巧，解决了不可导二值mask的问题，实现了模型的端到端训练。此外，自蒸馏和课程学习策略的引入，进一步提高了剪枝后模型的性能，确保了训练过程的稳定性。

持续布局多模态大模型，为行业发展注入活力

实验结果表明，SmartTrim在METER和BLIP两个VLM上实现了2-3倍的加速，同时将性能损失最小化。这一成果不仅在理论上具有创新性，也为实际应用中的模型优化提供了新的思路。特别是在1.5倍加速比下，SmartTrim的性能甚至超过了原始模型。在高加速比下，SmartTrim相比其他方法展现出显著优势。SmartTrim技术的推出，标志着多模态大模型研究的一个重要里程碑。度小满表示，SmartTrim技术将在未来整合到公司的轩辕大模型中，以推动大模型技术的发展。

此次，度小满联合哈尔滨工业大学共同推出SmartTrim，借助创新技术进一步提升计算效率，不断创新金融智能服务，带给消费者优质便捷的服务体验。在未来，度小满将持续布局多模态大模型，在创新技术领域展开积极地探索与实践，不断攻克技术难题，以先进技术助力金融行业高质量发展。

度小满联合哈工大推出自适应剪枝算法实现多模态大模型高效优化

热门新闻

周热门

度小满联合哈工大推出自适应剪枝算法 实现多模态大模型高效优化

在江苏常州感受新能源汽车产业快速发展

我市全面启动汽车以旧换新补贴申报工作

走进智慧工厂 见证“宝宝巴士”诞生

延伸产业链助推高质量发展

成都多地开展消费品以旧换新活动

再投1.2亿元重奖科技重大项目创新

嘉兴今年个人充电桩第一批补贴来了

平湖汽车商贸城工会 联合工会成立

“久摇不中”直接领 取消节能车摇号

充电便捷，畅游海南说走就走

【闪亮的城市名片②】车与城的双向奔赴

无人驾驶为市民出行提供丰富选择

内蒙古优化城市配送车辆通行管理

工业领域设备更新最高奖励超百万元 汽车消费最高补贴19000元

2024年海南省汽车以旧换新启动仪式 暨2024中国汽车消费节（海南站）盛大开启

热门新闻

周热门

度小满联合哈工大推出自适应剪枝算法实现多模态大模型高效优化

走进智慧工厂见证“宝宝巴士”诞生

平湖汽车商贸城工会联合工会成立

“久摇不中”直接领取消节能车摇号

工业领域设备更新最高奖励超百万元汽车消费最高补贴19000元

2024年海南省汽车以旧换新启动仪式暨2024中国汽车消费节（海南站）盛大开启