再比如属于剪枝方案的微软SliceGPT技术,实验数据显示,该技术可以为LLAMA-2 70B、OPT 66B和Phi-2模型去除多达25%的模型参数(包括嵌入),同时分别保持密集模型99%、99%和90%的零样本任务性能。

2024-05-30 08:09:32 来源:人声鼎沸网 分类:晋中市
本文地址:http://www.usedsportswear.com/show/088597.html 欢迎转发