显存优化策略篇来自:AiGC面试宝典宁静致远2024年01月27日20:47一、介绍一下gradientaccumulation显存优化方式?正常情况下是一个batch之后...
大模型(LLMs)显存问题面来自:AiGC面试宝典宁静致远2023年09月16日21:001.大模型大概有多大,模型文件有多大?一般放出来的模型文件都是fp...