量子位 202天前 北京
#新闻看点# #32专家MoE大模型免费商用!5.28%推理消耗,性能全面对标Llama3# 每个token只需要5.28%的算力,精度就能全面对标Llama 3。开源大模型,再添一位重量级选手——来自浪潮信息的32专家MoE模型,源2.0-M32。 不仅拥有极高的回报投入比,而且全面开放,训练代码和模型权重都可任意下载,商业使用 ...全文
量子位 202天前 北京
#新闻看点# #32专家MoE大模型免费商用!5.28%推理消耗,性能全面对标Llama3# 每个token只需要5.28%的算力,精度就能全面对标Llama 3。开源大模型,再添一位重量级选手——来自浪潮信息的32专家MoE模型,源2.0-M32。 不仅拥有极高的回报投入比,而且全面开放,训练代码和模型权重都可任意下载,商业使用 ...全文