DeepSeek扔的第二枚开源王炸是什么

阅读 204433　话题 877

DeepSeek扔的第二枚开源王炸到底是什么？
摘要：DeepSeek此次开源的全栈通信库DeepEP，通过优化GPU之间信息传输的效率，极大的缓解了从业者的算力焦虑。凤凰网科技出品作者｜梁思琦编辑｜董雨晴2月25日，开源放福利的DeepSeek甩出了一张王炸——开源全球首个面向MoE模型的全栈通信库DeepEP。
凤凰网科技　5380 阅读　11 评论　2025-02-25 19:01
DeepSeek可不可以用于论文 DeepSeek可以帮你搭建选题与框架等，谨记它仅作为辅助工具，核心论点与数据需研究者自主完成‌ #数字人 #deepseek #论文 #写论文 @掌桥科研
直率扑克M　115 播放　0 评论　2025-02-25 18:18
deepseek使用攻略。deepseek使用指南#D e e pS e e k#
今天你吃了吗　44 播放　0 评论　2025-02-26 02:24
软杰接入DeepSeek
上海软杰智慧停车　26 播放　0 评论　2025-02-25 15:35
DeepSeek开源第二弹：EP通信库来了#deepseek #人工智能
长江云新闻　1951 播放　2 评论　2025-02-25 19:01
DeepSeek参数详解+硬件要求指南还在为选择AI模型发愁？DeepSeek参数详解+配置指南来了！无需计算机博士学历，3分钟看懂专业术语！首先什么是1.5B/7B/14B...？这些都是模型参数，“B”代表十亿参数‌：如5B=50亿参数，70B=700亿参数。 ‌参数规模与能力之间的关系是：参数越多，模型的理解、推理和生成能力越强，但对算力和内存要求更高。看下‌典型代表‌： ‌小模型（1.5B-14B）（15亿到140亿参数量），这类模型比较轻量化，适合基础任务。 ‌中模型（32B-70B）（320亿到700亿参数量）‌：平衡性能与资源消耗。 ‌大模型（671B）（6710亿参数量）‌：具有顶尖性能，但是需专业级硬件支持。 ‌个人用户‌：优先选择1.5B-14B，可以平衡性能与成本。 ‌企业用户‌：推荐32B-70B，能够满足更多的专业需求。 ‌学术/超算场景‌：考虑70B+，可以搭配分布式计算。如果想要本地部署大模型，推荐使用Infortress这种全图形界面的工具来部署，它无需用到命令行，无需用Docker，只需将Infortress软件安装到电脑上，就可以实现一键部署大模型到本地，比较适合没有技术基础的普通用户，它还是一款NAS应用，可以替换网盘，不仅支持手机相册自动备份到电脑上，还有AI相册，内网穿透，隐身模式，笔记管理，密码管理，通讯录备份等超多实用功能。#deepseek #DeepSeek
用户9977421232989　89 播放　0 评论　2025-02-25 20:06
DeepSeek开源周第一天FlashMlA解析
多才的消息先锋　95 播放　0 评论　2025-02-25 21:45
5%参数量逼近Deepseek-R1 95%的性能 32B大小的tiny-r1-32b-preview 达到了671B满血版deepseek-r1 的95%的性能，数学，编程和科学能力远超2倍参数的deepseek-70b蒸馏版本。北京大学刚刚发布的全新模型已经huggingface上开源。#人工智能 #科技 #deepseek #编程
陈泉林　15 播放　0 评论　2025-02-25 23:16
DeepSeek爆火后英伟达芯片大卖 DeepSeek推高低成本AI模型需求，英伟达H20芯片订单大增
温州瓯海发布　7634 播放　1 评论　2025-02-25 20:11
..+满血DeepSeek r1/v3部署方案H100\200与910B参考[V5][点亮平安灯][给力] 高校科研、科研单位院所，算力中心，人工智能创新企业、大型国企等可以参考[玫瑰][玫瑰][玫瑰] sglang目前支持最好，开启nextN（MTP）和torch-compile后，一组h200单线程可以到77t/s。vllm刚支持了MTP，具体还没看到实测。最近vllm不如sglang务实和努力。推理的速度目前差8倍[点亮平安灯]。华为10t/s，英伟达目前已经快到80t/s。agent场景下，v3输出也要1000token左右完成一个thinking，如果用r1做更长，华为是100s才开始动，英伟达是12s。agent应用场景如自动编制文档，20个action起步，华为时间大概30分钟，英伟达是4分钟。 #机器学习##deepseek##人工智能##AI智囊##高校##研究生##博士##科研##技术##大模型# @北京大学@武汉大学@浙江大学@中国人民大学@厦门大学@重庆大学@山东大学
荧火虫文化　2568 阅读　0 评论　1 点赞　2025-02-25 15:31
鸿蒙融合DeepSeek 及AIOS升级相关梳理
红阳在线　31 播放　0 评论　2025-02-25 23:08
DeepSeek+王炸组合，把DeepSeek用成精
雪莉儿　340 播放　0 评论　2025-02-25 14:56
..+DeepSeek如何重塑大数据：数势科技SwiftAgent的创新分享
细心卡尔9V6S　991 阅读　1 评论　1 点赞　2025-02-25 11:02
..+DeepSeek出来就爆火了，很多人都依赖它来写文章。我是觉得它是不能完全代替人的，这样不仅让很多人失业不说，而且写出来的东西一股人机味，人们一看就知道是用Ai写的。再说了，人工智能给的答案都是千篇一律的，没有人的思考，很多时候都不具有参考价值。 #万能生活指南#
今天说科技　1029 阅读　3 评论　3 点赞　2025-02-25 14:22

更多 #DeepSeek扔的第二枚开源王炸是什么# 热榜请移步今日头条 >>

162

DeepSeek扔的第二枚开源王炸是什么

DeepSeek扔的第二枚开源王炸到底是什么？

丨头条热榜