欢迎小主! 162导航

DeepSeek扔的第二枚开源王炸是什么

阅读 204433 话题 877

  • DeepSeek扔的第二枚开源王炸到底是什么?

    摘要:DeepSeek此次开源的全栈通信库DeepEP,通过优化GPU之间信息传输的效率,极大的缓解了从业者的算力焦虑。凤凰网科技 出品作者|梁思琦编辑|董雨晴2月25日,开源放福利的DeepSeek甩出了一张王炸——开源全球首个面向MoE模型的全栈通信库DeepEP。

    凤凰网科技 5380 阅读 11 评论 2025-02-25 19:01

  • DeepSeek可不可以用于论文 DeepSeek可以帮你搭建选题与框架等,谨记它仅作为辅助工具,核心论点与数据需研究者自主完成‌ #数字人 #deepseek #论文 #写论文 @掌桥科研

    直率扑克M 115 播放 0 评论 2025-02-25 18:18

  • deepseek使用攻略。deepseek使用指南#D e e pS e e k#

    今天你吃了吗 44 播放 0 评论 2025-02-26 02:24

  • 软杰接入DeepSeek

    上海软杰智慧停车 26 播放 0 评论 2025-02-25 15:35

  • DeepSeek开源第二弹:EP通信库来了#deepseek #人工智能

    长江云新闻 1951 播放 2 评论 2025-02-25 19:01

  • DeepSeek参数详解+硬件要求指南 还在为选择AI模型发愁?DeepSeek参数详解+配置指南来了!无需计算机博士学历,3分钟看懂专业术语! 首先什么是1.5B/7B/14B...?这些都是模型参数,“B”代表十亿参数‌:如5B=50亿参数,70B=700亿参数。 ‌参数规模与能力之间的关系是:参数越多,模型的理解、推理和生成能力越强,但对算力和内存要求更高。 看下‌典型代表‌: ‌小模型(1.5B-14B)(15亿到140亿参数量),这类模型比较轻量化,适合基础任务。 ‌中模型(32B-70B)(320亿到700亿参数量)‌:平衡性能与资源消耗。 ‌大模型(671B)(6710亿参数量)‌:具有顶尖性能,但是需专业级硬件支持。 ‌个人用户‌:优先选择1.5B-14B,可以平衡性能与成本。 ‌企业用户‌:推荐32B-70B,能够满足更多的专业需求。 ‌学术/超算场景‌:考虑70B+,可以搭配分布式计算。 如果想要本地部署大模型,推荐使用Infortress这种全图形界面的工具来部署,它无需用到命令行,无需用Docker,只需将Infortress软件安装到电脑上,就可以实现一键部署大模型到本地,比较适合没有技术基础的普通用户,它还是一款NAS应用,可以替换网盘,不仅支持手机相册自动备份到电脑上,还有AI相册,内网穿透,隐身模式,笔记管理,密码管理,通讯录备份等超多实用功能。#deepseek #DeepSeek

    用户9977421232989 89 播放 0 评论 2025-02-25 20:06

  • DeepSeek开源周第一天FlashMlA解析

    多才的消息先锋 95 播放 0 评论 2025-02-25 21:45

  • 5%参数量逼近Deepseek-R1 95%的性能 32B大小的tiny-r1-32b-preview 达到了671B满血版deepseek-r1 的95%的性能,数学,编程和科学能力远超2倍参数的deepseek-70b蒸馏版本。北京大学刚刚发布的全新模型已经huggingface上开源。#人工智能 #科技 #deepseek #编程

    陈泉林 15 播放 0 评论 2025-02-25 23:16

  • DeepSeek爆火后英伟达芯片大卖 DeepSeek推高低成本AI模型需求,英伟达H20芯片订单大增

    温州瓯海发布 7634 播放 1 评论 2025-02-25 20:11

  • ..+满血DeepSeek r1/v3部署方案H100\200与910B参考[V5][点亮平安灯][给力] 高校科研、科研单位院所,算力中心,人工智能创新企业、大型国企等可以参考[玫瑰][玫瑰][玫瑰] sglang目前支持最好,开启nextN(MTP)和torch-compile后,一组h200单线程可以到77t/s。vllm刚支持了MTP,具体还没看到实测。最近vllm不如sglang务实和努力。 推理的速度目前差8倍[点亮平安灯]。华为10t/s,英伟达目前已经快到80t/s。agent场景下,v3输出也要1000token左右完成一个thinking,如果用r1做更长,华为是100s才开始动,英伟达是12s。agent应用场景如自动编制文档,20个action起步,华为时间大概30分钟,英伟达是4分钟。 #机器学习##deepseek##人工智能##AI智囊##高校##研究生##博士##科研##技术##大模型# @北京大学@武汉大学@浙江大学@中国人民大学@厦门大学@重庆大学@山东大学

    荧火虫文化 2568 阅读 0 评论 1 点赞 2025-02-25 15:31

  • 鸿蒙融合DeepSeek 及AIOS升级相关梳理

    红阳在线 31 播放 0 评论 2025-02-25 23:08

  • DeepSeek+王炸组合,把DeepSeek用成精

    雪莉儿 340 播放 0 评论 2025-02-25 14:56

  • ..+DeepSeek如何重塑大数据:数势 科技SwiftAgent的创新分享

    细心卡尔9V6S 991 阅读 1 评论 1 点赞 2025-02-25 11:02

  • ..+DeepSeek出来就爆火了,很多人都依赖它来写文章。 我是觉得它是不能完全代替人的,这样不仅让很多人失业不说,而且写出来的东西一股人机味,人们一看就知道是用Ai写的。 再说了,人工智能给的答案都是千篇一律的,没有人的思考,很多时候都不具有参考价值。 #万能生活指南#

    今天说科技 1029 阅读 3 评论 3 点赞 2025-02-25 14:22

丨头条热榜