
DeepSeek启动“开源周”
阅读 282739 话题 1213

DeepSeek代码库开源进度1/5:为Hopper GPU优化的高效MLA解码内核
IT之家 2 月 24 日消息,DeepSeek 今日启动“开源周”,首个开源的代码库为 FlashMLA—— 针对 Hopper GPU 优化的高效 MLA 解码内核,专为处理可变长度序列而设计。
..+GitHub趋势榜今早被神秘项目屠榜!开源社区惊现新一代视觉语言模型VLM-R1,这个基于DeepSeek R1方法论打造的"多模态学霸",竟然把Qwen-VL 2.5技术装进了开源框架! 当其他AI还在玩"看图说话"时,VLM-R1已经修炼出火眼金睛。用户随手问"照片里第三排左数第二个穿红色AJ的男生在哪",它能瞬间用像素级坐标框出目标。实测在复杂超市货架场景中,连包装上0.5cm高的保质期文字都能精准锁定! 更绝的是这波"白嫖"福利——开发者放出的开源代码支持本地部署,普通显卡就能跑。网友实测在宜家产品手册上测试,模型不仅能指出"斯佳蒙靠垫"位置,还能同步生成618促销文案!现在已有电商企业用它做智能客服,处理退货纠纷时效率暴涨300%。 #AI视觉革命# #开源模型逆袭# #科技改变生活# #深度学习新突破#
..+2025年,整个时代突然装上了加速器!可谓称得上真正意义上的AG I元年! 2025年1月20日Deepseek R1横空出世,具备了人类的思考能力,并且开源震惊世界! 作为文化不高,又是全职妈妈,我感觉要被时代抛弃了!联想着春晚机器人舞蹈,感叹人工智能、科技飞速的发展之快! 是不是未来的社会,机器人会代替更多的各行各业的工作,失业的人也越来越多了…… 人呀,不管何时何地,还是要多学习,努力跟上时代的发展,因为未来的世界更精彩!
..+你敢信,一个仅120多人、几乎没有留学生的小团队,开发出的DeepSeek竟让美国忌惮,甚至导致英伟达股票市值暴跌6000亿!这背后,彰显的是我们顶尖的科研实力。 常听到某些专家唱衰,说我们技术差2 - 3代,可别忘了,我们仅用30年就赶超了西方几百年的积累。这是何等的成就!如今,面对AI、芯片等关键领域,我们缺人才、缺资本吗?不,缺的是敢于担当的大型组织人才,缺的是团结一心的信念与强大的自信心。 美国的打压,不该成为我们相互指责、抱怨的理由,而应是我们奋进的动力。当我们团结一致,就能汇聚起强大的力量。在科技的赛道上,我们完全有能力、有底气,用5年、10年赶超美国,展现东方大国的后发优势。 信心比黄金更重要,团结是无坚不摧的力量。未来只要我们坚定信心,攻克关键技术,定能让世界看到中国科技崛起的磅礴之势。
..+DeepSeek最新开源FlashMLA 针对 Hopper GPU 的高效 MLA 解码内核,针对可变长度序列服务进行了优化。 使用 CUDA 12.6,在 H800 SXM5 上实现高达 3000 GB/s 的内存绑定配置和 580 TFLOPS 的计算绑定配置。 https://github.com/deepseek-ai/FlashMLA
..+Deepseek王炸组合图文详解版!!! DeepSeek+Kimi=自动生成ppt DeepSeek+Xmind=快速打造超强思维导图 DeepSeek+Mermaid=专业图表
..+坚决抵制deepseek
..+开源,永远的神。昨天,阶跃星辰开源了SOTA多模态模型,为国产开源贡献力量;deepseek也即将开源5个代码库,包括核心训练工具和推理优化工具。 这波开源操作,力度真大!阶跃星辰的Step-Video-T2V和Step-Audio,直接把国产多模态模型推上了世界顶尖水平。特别是Step-Audio,支持多种方言和演唱风格,这对于中文语音交互领域来说,绝对是里程碑式的进展。 deepseek开源的NSA原生稀疏注意力机制,更是直接把核心技术放了出来,这在业界真的不多见。 开源训练工具、推理优化工具,甚至包括模型架构细节,这充分展现了deepseek的开放态度。 这不仅方便开发者复现和改进模型,更能促进整个AI社区的技术进步。 这种彻底的开源,打破了技术壁垒,让更多人能够参与到AI技术的发展中来。“知识属于全人类”这句话,在这里体现得淋漓尽致。 这不仅是中国AI技术实力的体现,更是对全球AI社区的巨大贡献。 国产AI的开源行动,正在加速AI技术的普及和发展。 国内AI开源的这股劲儿,势头很猛,未来可期。你觉得这种完全开源的模式,对AI技术发展的影响会如何? #bgcgui#
..+DeepSeek 开源周首日重磅发布:FlashMLA大模型推理加速神器 专为Hopper GPU优化的MLA解码内核,针对变长序列进行深度调优,现已在生产环境投入使用! 项目亮点: 🔥 内存受限场景实现3000GB/s吞吐量 ⚡ 计算受限场景在H800 GPU达成580 TFLOPS算力 💡 支持BF16数据格式 🔧 集成64块大小的分页KV缓存 📦 简洁API设计,仅需几行代码即可调用 🎯适用场景 ✔️ 需要秒级响应的对话系统 ✔️ 处理超长文本的NLP应用 ✔️ 高并发AI服务部署 GitHub:github.com/deepseek-ai/FlashMLA
..+【开源-deepseek】Deepseek 在第一天开源了 FlashMLA,这是一款为 Hopper GPU 优化的 MLA 解码内核,专为处理可变长度序列进行了优化。 特性: • 支持 BF16 格式 • 配备 64 块大小的分页 KV 缓存 性能: 在 H800 上实现: • 内存受限配置下:达到 3000 GB/s • 计算受限配置下:达到 580 TFLOPS 应用场景: FlashMLA 在 AI 服务部署中非常适合需要快速响应用户请求的场景,尤其是对于需要处理大量文本的应用,它的表现尤为突出。 现已投入生产环境使用。 使用说明: FlashMLA 是为 Hopper GPU 优化的高效 MLA 解码内核,支持可变长度序列的服务。 目前已发布: • 支持 BF16 格式 • 具有分页 KV 缓存,块大小为 64 快速开始: 安装: python setup.py install 基准测试: python tests/test_flash_mla.py 在 H800 SXM5 上,使用 CUDA 12.6,内存受限配置下可实现高达 3000 GB/s,计算受限配置下可实现高达 580 TFLOPS 的性能。 #deepseek#
丨头条热榜
- 1习近平同普京通电话
- 211亿巨贪白天辉二审维持死刑原判
- 3起草组成员解读中央一号文件
- 4中方回应泽连斯基希望得到中国帮助
- 5德候任总理默茨对华态度如何
- 6白天辉曾出镜忏悔帮赖小民完成项目
- 7疑似华为新形态手机曝光
- 8DeepSeek预测哪吒2最终票房
- 9女子喷米诺地尔后变成“小毛人”
- 10全红婵拟被保送暨南大学
- 11如何看待乌不承认欠美国5000亿美元
- 12高盛称A股有望在三个月内反超港股
- 13有人敲门 大衣哥爬梯子翻墙去儿子家
- 14土地承包为何要延长三十年
- 15成都多校将开启机器人授课不实
- 162025房价是涨还是跌
- 17俄战机投下4枚重磅炸弹轰炸乌军
- 18医科大女研究生自杀 父亲发声
- 19京东:骑手五险一金成本由京东承担
- 20专家:泽连斯基开辞职条件以退为进
- 21政协委员:建议降低法定婚龄到18岁
- 22韩庚米兰街头再跳SorrySorry
- 23蔡正元:解放军已具备远洋作战能力
- 24非法持枪 落马副部杨克宁获刑16年
- 25彩礼为什么越来越高
- 26迪士尼《白雪公主》遭内地网友抵制
- 27宇树科技王兴兴回到上海母校
- 28记者:乌克兰最好的选择是加入北约
- 29现在买房是买新房还是捡漏二手房
- 30胖东来:郑州首店确实要入驻东站
- 31大盘午后跳水是否意味短线调整
- 32格力专卖店为何更名董明珠健康家
- 33女孩将纸片卷成尖的形状塞入胸部
- 34鹿晗邓超深夜喝酒聚餐
- 35司机行车途中喝水 车子撞山起大火
- 36军工虎谭瑞松被除党籍:靠军工吃军工
- 37移动源已成污染物排放首要来源
- 3818岁男孩确诊糖尿病
- 39德国选择党主席魏德尔立志下次取胜
- 40农村移风易俗要避免“一刀切”
- 41印女孩称被60余人性侵 已有58人被捕
- 422025年研考国家线发布
- 43白宫为何想要泽连斯基移居法国
- 44曝日讨论派自卫队赴乌参与战后维和
- 45同班同学双双考研416分
- 46韩国瑜呼吁让柯文哲见父亲最后一面
- 47全球首个双足骨骼机器人诞生
- 48撒贝宁贾静雯铁岭美食初体验
- 49陈赫直播被追问鹿晗关晓彤是否分手
- 50男子先动手挑衅对方被反揍