题材哥 9小时前 成都
【东吴计算机】AI大模型/Agent/算力催化共振 1⃣#阿里千问推出最新推理模型QwQ-32B,仅用320 亿参数,性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。 - 这一成果突显了将强化学习应用于经过大规模预训练的强大基础模型的有效性。此外,我们还在推理模型中集成了与 Agent 相关 ...全文
题材哥 9小时前 成都
【东吴计算机】AI大模型/Agent/算力催化共振 1⃣#阿里千问推出最新推理模型QwQ-32B,仅用320 亿参数,性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。 - 这一成果突显了将强化学习应用于经过大规模预训练的强大基础模型的有效性。此外,我们还在推理模型中集成了与 Agent 相关 ...全文
月光照耀O 1天前 昆明
OPPO ColorOS全面接入满血版DeepSeek-R1,到底如何使用?你的机型都支持了吗?#ColorOS15# #ColorOS使用技巧# #DeepSeek-R1# @ColorOS 月光照耀O的🎞︎微博视频
数码小哥哥 13天前 深圳
被搭载满血版#DeepSeek-R1# 的小布助手惊艳到了!只需简单的输入了诉求,它就帮我定制了超省心的3日行程,连山城复杂路况下的停车点和拍照点都安排得明明白白!全程智能规划路线不绕路,甚至还贴心地标注了各景点自驾注意事项,太实用了~
无所谓ya丶 37天前 阜新
#DeepSeek# #DeepSeek一夜掀翻美股# 这是来自五千年文化高级文明的降维打击,老美接招吧! #DeepSeek-R1# 无所谓ya丶的🎞︎微博视频
麻省理工科技评论 30天前
#DeepSeek-R1# 【解构DeepSeek-R1:一场AI效率革命背后的技术突破】 科技圈从来不缺新闻,但 DeepSeek-R1 的出现,却像一颗石子投入平静的湖面,激起了层层涟漪。这家来自中国的 #AI# 初创公司,以其开源的推理大模型 R1,正在搅动全球 AI 格局。R1 不仅拥有媲美甚至超越 #OpenAI# o1 的性能,更以 ...全文
新浪科技 32天前 北京
【AI界“拼多多”DeepSeek国内外刷屏!龙头20CM一字板,受益上市公司梳理】上周,中国量化巨头幻方量化旗下大模型公司#DeepSeek# 推出了新模型#DeepSeek-R1# ,该模型在数学、编程和推理等关键领域的表现甚至能媲美OpenAI的最强推理模型o1。技术报告显示,DeepSeek-R1的训练费用仅为OpenAI最新大模型的三 ...全文
月光照耀O 20小时前 昆明
DeepSeek升级计划来了! ColorOS x DeepSeek满血版正式上线升级计划!老机型也能用!你的机型用上了吗? #deepseek-r1# #ColorOS15# #ColorOS使用技巧# #ColorOS# @ColorOS
北大AI鱼博士 20天前 北京
【#英伟达AI优化新突破:DeepSeek-R1让GPU性能翻倍# 】 英伟达工程师团队在最新技术博客中披露,通过引入#DeepSeek-R1# 大模型与闭环验证系统,成功将GPU的注意力核心代码优化效率推向新高度。在Hopper架构H100 GPU平台上,这套"AI程序员+机器质检员"组合拳,竟让关键算法性能最高提升2.1倍! 传统AI ...全文
麻省理工科技评论 36天前 开封
#deepseek彻底爆发# 【当AI成本降低30倍:DeepSeek-R1如何重塑AI行业】 自 #DeepSeek-R1# 发布以来,其出色的推理能力和相对低廉的训练成本在业界引发强烈反响。它让人们意识到,高性能 #AI# 模型的开发,也许不必依赖于昂贵的算力和海量的数据。 R1 不仅在性能上接近 OpenAI 的 o1,更重要的是,它 ...全文
云财经 44天前 珠海
实时快报:【#DeepSeek-R1 发布,性能对标 OpenAI o1 正式版# 】云财经讯,DeepSeek宣布正式发布 DeepSeek-R1,并同步开源模型权重。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 ...全文
OneFlow 17天前 楚雄彝族自治州
《#SiliconCloud# x #CAMEL# :教你用 #DeepSeek-R1# 蒸馏数学推理数据》 #DeepSeek# -R1 凭借卓越的数学推理能力和高效的逻辑处理引发了广泛关注。无论是基础算术还是复杂的数学难题,它都能轻松应对,为开发者提供强大地计算支持。 现在,利用硅基流动大模型云服务平台 SiliconCloud 上高效稳定且价 ...全文
算家计算 1小时前 贵阳
低成本硬刚DeepSeek-R1,阿里这波开源杀疯了! 昨夜通义千问团队扔出“王炸”——开源模型QwQ-32B,用两阶段强化学习狂点技能树:先靠“代码实战批改式训练”练就理科状元级思维,再通过规则验证器拓展全能天赋。 结果。。。这款仅有320亿参数的模型,在数学、代码、通用能力等核心场景里,已经几乎 ...全文
集微网官方微博 2小时前 南京
【#阿里发布并开源通义千问QwQ-32B推理模型# 性能比肩DeepSeek-R1】 3月6日,#阿里云# 官方微信公告,发布并开源全新的推理模型通义千问QwQ-32B。阿里云指出,#千问QwQ-32B# 在数学、代码及通用能力上实现质的飞跃,整体性能比肩#DeepSeek-R1# 。 港股阿里巴巴股价高开高走,午后涨幅扩大,一度涨超8%。 ...全文
铋读 7小时前 北京
阿里Qwen团队发布32B大语言模型,性能超过DeepSeek-R1,具备推理模型与Agent能力,表现优异。#deepseek-r1# 阿里Qwen团队发布全新推理模型QwQ-32B
ITBEAR官方微博 4天前 天津
【九章云极DataCanvas DeepSeek-R1满血版API,开发者的大模型加速神器!】 九章云极DataCanvas推出DeepSeek-R1满血版API接口,免费向开发者开放,被誉为大模型开发领域的“极速先锋”,可快速处理复杂任务。用户通过Alaya NeW官网注册并配置访问令牌,即可体验高性能AI服务。同时,CherryStudio桌面客 ...全文
黑伽罗 6天前 北京
和平精英接入DeepSeek-R1给我整懵了!!!! #和平精英# #DeepSeek-R1# #和平精英接入DeepSeek-R1#
建安七子 10天前 天津
发布了头条文章:《通俗易懂DeepSeek-R1》 为什么DeepSeek-R1模型现在这么火?他到底牛在哪儿?一篇文章通俗的告诉你 #deepseek-r1# 通俗易懂DeepSeek-R1