岳东晓博士 20小时前
DeepSeek-R1 32B 开源模型本地解题过程:DeepSeek 这次确实震撼了AI界。不仅开源了 6700亿参数,比肩 OpenAi-o1 的模型,还顺手把之前其他公司开源的一些小模型进行了思考训练的微调。下载这些模型到本地运行,它就能进行思考。其中一个320亿参数的模型是基于 Qwen 32b。我下载到PC上使用 LMStud ...全文
岳东晓博士 20小时前
DeepSeek-R1 32B 开源模型本地解题过程:DeepSeek 这次确实震撼了AI界。不仅开源了 6700亿参数,比肩 OpenAi-o1 的模型,还顺手把之前其他公司开源的一些小模型进行了思考训练的微调。下载这些模型到本地运行,它就能进行思考。其中一个320亿参数的模型是基于 Qwen 32b。我下载到PC上使用 LMStud ...全文
硅谷陈源博士 5小时前
”阻止中国使用GPU是在邀请中国发明不需要GPU的Al。”? 红遍半边天来自中国的大模型DeepSeek采用多项创新技术,如混合精度训练、双向流水线并行以及自研的 DeepSeekMoE架构等,把大模型预训练的资源需求和成本优化到了极致,以1/10的算力和成本取得达到和超过当前一些最先进大模型的性能。 DeepSee ...全文
联合国 19小时前
#联合国秘书长古特雷斯# 已经启程前往瑞士达沃斯出席2025年#世界经济论坛# 。此次论坛将于1月20日至24日在达沃斯举行,主题为“智能时代的合作”,以强调智能化技术时代中协作的重要性,反映了全球面临的共同挑战——从#气候变化# 到科技伦理,从劳动力短缺到公平发展。 古特雷斯计划围绕论坛的主题在讲 ...全文
爱可可-爱生活 1天前 北京
DeepSeek-R1 项目展现了开源的真谛——不仅开放了一系列模型,更罕见地公开了完整的训练细节。在开源社区中,他们或许是首个展示出强化学习持续突破性进展的项目。 有意思的是,取得突破的方式并非靠“内部突破”或者类似“草莓计划”这样充满神秘色彩的项目名称,而是通过最朴实的方式——直接公开算 ...全文
李桂江 1天前 深圳
贝索斯在2024年狂投9家公司,基本上都跟AI人工智能有关。这眼光还是很毒的。#人工智能#
Crypto美股-孙二狗 4分钟前 上海
AI 5000亿计划落地了,利好英伟达,微软。另外一个美国优先事项啥时候有实质性利好勒 #人工智能#
德国Zoe妈妈 18分钟前
特朗普宣布成立人工智能公司星际之门计划,计划在未来四年投资 5000 亿美元在美国建设新的人工智能基础设施。 Stargate 的初始股权资助者是 Oracle、SoftBank、OpenAI 和 MGX。 甲骨文首席执行官拉里·埃里森表示,人工智能技术很快就能设计个性化的 mRNA 疫苗来对抗癌症。 OpenAI(与微软合作)将利 ...全文
岳东晓博士 1天前
中国 AI 大爆炸:中国AI公司 DeepSeek 开源了 其R1 思维模型以及相关理论与算法。DeepSeek-R1 已经与 OpenAI-o1 持平,而且开源。更令人振奋的是,DeepSeek 的 R1 思维训练模板可以用来蒸馏现有的小模型,使这些小模型也具备了思维能力。下面是我阅读其论文并测试的初步总结。1. 理论基础: AI模型训练 ...全文
爱可可-爱生活 1天前 北京
【[101星]rStar:微软推出的数学推理项目,旨在展示小型语言模型(SLM)在数学推理方面可以通过自我演化的深度思考(Deep Thinking)过程达到与大型模型相当甚至更好的性能。该项目基于蒙特卡洛树搜索(MCTS)算法,结合了 SLM 的策略模型和奖励模型,使得 SLM 能够在没有从优化模型中获得指导的情况下 ...全文
刘智驾 1天前 广州
三位大佬这个神情,他们发现的是个三折叠? ai图片,请勿当真 #人工智能#
向鱼AIGC 4小时前 杭州
就在刚刚阶跃星辰发布了最新的视频生成模型Step-Video V2,语义理解和指令遵循能力较V1模型都有大幅提升,在复杂运动、美感人物、视觉想象力、基础文字生成、原生中英双语输入和镜头语言等方面具备更强的生成能力,太卷了,AI视频赛道又多了一位颇具竞争力的玩家 以下视频demo来自官方公众号,看着效 ...全文