欢迎小主! 162导航

#大型语言模型#

  • 爱可可-爱生活 65天前 北京

    【[40.9k星]大型语言模型(LLM)学习课程,提供丰富的学习路线图和Colab笔记本,帮助你轻松掌握LLM的基本知识和应用技巧】 1. 💫 基础夯实篇 带你掌握数学要领、Python编程和神经网络核心知识,为AI进阶打下坚实基础。 2. 🔬 科学探索篇 深入LLM前沿技术,教你构建高性能模型,让你真正理解AI的思 ...全文

  • O

    OneFlow 106天前 北京

    《50张图,直观理解#混合专家# #MoE# )大模型》 Mixtral 8x7B的高效训练与推理效果曾引发AI社区对混合专家(MoE)模型的广泛关注,后来居上的国产开源大模型DeepSeek以及腾讯近期开源的Hunyuan-Large(基于Transformer的最大MoE模型)也选择了MoE框架路线。为何大语言模型总是离不开MoE的身影? ...全文

  • 爱可可-爱生活 31天前 佛山

    【Reasoning LLMs:对包括DeepSeek-R1技术报告在内的十篇最新大语言模型推理相关论文进行解读,让AI推理更智能、更高效】 'Reasoning LLMs: Enhancing AI reasoning capabilities with advanced techniques' 🔗:🔗 #AI推理# #大型语言模型# #技术优化# #AI创造营#

  • 爱可可-爱生活 38天前 佛山

    【The Big Book of LLMs:一本全面深入探索大型语言模型的书。亮点:1. 涵盖从传统语言模型到现代Transformer架构的演变;2. 深入讲解多模态大模型和非Transformer语言模型;3. 提供从训练到部署的全方位指导】 'The Big Book of LLMs: A comprehensive guide to understanding and deploying Large ...全文

  • 爱可可-爱生活 178天前 北京

    【(新书)大型语言模型实战手册:通过超过275张定制插图,深入探索大型语言模型的世界,为Python开发者提供使用大型语言模型所需的实用工具和概念】'Hands-On Large Language Models - Explore the world of Large Language Models with over 275 custom made figures in this illustrated guide!' ...全文

  • 爱可可-爱生活 209天前 北京

    【大型语言模型(LLM)训练新范式:深入探讨现代大型语言模型的预训练和后训练方法,分析了Qwen 2、苹果智能基础语言模型、Gemma 2和Llama 3.1等最新模型的技术报告和训练流程】《New LLM Pre-training and Post-training Paradigms》 🔗 #机器学习# #人工智能# #大型语言模型# ...全文

  • 张岱樾 9天前 

    LLM Post-Training: A Deep Dive into Reasoning Large Language Models LLM培训:大型语言模型推理的深入研究 链接👉🏻github.com/mbzuai-oryx/Awesome-LLM-Post-training 论文👉🏻🔗 #大型语言模型# #学习资料分享# #LLM# #ai创造营# #ai正当学# #ai open day# #ai兴趣创作计划#

  • 麻省理工科技评论 118天前 北京

    【AI导航测试:纽约街道闭路实验揭示生成式模型的薄弱点】 尽管#大型语言模型# (LLMs)可以完成令人印象深刻的任务,比如写诗或生成可行的计算机程序,这些模型的训练目标却只是预测文本中下一步可能出现的单词。 这种令人惊讶的能力让人感觉这些模型可能隐约学到了一些关于世界的通用真理。 但一 ...全文

  • 爱可可-爱生活 6天前 北京

    【[31星]OpenSparseLLMs/Linearization:将大型语言模型线性化为门控循环结构的创新项目。亮点:1. 提出Liger框架,实现LLMs的高效线性化;2. 通过线性化显著提升模型的计算效率;3. 提供完整的训练与评估流程,助力模型优化】 'Liger: Linearizing Large Language Models to Gated Recurrent Struct ...全文

  • 爱可可-爱生活 240天前 北京

    【新书:《LLM工程师手册:从概念到生产的大型语言模型工程艺术》,包括数据工程、监督微调、部署等方面,通过详细示例帮助读者理解 MLOps 组件在项目中的实施,包含引言/架构、数据工程、监督微调、评估、优化、RAG 相关内容、部署、操作与观察以及案例研究等部分,读者能学会构建强大的数据管道、管 ...全文

  • 平凡-_-_ 23小时前 重庆

    《超越想象的GPT医疗》这本书是解析医疗类GPT落地实践,揭示 “人机关系”重要范式;彼得·李及其他两位合著者分享了以GPT-4 为代表的大语言模型在医学领域的诸多应用可能性,更重要的是向大家展现了一种可能出现的人-机相结合的“关系”范式 超越想象的GPT医疗(彼得·李 & 凯丽·戈德伯格 & 伊萨克·科 ...全文

  • 菲利普老六 9天前 福州

    再转发一次。作为技术人员,很想了解这篇论文在蔚来世界模型落地项目上的价值和效果。#蔚来汽车# #大型语言模型#

  • 芳香方向2233 11天前 上海

    #语言模型# #大型语言模型# #胡说八道# @LifeOnMars2025

  • 枥石 31天前 上海

    Deepseek独立部署各种版本区别 总结: V1:适合编程和文本处理,简单易用。 V2/V2.5:性价比高,适合预算有限的通用场景。 V3:速度快,多语言支持,适合广泛的知识问答和创作。 R1:专攻数学和代码,适合专业开发者。 671B 满血版:性能顶尖,但需要强大硬件支持,适合高要求的专业任务。 独立部署 ...全文

  • 仙气花妖 43天前 盐城

    #大模型学习必备!这本神书你不能错过# 还在为搞不懂大模型技术发愁?想搭建大模型应用却无从下手?别慌!《大型语言模型实战指南:应用实践与场景落地》PDF超清带书签目录,ISBN9787111758457 来救场啦✨ 它深度剖析 5 大核心技术,带你吃透大模型底层逻辑,手把手教你搭建 6 类大模型应用,从基础理 ...全文

丨话题榜