欢迎小主! 162导航

#LLM#

  • 爱可可-爱生活 31天前 北京

    【《LLM工程师手册》随书代码:一本深入浅出的指南,从基础到在AWS上部署高级LLM和RAG应用程序,使用LLMOps最佳实践】'The LLM's practical guide: From the fundamentals to deploying advanced LLM and RAG apps to AWS using LLMOps best practices' GitHub: ...全文

  • 林亦LYi 58天前 

    我才发现,OpenAI新模型聊天一次就要十几块 #AI便利店# #OpenAI# #科技# #AI大模型# #LLM# #豆包# #GPT# 林亦LYi的🎞︎微博视频

  • 歸藏的AI工具箱 73天前 北京

    Meta 发了三篇文章详细介绍 LLM 的训练过程以及微调。#ai# #llm# 文章非常的干,都是 LLM 微调的关键要点,强烈推荐看看,下面是核心的笔记。 - LLM 训练方法 - 如何选择合适的训练方式 - 如何判断是否需要微调 LLM - LLM 微调数据集准备 - 数据质量/数量 - 数据多样性 - LLM的数据管道如何构建 大 ...全文

  • A

    AIGCLINK 3天前 北京

    阿里的最新Qwen2.5,Qwen2.5 Turbo版来了:Qwen2.5-Turbo,将128K上下文扩展到了1M 在1M长度的Passkey检索任务中达到了100%准确率, 在RULER长文本评测基准上得分93.1,超越GPT-4的91.6分和GLM4-9B-1M的89.9分 从128k到1M,相当于100万英文单词或150万中文字符,10部长篇小说、150小时语音转录或3万行 ...全文

  • O

    OneFlow 13天前 北京

    《推算#LLM# 训练的#GPU# 内存需求》 本文将分析大语言模型训练的GPU内存需求,主要包括三个方面:训练数十亿参数基于Transformer的LLM时,每个GPU设备需要多少GPU内存;估算内存需求的公式是什么;如果模型无法匹配内存,在实践中应采取哪些措施来减少内存需求。 人工智能 ChatGPT ...全文

  • 青苗法鸣 4天前 漳州

    #法学院那些事儿# #法学# #llm# 🏵️留学始终是不少法律人考虑继续深造时的一大选项,但各种信息差的存在经常使有意留学者错失良机,未能上岸心仪院校。 本文作者结合自身经历,从择校定位、申请时间线、就读体验三个方面向我们展开叙述,希望对有志于申请LLM的同学有所帮助

  • 当知识图谱遇见AI 34天前 

    #字节跳动大模型训练被实习生攻击# 传闻显示,此事发生在今年6月,起因是某高校的博士在字节跳动商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。 该田姓实习生利用了HF(huggingface)的漏洞,在公司的共享模型里写入破坏代码,导致模型的训练效果忽高忽低,无法产 ...全文

  • M

    Moon法学申请研究所 36天前 北京

    城大的法学院faq里明确了大陆法本不能申请CCL,普通法辖区的法本不能申CL……给大家参考 #法学# #llm# #香港城市大学#

  • A

    AINLP 75天前 南京

    什么是AI Agents?#LLM # 大模型 #NLP # Agent #AI # AI代理 AINLP的🎞︎微博视频

  • 斌叔OKmath 60天前 北京

    LLM 能像人类开发人员一样调试程序吗? 🚀推出🛠️ LDB,一个带有 LLM 的调试框架🧠 !论文: 🔗 LDB 模仿开发人员的调试方式——将代码分解为基本块并通过运行时信息逐步跟踪变量,使 LLM 能够更精确地放大错误。 拥抱编码更智能、调试更轻松的未来。 🌟💻 #LLM # Debugg ...全文

  • 零重力瓦力 167天前 上海

    撰写《语言本能》和《思想本质》的著名认知心理学家史蒂芬·平克是如何看待大语言模型的呢?它究竟是像外星生物一样,还是与我们的大脑有共同之处? #大语言模型# #LLM# 史蒂芬平克 零重力瓦力的🎞︎微博视频

  • 鹅厂程序员 115天前 深圳

    终于有人把LLM应用讲清楚了!!! 今天鹅鹅带你们学习一下LLM入门应用篇~ 看过等于学过! #ai探索计划# #cheers!运维# AI 打工人 上班 #LLM# #AI#

  • b

    breezedeus 114天前 北京

    LLaMA 3 掀桌子三部曲(二),全是数据处理细节:LLaMA 3.1 发布 🔗 #LLM # llama3#

  • 微软中国MSDN 224天前 青岛

    什么是语言模型?什么是聊天模型?什么是嵌入模型?听 OpenTight AI Transition Specialist Lize Raes 讲解大语言模型的基本概念。 #Java# #AI# #JDConf# #LLM# 微软中国MSDN的🎞︎微博视频

  • 智能时刻 267天前 北京

    𝐋𝐋𝐌𝐬 路线图: 从#nlp# 基础知识到理解#llms# 的精心策划的内容列表。 📌 𝐍𝐋𝐏 📚 𝐂𝐨𝐮𝐫𝐬𝐞: NLP specialization 🔗 📑 𝐀𝐫𝐭𝐢𝐜𝐥𝐞: NLP word representations basics: 🔗 📑 𝐀𝐫𝐭𝐢𝐜 ...全文

  • 爱可可-爱生活 1天前 北京

    【XGrammar:开源的结构化生成库,支持通用的上下文无关文法进行广泛的结构化生成,提供经过系统优化的快速执行能力。采用轻量级且可移植的C++后端,易于集成到多种环境和框架中,特别设计了与LLM推理引擎的协同工作机制,实现零开销的结构化生成】 'Efficient, Flexible and Portable Structured Gene ...全文

  • 加密与人工智能研究员 1天前 河源

    部署 人工智能AI 本地大模型LLM #人工智能# #大模型# #llm#

  • O

    OneFlow 1天前 北京

    #强化学习# 之父Richard Sutton:#AGI# 研究的下一个范式》 OpenAI下一代GPT近期被爆遇到瓶颈,这让“Scaling Law撞墙”的声音变得更响,尽管业内对此争论不休,但现实情况是,大模型确实不再像年前那样有突飞猛进的进展。 作为启发大模型领域提出Scaling Law的研究者,强化学习之父、阿尔伯塔大学 ...全文

  • 法兰克福大学法律与金融学院 3天前 

    看看新出的ILF 2023-24学年Yearbook! 最新出版的法兰克福歌德大学法律与金融学院(ILF) 2023-2024学年Yearbook 已推出!该Yearbook旨为向读者们介绍该年度攻读金融法硕士和国际金融法硕士项目的学生情况。Yearbook还介绍了2023-24学年期间ILF开展的活动和学术会议。 点击翻阅:🔗 ...全文

  • 放荡不羁少少emo多多运动的棋崽 7天前 杭州

    悉尼也给俺offer了!#悉尼大学# #llm#

  • 手机中国联盟官博 7天前 南京

    #用LLM一键生成百万级领域知识图谱# !中科大新框架入选ACL 2024】#LLM# 现在,用#LLM# 一键就能生成百万级领域知识图谱了?! 来自中科大MIRA实验室研究人员提出一种通用的自动化知识图谱构建新框架SAC-KG,提升效果be like: 当使用#ChatGPT# 作为基础模型时,SAC-KG达到了89.32%的准确率和81.25%的 ...全文

  • M

    Moon法学申请研究所 8天前 北京

    一些#25fall# offer 记录:港中文 经济法 中政学员渌取!传递好运~ #香港中文大学# #法学# #llm# #经济法#

  • L

    Louis王录华 8天前 苏州

    💡 朋友想搞个建筑行业专业设计领域的AI创新方案。我的建议: 1️⃣ **聚焦专业业务难题**:确保所选问题有价值,同时是顶级业务专家能够解决的。 2️⃣ **AI与软件工程支持**:无需担忧技术层面,作为前腾讯特邀研究员和Oracle的技术架构师,我将与你并肩作战,一起头脑风暴。💪 #llm#

丨话题榜