欢迎小主! 162导航

#自然语言处理#

  • 爱可可-爱生活 33天前 佛山

    【Transformers from Scratch:从零开始构建Transformer模型,带你深入理解自然语言处理的核心技术!亮点:1. 从基础概念到完整架构,逐步解析Transformer的每一个细节;2. 结合矩阵运算、注意力机制等关键知识点,深入浅出;3. 提供丰富的代码实现和资源链接,助力快速上手】 'Transformers from Sc ...全文

  • 爱可可-爱生活 70天前 北京

    深入浅出Transformer架构与PyTorch实现 本文首先介绍了Transformer模型的背景,包括它的创新点和为什么需要它。然后详细阐述了Transformer的关键组件,包括自注意力机制、位置编码、编码器和解码器层的结构,以及如何通过多头注意力来提高模型的性能。接着,通过代码示例展示了如何使用PyTorch来实现T ...全文

  • 微软亚洲研究院 214天前 北京

    #AI论文分享# #科研上新# 更新啦 本期,我们为大家精选了微软亚洲研究院入选 #自然语言处理# 领域的国际顶级学术会议#ACL2024# 的6篇文章。最后一篇文章聚焦于#大语言模型# 的文本嵌入,一起来看看吧: 《E5-Mistral:大语言模型增强的文本嵌入》 文本嵌入模型将一段连续的文本映射成低维的稠 ...全文

  • 爱可可-爱生活 61天前 北京

    【深入浅出讲解机器学习中的嵌入(Embedding)概念,通过通俗易懂的方式,帮助从工程师到学生等不同背景的人理解嵌入在机器学习和自然语言处理中的基础作用,以及其在推荐系统等实际应用中的价值,旨在揭开模型的“黑箱”,让大家更好地掌握和运用这些知识】 “What are embeddings” ...全文

  • 爱可可-爱生活 83天前 

    【Tiny LLM zh:从零开始的小参数量中文大语言模型,旨在快速入门学习大模型相关知识,提供公开数据和代码,支持多阶段训练和人类对齐技术】'wdndev/tiny-llm-zh: 从零实现一个小参数量中文大语言模型。' GitHub: github.com/wdndev/tiny-llm-zh #大语言模型# #人工智能# #自然语言处理# #AI创造营#

  • 爱可可-爱生活 173天前 北京

    【Model2Vec:将任何句子Transformer蒸馏成小巧快速的模型,它通过简化和加速文本嵌入过程,让文本分析更高效】Model2Vec: Distill a Small Fast Model from any Sentence Transformer. GitHub: github.com/MinishLab/model2vec #文本分析# #机器学习# #自然语言处理#

  • 爱可可-爱生活 2天前 北京

    【Gemma 3:新一代多功能AI模型,为多模态交互和高效开发提供强大支持。亮点:1. 支持多模态输入,可处理图像和文本;2. 上下文窗口高达128k tokens,支持140多种语言;3. 提供4种不同规模模型(1B、4B、12B、27B),满足多样化需求】 'Introducing Gemma 3: The Developer Guide' 完整链接: ...全文

  • 爱可可-爱生活 129天前 北京

    【Hunyuan-Large:腾讯推出的大型 MoE(Mixture of Experts)模型,该模型拥有 3890 亿参数和 520 亿激活参数,是业界目前最大的开源 Transformer 基础 MoE 模型,专注于自然语言处理和长文本理解】'Tencent/Tencent-Hunyuan-Large - Hunyuan-Large (Hunyuan-MoE-A52B) model is the largest open-sour ...全文

  • 爱可可-爱生活 178天前 北京

    【Nexa SDK:一款全面支持ONNX和GGML模型的工具包,具备文本生成、图像生成、视觉-语言模型(VLM)、自动语音识别(ASR)和文本到语音(TTS)功能,提供OpenAI兼容的API服务器,JSON模式调用函数和流媒体支持,以及用户友好的Streamlit UI】'Nexa SDK - Comprehensive Toolkit for ONNX and GGML Model ...全文

  • 爱可可-爱生活 181天前 北京

    【将自然语言问题转换为数据可视化的框架,用户可以上传 SQLite 数据库或 CSV 文件,并通过自然语言提问,系统将生成相应的 SQL 查询,执行查询并将结果以视觉图形的形式展示】'datavisualization_langgraph - This agent bridges the gap between natural language questions and data visualization, ...全文

  • 打盹的龙只 10天前 庆阳

    自然语言处理白皮书&发展现状#AI科技# #学习资料# #自然语言处理# ... @知识星球

  • 爱可可-爱生活 12天前 北京

    【Transformer详解(Slides)】 'Transformers: The architecture that revolutionizes NLP and CV with attention mechanisms.' 🔗:🔗 #Transformer架构# #自然语言处理# #计算机视觉# #AI创造营#

  • Z

    Z时代懒人锚点丶 15天前 张家口

    #AI说人话# 最该点亮哪些技能?】💬 想让AI开口说人话?我赌这4个领域先出圈👇 🌟 客服小姐姐2.0:听得懂抱怨接得住梗,秒变矛盾调解小能手 📚 学霸陪聊机器人:把高数讲成段子,还能模仿你爱豆讲题的语气 🏥 温柔医疗助手:不说"建议观察随访",改说"咱们先好好睡三晚" 🏠 家居嘴替管 ...全文

  • 略通书书 35天前 杭州

    Token 用量计算#云计算# token 是模型用来表示自然语言文本的基本单位,也是我们的计费单元,可以直观的理解为“字”或“词”;通常 1 个中文词语、1 个英文单词、1 个数字或 1 个符号计为 1 个 token。#自然语言处理# 一般情况下模型中 token 和字数的换算比例大致如下: 1 个英文字符 ≈ 0.3 个 ...全文

  • 爱可可-爱生活 69天前 北京

    【NotebookLM开源版:一款结合了Deepseek-V3语言理解和PlayHT文本转语音功能的开源工具,能生成自然流畅的对话并将其转换为逼真的音频,适用于教育和娱乐领域】'An opensource implementation of NotebookLM using Deepseek-V3 and PlayHT TTS.' GitHub: github.com/satvik314/opensource_notebooklm ...全文

  • 爱可可-爱生活 75天前 北京

    【LLMs_from_scratch:《从零开始构建大型语言模型》的学习记录,记录了一步步构建语言模型的过程,适合想要深入了解NLP和机器学习的爱好者】'yhlleo/LLMs_from_scratch: Learning records for building a large language model from scratch' GitHub: github.com/yhlleo/LLMs_from_scratch #语言模型# ...全文

丨话题榜