零重力瓦力 24天前 上海
推荐一款免费开源,但性能强大的小型多模态模型:Molmo。这款模型是由艾伦人工智能研究所推出,支持文本、图像和语音等多种输入形式。它具备高效的数据处理和指向能力,并且能够进行出色的视觉问答。例如在演示视频中,准确指向现实空间中,用户要求的目标,并操控机器人完成各种任务。Molmo 系列包括 ...全文
零重力瓦力 24天前 上海
推荐一款免费开源,但性能强大的小型多模态模型:Molmo。这款模型是由艾伦人工智能研究所推出,支持文本、图像和语音等多种输入形式。它具备高效的数据处理和指向能力,并且能够进行出色的视觉问答。例如在演示视频中,准确指向现实空间中,用户要求的目标,并操控机器人完成各种任务。Molmo 系列包括 ...全文
爱可可-爱生活 10天前 北京
【[65星]mcp-openai-gemini-llama-example:一个简单易懂的AI代理示例项目,展示了如何通过模型上下文协议(MCP)连接开源大语言模型(如Llama 3、OpenAI或Google Gemini)和SQLite数据库,帮助开发者快速上手AI代理开发】'This repository contains a basic example of how to build an AI agent usin ...全文
AMiner学术头条 51天前 西安
HunyuanVideo: A Systematic Framework for Large Video Generative 🔗 本文介绍了一种名为HunyuanVideo的开源视频生成基础模型,其性能可以媲美或超越业界领先的闭源模型。HunyuanVideo包含数据筛选、高级架构设计、渐进式模型扩展与训练,以及针对大规模模型训练和推断的效率化基 ...全文
幫港出聲 240天前
【帮港出声即日快递】美国抄袭中国AI开源模型 被揭破急道歉承诺删除 美国史丹福大学有AI团队,被网民揭发抄袭内地新创公司「面壁智能」的开源模型,消息传出后引起各界关注,涉事的团队之后作出公开道歉,并承诺删除相关开源模型。抄袭别人努力研发的成果当成自己的,行为相当可耻,而当做着这可耻行 ...全文
爱可可-爱生活 3天前 北京
【[115星]YuE:开源的全曲生成基础模型,类似Suno.ai,但完全开放。亮点:1. 能将歌词转化为完整的歌曲,包括人声和伴奏;2. 支持多种音乐风格,如流行和金属;3. 提供多种模型版本,满足不同需求】 'YuE: Open Full-song Generation Foundation Model, something similar to Suno.ai but open' GitHub ...全文
爱可可-爱生活 86天前 北京
【Hunyuan-Large:腾讯推出的大型 MoE(Mixture of Experts)模型,该模型拥有 3890 亿参数和 520 亿激活参数,是业界目前最大的开源 Transformer 基础 MoE 模型,专注于自然语言处理和长文本理解】'Tencent/Tencent-Hunyuan-Large - Hunyuan-Large (Hunyuan-MoE-A52B) model is the largest open-sour ...全文
爱可可-爱生活 23天前 北京
【[12星]minimal-musicgen-for-developers:为开发者提供的极简版音乐生成模型,简化了Meta的MusicGen模型代码,让开发者更容易上手和修改,实现高质量音乐创作】'minimal-musicgen-for-developers - [PyTorch] Minimal codebase for MusicGen models' GitHub: ...全文
爱可可-爱生活 57天前 北京
【混元视频HunyuanVideo:腾讯开发的开源视频生成基础模型,采用统一的图像和视频生成架构,具备文本生成视频和图像转视频两大核心功能。特色包括多模态大语言模型文本编码器、3D VAE压缩技术和提示词重写功能。根据专业人员评估,在视觉质量、动作质量和文本对齐度等方面均优于多个主流闭源商业模型。 ...全文
ITBEAR官方微博 4天前 北京
【DeepSeek-R1横空出世,能否挑战OpenAI o1霸主地位?】 DeepSeek团队发布最新开源模型DeepSeek-R1,迅速收获超4000星标。该模型摒弃传统SFT数据,完全依赖强化学习训练,具备自我思考能力。DeepSeek-R1在数学、代码和自然语言推理等领域表现出色,成本仅为o1五十分之一。团队还开源6个小模型,性能超 ...全文