零重力瓦力 76天前 上海
AI 口型同步工具 Hedra 迎来重大更新,新增五大功能: 1. 语音隔离:去除背景噪音,几秒钟内获得清晰音频。 2. 变声器:上传声音或使用克隆/自定义声音,瞬间转换。 3. 语音设计:从简单的文本提示生成独特的声音。 4. AI 创意助手:更快地生成、翻译和增强语音脚本。 5. 12分钟视频:一次性生成长达1 ...全文
零重力瓦力 76天前 上海
AI 口型同步工具 Hedra 迎来重大更新,新增五大功能: 1. 语音隔离:去除背景噪音,几秒钟内获得清晰音频。 2. 变声器:上传声音或使用克隆/自定义声音,瞬间转换。 3. 语音设计:从简单的文本提示生成独特的声音。 4. AI 创意助手:更快地生成、翻译和增强语音脚本。 5. 12分钟视频:一次性生成长达1 ...全文
爱可可-爱生活 4天前 北京
【[30星]Baichuan-Omni-1.5:一个支持文本、图像、视频和音频输入以及文本和音频输出的开源全模态基础模型。亮点:1. 超强的视觉语言能力,平均得分73.3,比GPT-4o-mini高出6分;2. 统一且出色的语音能力,支持高质量的双语实时对话;3. 在医学图像理解方面表现卓越,OpenMM-Medical得分83.8%,超越Qwe ...全文
Easy 875天前 重庆
#AI语音# 这一年用下来,自己觉得比较自然的语音: 女声:微软xiaoxiao,edge内置,azure有api 男声:微信读书AI男声,最近两月更新的那个版本,不知道哪儿有API 男声微软yunjian的也不错,适合听网文,edge内置,azure有api
刘兴亮 1508天前
【科大讯飞和云知声都说自己是AI语音赛道第一,谁在说谎?】最近在科创板递交上市招股书的云知声称其语音病历和家电智能语音模组领域两者的市场占有率皆高达70%。 科大讯飞对投资者回复中称,「无论从出货量还是收入规模来说,目前云知声在家电语音应用领域的份额都不到科大讯飞的十分之一。」「在医 ...全文
出门问问 1757天前
外卖、快递电话来了不用接?模仿的你声音,用你的声音代替你接电话?这不是无中生有、暗度成仓、凭空想象、凭空捏造... 你的小问秘书已上线,推销广告等“骚扰电话”靠边站啦!#TicWatch# #人工智能# #AI语音# #骚扰电话# #接到骚扰电话怎么办# #智能生活# #出门问问# 出门问问的🎞︎微博视频
零重力瓦力 25天前 上海
继 Loopy 之后,字节又发布了一款开源口型同步模型:LatentSync。效果丝毫不逊色于阿里的 EMO,微软的 Vasa-1。 模型亮点 1. 能够一步到位,直接将声音转换成匹配的嘴型画面。 2. 借助 Stable Diffusion 的 AI 绘画技术让视频的画面更加自然。 3. LatentSync 开发了一个叫 TREPA 的新技术,能够让连 ...全文
爱可可-爱生活 71天前 北京
【AivisSpeech:基于VOICEVOX开发的AI语音合成软件,支持Windows和macOS系统,可轻松生成富有情感的日语语音。支持AIVMX格式的语音模型,采用ONNX Runtime实现高速CPU推理,通过简单的UI界面即可添加和管理语音模型】 'AivisSpeech: AI Voice Imitation System - Text to Speech Software' GitHub: ...全文