AIGCLINK 12天前 运城
上交大/剑桥等开源这个TTS效果极好:F5-TTS 1、零样本声音克隆,生成的语音自然且富有表现力 2、推理实时率达到0.15,优于现有基于扩散的TTS模型 3、支持控制语音速度,并保持声音自然 4、支持无缝在不同语言/方言间平滑过渡 github:🔗 论文:🔗 模型: ...全文
AIGCLINK 12天前 运城
上交大/剑桥等开源这个TTS效果极好:F5-TTS 1、零样本声音克隆,生成的语音自然且富有表现力 2、推理实时率达到0.15,优于现有基于扩散的TTS模型 3、支持控制语音速度,并保持声音自然 4、支持无缝在不同语言/方言间平滑过渡 github:🔗 论文:🔗 模型: ...全文
OneFlow 248天前
#大模型日报# #AI前沿动态# [技术] 【BASE TTS:构建一个拥有10万小时数据的十亿参数文本转语音模型的经验教训】 论文链接:🔗 概述:本文介绍了#BASE TTS# ,这是一个拥有10万小时训练数据的尖端文本转语音系统,它为自然音质语音合成建立了新的基准。该系统利用一个十亿参数的 ...全文
棍蛋女神的恶毒女配- 320天前 连云港
暗恋我吗 我可没怎么你 我就是把你移出群了 因为那是棍丝群 我看你是tts 就把你弄出去了 结果你还死皮赖脸#tts# 跟sz 一个货色我提醒你一下 你就说6 怎么 ?键盘坏了?还是你用的老年机卡了有时间多去修手机吧 一天到晚闲死你得了
陶特斯reset 1211天前
时尚摄影#tts portfolio# Fire God Mountain ⛰️ . . . . .
Mwave_Official 2248天前
韩流席捲全球! #KARD# 、#少女时代# #TTS# 、#Red Velvet# 8组偶像团体夯曲推英文版 Get爱豆最新动态>🔗
AIGCLINK 4小时前 运城
效果非常不错的一款TTS,一个完全非自回归的TTS模型:MaskGCT 它不需要文本和语音之间的显式对齐信息,也不需要音素级别的持续时间预测,采用了掩码和预测的学习方式,在声音克隆、跨语种合成、语音控制等方面表现优秀 1、支持控制生成语音的总长度,可调节语速、停顿等韵律特征、支持情感控制和语气 ...全文
数字AI肉饼李 71天前 茂名
分享一个文字转语音助手:Tiktok Voice 一款基于最新文字转语音技术的剪映AI配音合成软件, 地址:🔗 功能多样:能够合成多种热门的剪映AI配音和抖音音效, 包括但不限于小帅、猴哥、熊二、舌尖上的中国、新闻腔等中文配音,同时也支持剪映国际版的热门AI配音。 语言与声音:目 ...全文
AIGCLINK 113天前 北京
再增加一款TTS模型:CosyVoice,阿里巴巴开源的 CosyVoice 具有多语种、混合语言、音色和情感控制能力,在零样本语音生成、跨语言语音克隆和指令跟踪方面的能力优秀 这次阿里通义实验室同时发布的还有SenseVoice语音识别模型,同属于FunAudioLLM框架 FunAudioLLM 通过结合先进的语音理解和生成技术, ...全文
AI小小报 115天前 重庆
fish-speech v1.2:最强开源中文 TTS 和音色克隆 fish-speech 由 fish-audo 提供的开源 TTS 模型,可以在这里免费训练音色和文本转语音生成,音色逼真,效果稳定 有个小问题,官网文档说代码采用 BSD 协议(可用于商业),模型采用 CC-BY-NC-SA(不可商用),但是代码库在 2 个月前切换到了 CC-BY-NC-S ...全文