楼主再给我2分钟:众所周知,有一个非常强大的软件叫做 TTS Server,据说是由酷安社区的几位技术大佬联手开发的。这款软件不仅功能强大,而且扩展性极高,最大亮点在于它支持用户自由导入各类第三方接口的语音包,真正做到了开放、自由、无门槛。更关键的是,它完全开源免费,用起来几乎没有任何限制,甚至还能让我们“白嫖”到不少互联网大厂的语音合成服务!
最近我就看到有位大佬分享了一个新版微软翻译插件,正是调用微软Azure认知服务中的语音接口。这个接口可非同一般——微软很多前沿的语音技术、实验性音色,都集中在这里。比如一些真人级声线、情感合成功能,平时普通用户根本接触不到。我把插件下载下来导入TTS Server一试,果然多出了一批新音色。
单独试听某一个音色,你也许还不觉得有多真实,但一旦把它放到实际的配音语境中——比如讲一段故事、播报一段新闻——效果就彻底不一样了。它能极其精准地模拟出真人说话的话气停顿、情感起伏,甚至呼吸节奏,真正做到“以假乱真”。坦白说,我是完全分辨不出这到底是真人录音还是AI合成,强烈建议大家也亲自试听一下,感受这个技术现在到底有多可怕。
如果想要尝试这个插件的话,我也很乐意分享出来。反正是开源项目,免费又自由,好东西大家一起用才更有意思!