在AI技术飞速发展的今天,语音克隆已经不再是科幻电影中的场景。fish.audio,作为新推出的TTS(Text-to-Speech)解决方案,不仅提供了免费的在线使用平台,还拥有一个丰富的音色商店,里面囊括了众多网红和名人的音色。让我们一起来探索这个令人兴奋的AI语音世界。
体验网址:
fish.audio
目前,国内用户可以直接访问并使用该平台。
不过,最近几天访问速度有所下降,不知道是因为使用者增多还是网络问题,希望大家抓紧时间体验。
探索音色商店
一进入主页,映入眼帘的就是fish.audio的音色商店,琳琅满目的音色让人眼花缭乱。从国际巨星到网红主播,各种声音应有尽有,用户可以尽情选择和体验。比如,想象一下用周杰伦的声音来给自己留言,或者用马云的声音来做日常提醒,是不是特别有趣?
实际体验
我们先来听几个大家熟悉的声音:
蔡徐坤,未来AI工具,6秒
邓紫棋,未来AI工具,6秒
唐生,未来AI工具,6秒
以上三个声音呢,就是克隆了蔡徐坤、铁肺女王邓紫棋、御弟哥哥唐三藏的声音!
这些音色效果基本上能达到原声的七八成。无论是语调、语速还是停顿,都模仿得相当到位,几乎可以乱真。
而且除了这些家喻户晓的名人声音,还有许多有趣的音色供选择,比如动漫角色、历史人物等,让人耳目一新。
AI语音技术测试
作为AI技术的爱好者,我对语音技术的发展非常好奇,因此进行了简单的测试,并在此分享一下体验。以下是我的感受:嗯……还不错……AI技术发展的确实令人惊叹。语音克隆的准确度和自然度让人感到惊喜,尤其是对语速、停顿和语调的细节处理更是让人佩服。
使用步骤详解
要想使用fish.audio克隆声音非常简单,只需准备一段20~45秒的音频即可。以下是详细步骤:
1. 注册并登录
可以使用邮箱注册,也可以直接用Github或Google账号登录。注册过程简单快捷,让人轻松上手。
前几天使用时还是免费不限量,现在每天有50点的配额,每次可转语音的字数是500字节,折合成汉字大概是100个字。每个账号每天可以免费转语音5000字左右。如果想要增加额度,可以开通会员。但建议使用多个邮箱注册,足够日常使用。
2. 克隆声音
点击网页左上角的“构建声音”选项:
如果不想让别人用自己的音色,可以选择“私人”模式,确保音色不会被其他人看到。然后上传封面图片,建议使用自己的头像以便快速找到自己的音色。命名时可以根据不同场景加以区分,方便以后查找使用。
接下来上传一段音频或直接录音,音频素材控制在10~45秒左右,尽量减少杂音。上传后点击创建,等待一分钟左右,fish.audio会自动处理并生成克隆音色。
在这里,我们就可以使用我们自己的声音来进行配音了。
语音转换
音色克隆完成后,点击“使用声音”进入文本转语音界面。界面非常简洁直观,只需在文本输入框里输入想要转换成语音的文字内容,点击创建,等待10秒左右即可完成转换。
简单听一下效果:音色还原了大概有七八分左右,不过我的说话语气、停顿、还有一些小习惯都保留得很好。考虑到只是20多秒的音频素材能够还原成这个效果已经非常不错了。
fish.audio的音色还原度大约有七八成,但说话的语气、停顿等细节都保留得很好。考虑到操作简便、零门槛且免费使用,fish.audio无疑是目前最适合普通用户的AI语音克隆工具。当然,AIGC的老问题仍然存在,单次生成效果不稳定,有时需要多次尝试才能达到满意效果。但随着产品不断迭代升级,相信fish.audio的表现会越来越好。
赶快前往体验吧,也许你会发现一个全新的AI语音世界!
© 版权声明
THE END