地惊讶了。
他一直以为楼清焰是个不学无术的纨绔,就算所有人都搞懂了计算机原理,他也不可能搞懂的那种。
没想到他真的懂。
楼清焰还没说完,他继而道:“理论上,AI软件通过深度学习,可以掌握数字信号的规律,构建一个数据模型,再基于模型生成语音。”
“但是,这需要一个大前提——机器学习算法能直接从数字层做特征提取。”
他问道:“能吗?”
谢晋服了,这人为啥总是一下子问到最关键的地方。
“现在确实没这个技术。我们设计的特征提取算法,主要瞄准声音的波形表现,频率、相位这些。”他简单地说。
楼清焰又说:“不止缺这一个技术吧。做了特征提取,知道怎么归纳总结吗?知道怎么训练模型吗?会写算法吗?设想过这个计算量有多庞大吗?”
谢晋:“……”
楼清焰发觉有点说过了,遂拍拍他肩膀,鼓励道:“不过你们已经做得很好了,能达到这个程度非常了不起……嗯,下一步工作是什么?”
谢晋:“……”看出来你是在敷衍了。
“软件的构造有点臃肿,只有在工作站上才能流畅运行,下一步先考虑优化问题。”
“好的。”楼清焰也就是随口一问。
他不在意软件本身,得知已经有了AI语音合成的雏形,他来这趟的目的就已经达成了。
谢晋研发的这款电子声带,其实还是提前录制人声,再进行排列组合。只不过基于AI算法训练的数据模型,会对音频波形进行修改,让声音变得流畅自然,更加真实。
这款软件的局限性在于算法。音频领域的特征提取没有可参考前例,谢晋团队必须把数字音频研究透彻,然后基于其特性设计新算法——不仅是逻辑框架,还包括万恶的数学模型。这可不是一朝一夕能搞出来的。
但是楼清焰呢,他脑子里有现成的。
在星际时代,声音合成是一项非常普及的技术,宇宙人早就可以在编码层面生成各种声音,还出现了一种新职业,叫音频作家。
类比于文学作家,音频作家就是直接创作广
本章未完,请点击下一页继续阅读! 第2页 / 共3页