标贝科技语音合成技术再升级,倾力打造AI语音极致体验

发布时间:2022年05月10日
       2020年是智能语音交互络绎不绝加快落地的一年。防疫常态化的要求下, 长途会议、在线教育、在线工作已成为人们日子中的标配, 智能语音交互络绎不绝规划化开展由此得到了极大的推进。为了赋予组成声响更丰厚的情感表现力和个性化, 打造AI语音极致务实, 近期, 标贝科技再一次进行语音组成络绎不绝“晋级改造”, 于3月25日完结TTS3.0版别的检验, 正式上线标贝科技官方网站。全新络绎不绝晋级, 让AI声响更富表现力发音作用明显提高标贝科技晋级的TTS3.0络绎不绝斑驳陆离全新的非自回归声学模型, 在发音作用上有了明显提高, 对不同人物和情感表达的判别愈加精确, 输出的音质安稳、明晰、顺利, 音色赋有表现力;声码器则斑驳陆离GAN结构, 能够高效且实在的复原波形, 增加了组成声响的实在质感。多音字、中止愈加精确此外, 标贝科技TTS3.0在发音细节上也进行了优化。例如, 根据Mask-basedModel神经网络多音字模型,

对一切多音字进行一致建模, 提高了语音组成时多音字发音的精确率;在韵律方面, 斑驳陆离多任务的神经网络模型, 使用韵律间的层次联系, 在同一个模型结构下, 对多个韵律等级进行建模, 对组成语音在高低音和中止的处理愈加天然和流通。
       模型兼容标贝科技本次TTS3.0使用了全新的声学模型和声码器, 一起, 坚持了对TTS2.0旧模型的悉数兼容, 最大程度地确保体系服务的无缝晋级, 削减老客户晋级带来的开发本钱。更多音色加持, 助力语音场景快速落地此前, 根据海量语音数据的优势, 在TTS1.0、TTS2.0络绎不绝基础上, 标贝科技现已推出男声、女声、白叟、童声等多音色, 中文、英文、中英混读、小语种、方言等多语种的解决计划, 并支撑用户个性化的需求定制, 能够满意大部分客户在车载、有声阅览、智能客服、新闻媒体、影视说明等多范畴使用需求, 并已与国表里百余家企业客户树立协作, 服务项目累计超越500项。
       本次TTS3.0络绎不绝晋级, 标贝科技通过屡次大规划产品务实评测后, 再次扩大音库量及场景化计划。
       在官方网站正式上线了9大音色, 包含童声、青年男女生,

深度掩盖有声阅览、语音交互、智能客服等范畴更多场景需求。与TTS1.0、TTS2.0相同, 本次TTS3.0相同支撑SDK、流式/非流式API、MRCP协议等对接方式, 接口同步/异步调用, 且全体组成速度较之条件高了1.6倍, 全效助力各开发者快速落地声响场景使用。丰厚情感表达, 助推有声阅览创造近些年, 我国有声书商场开展迅速,

各大音频渠道, 阅览使用、视频网站乃至是传统出书职业也都测验进入有声书商场。据相关材料显现, 2020年我国有声书商场规划已达到了95.6亿元, 同比增加50.3%。
       5G年代的到来, 有声阅览必将引起更大规划的迸发。标贝科技TTS3.0结合最新的语音络绎不绝、海量的文本和声学数据以及大规划核算才能, 让机器的声响情感表现力愈加实在天然, 充沛满意当下有声阅览场景的需求。比方有声小说中, 最难表达的人物心情和对话, TTS3.0络绎不绝做到许多细节的处理, 让组成的声响杰出对话重音及口气, 让人物情感表达愈加细腻, 犹如真人“配音”, 使听众更直接理解小说情节, 进一步享用听觉“盛宴”。
       标贝科技作为一家聚集智能语音交互和AI数据服务的企业, 通过五年的开展, 现已推出了AI数字虚拟人、智能客服、才智媒体等一站式解决计划;在产品方面, 推出标贝悦读、恐龙贝克两大C端产品, 现已完成从原有的单点语音络绎不绝服务晋级至语音、图画、虚拟形象等多络绎不绝模块交融的职业解决计划。标贝科技TTS3.0络绎不绝晋级, 投合了语音组成开展的新趋势, 将智能语音使用提速增效, 完成用户极致务实新打破。未来, 标贝科技将持续深耕智能语音络绎不绝研究与开展, 为更多语音组成使用场景供给服务。