Microsoft Azure Cognitive Speech Services是 Speech to Text、Text to Speech、自定义神经语音 (CNV) 对话转录服务、说话人识别、语音翻译、语音 SDK 和语音设备开发工具包 (DDK) 等技术和服务的综合集合加速语音融入应用程序。
发音评估是 Azure 认知服务产品组合中语音服务的一项功能,以 10 多种语言和变体公开提供,包括美式英语、英式英语、澳大利亚英语、法语、西班牙语和中文,以及预览中的其他语言。它利用Azure Neural Text-to-Speech和Transformer 模型、顺序回归和层次结构来提高单词级别评估的准确性,为所有背景的语言学习者提供提高他们技能的机会。
微软最近为其认知语音服务推出了新功能,通过发音评估、新的语音到文本 (STT) 语言以及预构建和自定义神经语音增强来加速语言学习。
Microsoft Azure Cognitive Speech Services是 Speech to Text、Text to Speech、自定义神经语音 (CNV) 对话转录服务、说话人识别、语音翻译、语音 SDK 和语音设备开发工具包 (DDK) 等技术和服务的综合集合加速语音融入应用程序。
发音评估是 Azure 认知服务产品组合中语音服务的一项功能,以 10 多种语言和变体公开提供,包括美式英语、英式英语、澳大利亚英语、法语、西班牙语和中文,以及预览中的其他语言。它利用Azure Neural Text-to-Speech和Transformer 模型、顺序回归和层次结构来提高单词级别评估的准确性,为所有背景的语言学习者提供提高他们技能的机会。
来源:https://techcommunity.microsoft.com/t5/ai-cognitive-services-blog/speech-service-update-hierarchical-transformer-for-pronunciation/ba-p/3740866
此外,Azure Speech to text支持多语种语言学习场景的实时语言识别,帮助人与人交互,更好地理解和阅读上下文。该服务的新语音转文本(STT) 语言基于大量数据,利用最新的多语言建模技术和迁移学习技术提供输出,包括逆文本规范化(ITN)、大写(适当时)和自动标点符号以增强可读性。
最后,Microsoft Azure AI为 AI 教师提供了一系列预构建的神经语音、内容朗读功能等。自定义神经语音(CNV) 还使用户能够使用人类语音样本作为训练数据,为其应用创建独特的自定义合成语音。CNV 基于神经文本到语音技术,非常适合代表品牌和拟人化机器进行对话交互。教育公司正在使用这项技术来个性化语言学习,例如Duolingo和Pearson。
微软首席项目经理 Qinying Liao 在一篇 Azure 技术社区博文中表示:
Microsoft 提供超过 400 种神经语音,涵盖 140 多种语言和地区。借助这些文本转语音语音,您可以快速添加朗读功能以实现更易于访问的应用程序设计,或者为聊天机器人提供语音,从而为您的用户提供更丰富的对话体验。
总的来说,Azure AI 的高级产品营销经理 Andy Beatman 在一篇 Azure AI博文中说:
人工智能,特别是语音服务,融入教育领域变得越来越重要,因为它可以极大地提升学习体验,提高教学效果。Azure 发音评估和自定义神经语音等语音服务可在教育平台中提供个性化、自动化和分析,从而提高学生的参与度和成就。
最后,文档登录页面上提供了更多 Azure 认知语音服务详细信息。此外,客户可以使用Speech Studio来测试自定义语音功能如何帮助提高对其音频的识别。关于作者Steef-Jan Wiggers 是 InfoQ 的高级云编辑之一,在荷兰的 HSO 担任技术集成架构师。他目前的技术专长侧重于集成平台实施、Azure DevOps 和 Azure 平台解决方案架构。Steef-Jan 是荷兰 Azure 用户组的董事会成员,会议和用户组的定期演讲者,为 InfoQ 和 Serverless Notes 撰稿。此外,在过去的十一年中,Microsoft 一直将他评为 Microsoft Azure MVP。