了解 Google 改进语音模型的方式

许多 Google 产品都支持语音识别功能。例如,你可以通过语音向 Google 助理寻求帮助,利用 Gboard 的语音输入功能发送消息给好友,以及在 Google Meet 中自动生成会议字幕。

语音技术越来越依赖于深度神经网络,这是一种机器学习技术,可帮助我们构建更准确、更快速的语音识别模型。通常,深度神经网络需要更大量的数据才能正常运行,并随着时间的推移不断改善,这个改善过程称为模型训练。

我们使用哪些技术来训练语音模型

Google 的语音团队使用 3 大类技术来训练语音模型:常规学习、联邦学习和短暂学习。对于特定的任务和情形,有些技术相较于其他技术可能更加有效;而在某些情况下,我们会结合使用这些技术。这样,我们既可以从设计上保障用户隐私,又能尽量实现最佳品质。

Google 对这些技术的运用和投入

我们会继续采用这 3 类技术,并且经常会将它们结合起来使用,以实现更好的训练效果。此外,我们还在设法改进联邦学习和短暂学习在语音技术方面的成效。我们的目标是让这些技术更有效、更实用,并且在默认情况下能保护隐私。

需要更多帮助?

请尝试以下步骤:

4782591100476635435
true
搜索支持中心
true
true
true
true
true
1633398
false
false
false
false
搜索
清除搜索内容
关闭搜索框
主菜单