使用 Speech 框架转录音频文件

了解如何使用 Speech 框架,在 iOS 设备上实现音频转录功能。

使用 Speech 框架转录音频文件

Swift 提供了 Speech 框架,可以实现对实时或预先录制的音频执行语音识别。

Speech | Apple Developer Documentation
Perform speech recognition on live or prerecorded audio, and receive transcriptions, alternative interpretations, and confidence levels of the results.

该框架使用本地机器学习模型和网络请求将音频转换为文本。苹果没有明确表示何时需要进行网络请求,但建议开发者始终假设执行语音识别需要网络连接。

SFSpeechRecognizer

识别音频语言

目前不支持自动识别语言,必须在初始化时指定语言。

为识别结果添加标点符号

默认情况下, Speech 框架的识别结果不包含标点符号