ChatGPT语音转文字商业化,每分钟仅4分钱…
自发布至今,仅用了3个月时间就轻松积累超1亿用户的ChatGPT,宣布开始商业化运营。目前企业付费可通过API将ChatGPT接入集成到他们的应用程序和服务中,还有开放了语音转文字功能。据悉,语音转文字功能可实现转录和翻译需求,并支持包括英语、中文、阿拉伯语、日语、德语、西班牙语等几十种语言。费用大致每分钟0.006美元(约0.04元人民币)。

这项语音转文字的API,是基于OpenAI公司的Whisper大模型,去年9月份首次推出Whisper Large-v1模型,12月开源了升级版的Whisper Large-v2模型。与其他同类服务相比,OpenAI 高度优化的服务堆栈保证了更快的输出速度。
具体方面:Whisper API 通过 transcriptions(源语言转录)或 translations(翻译为英语)端点使用,允许 m4a、mp3、mp4、mpeg、mpga、wav、webm 等各种格式的输入。

ChatGPT和Whisper开放 API,意味着第三方可以开始构建这两个模型赋能的下一代应用程序,并使更多人从中受益。但事情总有两面性,如此高效又低价的语音转化功能,预计会让很多语音、翻译相关的企业压力增大。
推荐阅读: