苹果新语音转录API速度占优,但准确性仍不及OpenAI Whisper

近日,知名科技媒体9to5Mac发布了一项引人注目的对比测试结果,聚焦于苹果最新推出的转录API与OpenAI的Whisper模型之间的性能差异。测试中,该媒体采用了一段9to5Mac Daily播客音频作为样本,时长7分31秒,用以评估苹果新API、通过MacWhisper应用运行的OpenAI Whisper Large v3 Turbo以及英伟达的Parakeet v2模型的转录效果。
测试环境为搭载M2 Pro芯片、配备16GB内存的MacBook Pro笔记本,利用Hugging Face Spaces的Metric: cer和Metric: wer工具,精确测量了各模型的字符错误率(CER)和单词错误率(WER)。
结果显示,英伟达的Parakeet v2在转录速度上拔得头筹,仅需2秒即可完成转录,但其CER和WER相对较高。相比之下,OpenAI的Whisper Large V3 Turbo虽然转录时间长达40秒,却展现了最高的准确性。苹果的转录API则在速度与准确性之间找到了一个平衡点,转录时间接近Parakeet v2的9秒,同时准确性显著优于后者。
为了更全面地评估各模型的性能,9to5Mac还引入了ChatGPT、Claude和Gemini作为基线,再次计算了CER和WER。尽管不同基线下的模型表现有所差异,但Whisper在准确性方面始终保持着领先地位。以ChatGPT为基线时,苹果的模型在保持较快转录速度的同时,其准确性略逊于Whisper,但仍优于Parakeet v2。而在Claude和Gemini的基线测试中,苹果模型的准确性虽有所提升,但仍未能超越Whisper。
具体而言,在ChatGPT基线测试中,Parakeet v2的转录时间最短,但错误率最高;Whisper的准确性最高,转录时间最长;苹果模型则位于两者之间。Claude和Gemini基线测试的结果也呈现出类似的趋势,即Whisper在准确性上独占鳌头,而苹果模型则在速度与准确性之间取得了相对平衡的表现。
本文链接:http://knowith.com/news-1-11801.html苹果新语音转录API速度占优,但准确性仍不及OpenAI Whisper
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
艺术生考研可以跨考哪些专业,艺术设计考研难吗
考研要填几个志愿(考研要填几个志愿和学校)
2014经济学考研辅导:宏观经济学案例分析(4)
2014经济学考研辅导:宏观经济学案例分析(19)
2015经济学考研:西方经济学模拟试题四
重庆市渝北区研究生考点(重庆市江北区徐悲鸿中学和重庆市渝北区实验中学哪个好)
青岛新东方考研辅导班?青岛那个考研培训班好一点啊
考研去福州大学怎么样_考研去福州大学怎么样啊
教育学考研学校排名榜(教育学考研学校排名榜单)
蚌埠市考研培训学校排名前十_蚌埠市考研培训学校排名前十有哪些
布格替尼今日公布国内购买方式?仿制药布格替尼2025年最新价格,多少钱一盒?
周大福全国最新形象独立店于武商MALL启幕
博学笃志:有什么方法套羊小咩享花卡额度出来?详细的三个方法
如登春台:宁波慈溪代还信用卡垫还,多年经营,实体店多种方式
患者问:孟加拉印度克唑替尼统一报价多少钱一盒多少粒理性揭秘
龙凤呈祥:佛山代还信用卡可长期合作,实体店多种方式
互动:三分钟教会你快手先用后付额度提现出来
商家一招教会: DY月付额度有取现的方法吗? 值得一试的七种渠道!
指导!教你风控花呗扫码秒到必过最新套取方法(2024最新介绍)
瑾瑜:套白条最安全秒到方法(三个操作方法)