移动互联网

频频“翻车”的搜狗AI录音笔,真的是业内领先吗?

2020/3/6 4:28:00

 

  编辑 | 于斌

  出品 | 于见(ID:mpyujian)

  未来在线办公的形态到底会发展到什么样的程度?这是这段时间以来很多企业都在认真思考的问题。疫情之下,智能办公、远程办公正成为风口。

  就在不久之前,搜狗全新发布的AI录音笔产品引起了我们的注意。用人工智能与硬件产品的结合来解决专业的“录音转文稿”痛点,这个细分领域开始成为很多公司聚焦的方向。

  2月底,搜狗举办了一场线上新品发布会,发布了旗下多款搜狗AI智能录音笔新品。在搜狗语音识别技术赋能之下,据称该系列AI录音笔产品的语音转文字准确率可以达到98%,此外还有AI降噪、自由对话翻译、个人同传等功能。

  需要指出的是,在AI录音笔这一垂直领域并非只有搜狗这一个玩家,以百度、科大讯飞、谷歌等为代表的AI巨头都深入布局。在这种背景下,以输入法起家的搜狗就难免会面临与头部AI企业的直接对比。

  主打卖点频频“翻车”,搜狗录音笔遭质疑

  按照官方介绍,搜狗AI智能录音笔具备强大的AI 实力,拥有业内领先的转写准确率,而这也是录音笔产品最为核心的卖点。

  对于录音笔产品的核心受众来说,如何将录音更高效、智能、准确地转换成文本是最大的痛点,如果使用产品之后还需要反复进行听写、比对、校正才能最终成稿,那么AI录音笔产品就跟传统的录音笔、录音设备没有多大区别了。

  从第一款AI录音笔产品C1开始,搜狗录音笔就将“录音一小时,出稿5分钟”作为主打卖点,再加上搜狗输入法词库等相关领域的积累,似乎搜狗AI录音笔产品是可以给用户带来良好的录音转文本体验的。

  可事实上,搜狗AI录音笔的实际使用体验并不如大家想象的那么美好。

  就像很多用户曾经反馈过的那样,他们在使用搜狗AI录音笔产品时,往往并不能做到所谓的“录音一小时,出稿5分钟”,文本的语言逻辑和识别错误情况很多,录音转文本后经常需要你花费大量的时间进行重听、校正与修改。考虑到现实生活中的录音场景毕竟比不得标准的播报场景,在日常工作、会议等场景下,搜狗AI录音笔产品的识别能力和语句逻辑上体验并不好。

  客观来看,市面上所有的AI录音笔产品当然都无法做到“零修改”,但是即便部分语句识别的并不准确,整体文本的逻辑性与通顺程度仍然至关重要。只有这样,用户在二次校正的时候才能做到花更少的时间进行修改。

  “正常的中国人看不懂吧”、“的确不好用啊,距离嘴唇几厘米说话,还能错字”、“千万别买了!转换率能到95,我把它吃了”、“翻译出来的东西惨不忍睹”......以搜狗AI智能录音笔C1为例,这些都是该款产品在京东上的代表性用户差评。

  另外,针对最新推出的S1、E1等几款新品,两款产品的售价都比原先几百元的C1产品高出了不少,E1要在京东上要1298元,S1更是售价达到了2698元。

  那么这样大幅的产品高端化价格提升有没有让搜狗AI录音笔的核心录音转文本能力得到提升?

  从目前的情况来看,可能并没有,因为核心的语音识别能力和文本逻辑调教还是那些技术。那么这么高的溢价体现在哪里?可插卡、多语言翻译、高清降噪、收音能力更强......搜狗AI录音笔好像正在往智能手机的方面上发展,却并未能在核心录音转文本上有本质提升。

  此外,搜狗AI录音笔产品还存在耗电较大、待机时间不长等相关投诉,这些问题都直指AI录音笔产品的基本使用体验。一直以来,对录音笔强“刚需”的人群基本都是需要进行会议采编、会议翻译的工作人员等,它们一方面要求录音转文本的效率,另一方面要求产品耐用、可持续使用的时间长,但在这两点上搜狗AI录音笔产品做得并不好。

  从这些角度上看,2698元的搜狗AI录音笔S1虽然看起来是大屏显示、具备多语言翻译机功能,但这些功能似乎只是帮助产品实现了高溢价,却并未能让产品在基本的用户需求上实现突破。

  不容乐观的是,在搜狗AI录音笔产品录音转文本功能受到质疑的背景下,其多语言翻译的同声传译功能同样不能受到业内人士的认可,这更加深了对于产品在实际应用场景中频繁“翻车”的吐槽。

  还有一点不得不提的是,搜狗AI录音笔的语音转录功能是收费的,这也让它面临着“技术水平撑不起价格”的广泛质疑。

  竞品口碑更好,搜狗AI录音笔任重道远

  在AI录音笔这一赛道,搜狗的技术积累并没有太大的优势,这可能是搜狗AI录音笔产品目前在行业中的最大隐患。

  尽管AI录音笔行业还在发展期,但该领域的未来发展潜力是公认的巨大,此时搜狗AI录音笔如若不能抢占优势、获得用户认可的话,那么它的未来将会走的更加艰难。

  以同类竞品进行对比来看,比如讯飞录音笔在用户层面的口碑就比搜狗录音笔要好。

  同样是官方宣称的识别准确率达到98%、“1小时的会议录音,5分钟即可转写完成”,讯飞录音笔产品的实际转录体验要比搜狗录音笔好得多。

  这可能是因为讯飞录音笔的语音识别模块采用了科大讯飞基于深度全序列卷积神经网络的语音识别框架,再加上科大讯飞长期以来在语音识别领域的领先优势,最终让语音转文字的结果变得更加“靠谱”。

  据悉,讯飞录音笔的智能转写引擎在转写过程中会针对整句语音识别结果及时调整,利用相关声学信息、语言模型等进行重新评估来给出更合理可靠的转录结果。与此同时,产品还会对整句进行口语规整操作,去除语气词、无意义的词、重复词或调整词序,用这些技术来实现文字转写结果的流畅性、可阅读性。

  而一旦语音转录的结果变得整体流畅、可读了,用户才能在二次校正时省去更大的精力,这与搜狗录音笔转录后出现的大量不流畅内容形成了鲜明对比。

  再加上自定义标签方便检索、边录边译等亮点功能,讯飞录音笔在整体转录、同声传译上的表现相对更加优秀,搜狗录音笔还有很长的一段路要走。


版权声明
本文仅代表作者观点,不代表艾瑞立场。本文系作者授权艾瑞专栏发表,未经许可,不得转载。

专家介绍

  • 于见

    总访问量:4074037
    全部文章:1024
中央国际广播电台《新财富时间》连线嘉宾,江苏电视台财经评论嘉宾,国家域名注册服务监督员,美国格理集团专家,美国格尔曼集团专家,《中国经营报》、《证券日报》、《人民网》、《法治周末》、《南方都市报》、《每日经济新闻》、《新京报》等媒体采访嘉宾,研究方向:互联网、通信、手机、家电、移动互联网、电子商务。
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 合作伙伴| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15021772号-10

扫一扫,或长按识别二维码

关注艾瑞网官方微信公众号