AR眼镜的字幕功能效果怎么样。
实测来了!
不仅可以将语音实时转换成文字,还能分辨出说话人的主体,还可以保存文字记录,以后可以追溯。
今年,一家来自英国的AR初创企业,在脑中大开了一个洞。
他们把语音转换成文字的功能,转移到AR眼镜上,让旋转的文字很快出现在眼前。
主要目的是为聋哑人服务。
毕竟,即使有助听器的帮助,聋哑人往往需要文字作为参考信息。
AR眼镜方式使得生成字幕可以直接出现在人的眼前,使得接收信息更加方便快捷。
具体效果怎么样。往下看
据体验者西蒙·希利(Simon·Hill)说,刚戴上AR眼镜听对方说话时,那个文字的转印精度非常好。
效果类似于平时用语音实时旋转文字的功能,在语音结束之前文本内容会被调整,直到最后讲完才有最终版本。
XRAI内部人士表示,这是因为语音转换字符的计算是在云上进行的,通常会有延迟。
而且不仅仅是实时转录,这个功能也对应着检索履历,AR眼镜端和手机端都能检索,感觉像聊天软件。
录音后的声音在文本改写完成后会立即被删除,XRAI强调这些文本也只能由用户自己看到。
如果没有AR眼镜,也可以在手机上体验XRAI的功能。
一位网友也戴着眼镜体验了一下,他说这个功能不仅旋转语音速度快,而且在AR界面上的显示也不错。
此外,西蒙大哥在体验中发现了一些小问题。
例如,在XRAI的设想中,聋哑人使用该功能需要AR眼镜+安卓手机。
是的,这个应用程序还不支持iOS系统。
两台设备搭配起来,拿起来很麻烦,尤其是AR眼镜的重量还没有下降的情况下,聋哑人必须戴上人工耳蜗,戴上AR眼镜,舒适度肯定不高。
西蒙表示
另外,关于基于声音的文字变换的效果,西蒙也提出了一些疑问。他说,对于聋哑人来说,需要文字作为参考信息的情景很可能是一个比较嘈杂的地方,这对语音识别的算法提出了一定的要求。
当他体验到XRAI这一功能时,公司CMO特意把他接到一个安静环境的演示,并坦言在嘈杂环境中的效果还不是很好。
另外,价格方面,XRAI在线AR眼镜为Nreal,国内价格为2299元起,海外价格为379美元。
XRAI的服务也不是完全免费的。基本免费版只能保存一天的对话记录。另外,可以选择20美元/月、50美元/月两种套餐。
选择50美元/月的课程将为基础功能添加人工智能助手。
但是,西蒙表示,作为还处于初期阶段的产品,可以理解存在缺点。
更重要的是,从无障碍的角度来帮助聋哑人,这个想法还是令人欣慰的。
背后的公司XRAIGlass提供这项服务的公司来自英国,被称为“XRAI”Glass。
该公司的CEO是丹·斯卡夫(Dan Scarfe),在Cognizant Microsoft Business Group担任最高问题负责人。
CTO蒂姆·斯卡夫(Tim Scarfe)获得机械学习专业博士学位,也曾在微软中工作。
领英公司于今年7月刚刚成立。
合作的AR眼镜制造商“Nreal”成立于2017年,创始人“徐驰”在Magic Leap工作。
参考链接:[1]https://www.wired.com/story/XRAI-glass-caption-ar-glasses-first-look/[2]https://www.auganix.org/XRAI-glass-launches-its-real-time-augmented-reality-closed-captioning-app-to-users-globally/
文章评论