AR眼镜语音转换文字实测!效果好像拉开了弹幕,对话记录可以回溯-保存量子比特,

AR眼镜的字幕功能效果怎么样。

实测来了!

不仅可以将语音实时转换成文字,还能分辨出说话人的主体,还可以保存文字记录,以后可以追溯。

今年,一家来自英国的AR初创企业,在脑中大开了一个洞。

他们把语音转换成文字的功能,转移到AR眼镜上,让旋转的文字很快出现在眼前。

主要目的是为聋哑人服务。

毕竟,即使有助听器的帮助,聋哑人往往需要文字作为参考信息。

AR眼镜方式使得生成字幕可以直接出现在人的眼前,使得接收信息更加方便快捷

具体效果怎么样。往下看

像拉开弹幕一样的感觉体验的效果,如下左图所示,有显示与说话人对应的声音内容的对话框。

据体验者西蒙·希利(Simon·Hill)说,刚戴上AR眼镜听对方说话时,那个文字的转印精度非常好。

效果类似于平时用语音实时旋转文字的功能,在语音结束之前文本内容会被调整,直到最后讲完才有最终版本。

但是,在对话的场合,两个人多说话的话,语音的改写速度会变慢。

XRAI内部人士表示,这是因为语音转换字符的计算是在云上进行的,通常会有延迟

而且不仅仅是实时转录,这个功能也对应着检索履历,AR眼镜端和手机端都能检索,感觉像聊天软件。

录音后的声音在文本改写完成后会立即被删除,XRAI强调这些文本也只能由用户自己看到。

如果没有AR眼镜,也可以在手机上体验XRAI的功能。

一位网友也戴着眼镜体验了一下,他说这个功能不仅旋转语音速度快,而且在AR界面上的显示也不错。

缺点需要选择识别的语言种类,这里她测试的是法语。

此外,西蒙大哥在体验中发现了一些小问题。

例如,在XRAI的设想中,聋哑人使用该功能需要AR眼镜+安卓手机。

是的,这个应用程序还不支持iOS系统。

两台设备搭配起来,拿起来很麻烦,尤其是AR眼镜的重量还没有下降的情况下,聋哑人必须戴上人工耳蜗,戴上AR眼镜,舒适度肯定不高。

西蒙表示

另外,关于基于声音的文字变换的效果,西蒙也提出了一些疑问。他说,对于聋哑人来说,需要文字作为参考信息的情景很可能是一个比较嘈杂的地方,这对语音识别的算法提出了一定的要求。

当他体验到XRAI这一功能时,公司CMO特意把他接到一个安静环境的演示,并坦言在嘈杂环境中的效果还不是很好。

另外,价格方面,XRAI在线AR眼镜为Nreal,国内价格为2299元起,海外价格为379美元。

XRAI的服务也不是完全免费的。基本免费版只能保存一天的对话记录。另外,可以选择20美元/月、50美元/月两种套餐。

选择50美元/月的课程将为基础功能添加人工智能助手。

但是,西蒙表示,作为还处于初期阶段的产品,可以理解存在缺点。

更重要的是,从无障碍的角度来帮助聋哑人,这个想法还是令人欣慰的。

背后的公司XRAIGlass提供这项服务的公司来自英国,被称为“XRAI”Glass。

该公司的CEO是丹·斯卡夫(Dan Scarfe),在Cognizant Microsoft Business Group担任最高问题负责人。

CTO蒂姆·斯卡夫(Tim Scarfe)获得机械学习专业博士学位,也曾在微软中工作。

领英公司于今年7月刚刚成立。

合作的AR眼镜制造商“Nreal”成立于2017年,创始人“徐驰”在Magic Leap工作。

参考链接:[1]https://www.wired.com/story/XRAI-glass-caption-ar-glasses-first-look/[2]https://www.auganix.org/XRAI-glass-launches-its-real-time-augmented-reality-closed-captioning-app-to-users-globally/

返回列表
上一篇:
下一篇:

文章评论