许多人对著名物理学家霍金曾使用的“发声”系统印象深刻。而日前一项语音脑机接口重大进展有望让病人“发声”系统更加先进:美国科学家团队成功解码了脑活动,研发出一种能够将脑活动转化为语音的解码器。 许多患有神经疾病的病人丧失了语言能力,需要依赖特定的通讯设备进行沟通,这类设备利用脑机接口或者头部/眼睛的非言语动作来控制光标去选择字母,从而“说”出他们想说的话。但是,这个过程要远远慢于正常的人类说话速度。 已故物理学家斯蒂芬·霍金就需要依靠类似的系统,工程师团队为避免他一个一个字母地拼写单词,曾采集大量霍金的文档,分析词频及上下文关联,以便在霍金输入时给出最合适的预测词。 而此次,美国加州大学旧金山分校科学家爱德华·张(音译)及其同事,利用与人类下颌、喉头、嘴唇和舌头动作相关的脑信号,开发出了一种人类语音合成系统。首先,他们在5名被试者大声说出几百个句子时,记录下他们的大脑皮层活动,然后据此设计了一种能够解码负责声道动作的脑信号的系统。之后,他们便能够根据解码出的动作合成语音。在包含101个句子的试验中,听者可以轻松地识别并记录下合成的语音。 在论文随附的新闻与观点文章中,美国埃默里大学和乔治亚理工学院科学家切丹·潘达利纳斯和亚海亚·阿里表示,研究团队完成了一项非常有力的概念验证,目前,要使该系统真正成为一个临床可行的语音脑机接口,尚面临着许多挑战。 总编辑圈点 说话,可以算是人类执行的最复杂的活动之一。依靠脑机接口设备,因疾病而失语的病人其实也可以“讲话”,不过以往的设备只能达到一个个“蹦单词”的程度。现在,新技术的辨识度和流畅度远非此前可比,几乎解决了这一系统所面临的重大挑战,但重构语音毕竟要逊于自然语音,必须通过收集更大的数据集并继续开发基础计算方法以改进。未来,其或能真正实现让病患们恢复“讲话”能力,进而与世界重新建立联系。(记者 张梦然) |