央广网北京3月31日消息(总台中国之声记者谭瑱)据中央广播电视总台中国之声《新闻纵横》报道,你的普通话考级了吗?如果你正打算考级,可能要跟机器人一起“备考”了。过去,人工智能“一开口”,满是生硬的“AI味”“塑料感”,念错字、断句奇怪、腔调不自然,备受诟病。近日,教育部、国家语言文字工作委员会发布两项语言文字新规范。根据规范,机器合成普通话被分为6个测评等级,还拥有了专属的语料库“词典”!两套专门为人工智能量身打造的普通话新规范,能否真正解决智能语音长期存在的发音难题,让机器说话更标准自然?

在政务服务大厅、银行柜台、商场、商超乃至校园里,智能机器人早已成为随处可见的服务帮手,为大家提供了不少便利。可它们的普通话水平,却常常让人哭笑不得。

有网友把自己在政务服务大厅和智能机器人的一段趣味对话分享到网上,视频里的机器人小易在自我介绍时,把“智能机器人”念成了“自燃机器人”,让大家忍不住打趣;念诵古诗时,它还将“杨花落尽子规啼”的“啼”读成“dì”,时不时就出一些咬字发音的小差错。

在教育场景中,教辅机器人的读音问题更让家长们忧心忡忡,生怕错误的发音误导孩子的语言学习。事实上,这类发音不准、断句混乱、语气生硬的问题,在人工智能语音交互中非常常见,人工智能说话自带的“塑料感”也备受用户诟病。

上海人工智能研究院通用机器人产业创新中心标准总监陈曦说,现有人工智能语音学习的语料来源本身有诸多不规范之处,这让人工智能的“普通话学习”从源头就出了问题。

陈曦说:“现有人工智能生成语音时,学习的(对象)是一些常见的影视作品,它们的普通话发音本身就不一定标准。人工智能学习的数据本身是不规范的,生成的内容也是不规范的。”

实际上,人工智能的读音还会不自觉贴合大众的普遍误读习惯,而非严格遵循词典规范。

华南理工大学计算机科学与工程学院副教授赖晓铮解释说:“举一个例子,‘角色’的‘角’应该读‘jué’,但现在很多人都读‘jiǎo’,智能模型也用‘jiǎo’,可能代表了大众的平均水平,但不符合词典上的规定。语料上是怎么样的,人工智能就反映出怎么样的。”

为了规范人工智能的语言文字应用,教育部、国家语言文字工作委员会近期发布了《机器合成普通话水平测评等级标准及测评大纲》和《人工智能语料库基础术语》两项语言文字规范,前者给机器合成普通话划定6级等级标准,测评机器合成普通话单音节字词、双音节词语、句子、句段、篇章等5项内容;后者则为人工智能语料库建设划定了基础术语,适用于语料库的建设、管理等全流程。

陈曦表示,语料是人工智能学习的核心素材,能为智能模型的训练提供基础数据支撑,此次新规聚焦语音语料的规范化标注,填补了行业的空白。

陈曦说:“语料包含图像、视频、声音、声纹,甚至是触觉等广泛的物理数据,此前更多对图像语料和文字进行标注,但对训练人工智能理解的声音语料没有规范化的标注标准,在声母、韵母、语流音变以及声调等方面都没有规范化。所以现在人工智能生成的语音会带有一种很明显的‘AI味’,而这份标准就非常有必要,可以提供很权威的参考。”

据了解,两项规范的发布,是推动中文数字化和数据中文化的重要举措,标志着我国语言文字标准体系建设向数字化、智能化方向迈出坚实步伐。

陈曦表示,此次发布的两项新规,直指当下人工智能语音交互和语料库建设的痛点,语料库基础术语为人工智能搭建了学习普通话的“专属词典”,测评大纲则相当于一套规范的“考题”,前者管输入,后者管输出,让人工智能的普通话学习有了明确的标准和考核依据。

陈曦说:“人工智能需要人告诉它,什么数据是规范的,它自己没有办法判别,所以需要一个好老师。经过人工筛选的、最纯正的普通话样本,剔除了一些口音差异,只保留了最标准、最清晰、最规范的普通话语音数据,这是人工智能学习普通话的最权威的教科书,更保证了学习结果。另外,《机器合成普通话水平测评等级标准及测评大纲》相当于考题,对人工智能生成的语音质量进行打分,可以有效帮助人工智能生成语音数据,减少‘塑料感’。”

编辑:付可
原创版权禁止商业转载 授权>>
转载申请事宜以及报告非法侵权行为,请联系我们:010-56807194