我们在过去几年做了很多测试。我们有一个叫雅思口语评分的技术,当时雅思的官方专门为这个技术做了很严格的评测,他们请很多资深的考官,对500份考生的口语,做了专家的评分,然后再把我们人工智能的评分跟专家的评分进行比较,当然我们人工智能评分其实也是学他们专家的评分。最后的结果显示,我们机器的评分比人和人之间评分的一致性更好。当机器训练好了以后,它的误差和偏差就小,它就形成了稳定的一套标准,所以我们在具体评价的时候,比如说在分数一致性,分数相关性上,人机的相关性和一致性就比人人好,这说明了机器的在测评方面的一个优势。
Q:可不可以这样理解:人工智能它可能未必能够听明白对话的人的语言当中幽默的元素,或者说他深刻的内涵,但是他站在另一个维度,从数据的角度去看,他却能够输出一个和人类打分者非常接近的客观的分数?
L:没错。对,这个就是看具体的一些应用场景,刚才提到的更多的是学习把输入变成输出,输入一篇文章输出一个分数,输入一篇口语作文输出一个分数,但其实也还有很多其他的应用场景给个分数是不够的,用户还希望知道怎么改进,为什么得这个分,就需要这种可解释的人工智能技术,也是现在大家正在研究的。如果这个可解释的人工智能技术能把黑盒子打开,这不仅在教育领域有重大进展,在别的领域,比如医疗领域也非常重要。我们上线的地道发音课就搭载了这样的技术,不仅给出评分,还给出具体改进建议,推荐相应的练习。
我们说AI的另一种说法不是" artificial Intelligence" 而是" augmented Intelligence", "augmented"就是扩展的意思,把人的智能做一个扩展。比如用机器做大量的数据的分析,先做一些抽象的事情,在这个基础上可能还需要人类专家来做一些判断。就像在老师阅卷的过程中,机器可能已经做了一些很基础特征和信息的抽取,来帮助老师做一个最后的判断,这些就是人工智能能够拓展人类智能去发挥作用的地方。
Q:用人工智能这样一个较为死板或偏理性的东西来评判人类有创造力的作品,比如给一篇艺术作品打分,给一篇文学打分,是否能够实现?
L:我觉得人工智能擅长的还是计算。有些非常主观和感性的部分,除非我们人也能够去定出一些标准来,机器才能根据人定的标准也做相应的一些评判,这个是有可能的。
在测评领域偏主观偏创造性的一些东西,如果有相应的标准的量化,而且能够去搜集到专业的数据,那么人工智能有可能做到一些替代或者辅助。
从另一个角度看人工智能的创造性,在过去的两年里,我们可以看到人工智能可以写一本书,可以创造一首曲子,能画一幅画,这种生成式的技术还是有了发展。
流利说也在进行很多前沿的研究,我们在去年挂牌了上海市第一批企业承担的重点实验室,是上海市的人工智能和学习认知重点实验室,我们做了很多人工智能和脑科学认知神经学之间的一些交叉的研究,比如研究人脑学习和认知的规律,从而研究人工智能怎么样更好地进化,进而怎么样更好的来帮助人类更高效的学习。我觉得技术的潜力有挺大的想象空间的,可能再过一段时间,会出现更有创造性的东西。人工智能已经并还将继续改变我们生活的方方面面,对于未来发展还是很值得期待的。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
文章来源:《探索科学》 网址: http://www.tskxzzs.cn/zonghexinwen/2020/0805/529.html