人工智能系统智商评测方法报告撰写人:刘锋计算机博士《互联网进化论》作者0
背景伴随着2016年AlphaGo战胜人类围棋冠军李世石,世界范围人工智能迅猛发展,人工智能威胁论也因此广泛传播,同时智能产品蓬勃发展,不断涌现
人工智能究竟能不能超越人类
这些智能产品的智能究竟达到什么水平
回答这些问题都需要用定量的方法测试智能系统的发展水平
从1950年图灵测试提出以来,科学家已经为人工智能发展的评价体系做了很多工作
1950年,图灵提出了著名的图灵实验,采用提问和人类裁判的方法,判断一台计算机是否具有同人相当的智力
作为最被广泛应用的人工智能测试方法,但图灵测试并不检验Ai的智能发展水平,只是判断智能系统能否与人类智能相同,而且受人为因素干扰太多,严重依赖于裁判者和被测试者的主观判断,因此往往有人在没有得到严格验证的情况下宣称其程序通过图灵测试,2015年3月24日“美国科学院院刊(PNAS)发表一篇论文,提出一种新的图灵测试方法“VisualTuringtest”,这种测试方法用来对计算机的图像认知能力进行更为深入的评估
2014年美国佐治亚技术学院的瑞德教授(MarkO
Riedl)认为,智能的本质在于创造力
他设计了一个叫做Lovelace2
0版本的测试
Lovelace2
0的测试范围包括:创作有虚拟故事的小说、诗歌创作、油画和音乐等
在解决人工智能定量测试的问题上,包括图灵测试在内的各种方案还存在两个问题:第一,这些测试方法没有形成统一的智能模型,并以此为基础进行分析,区分智能的多个分类
导致无法将不同的智能系统包括人类进行统一的测试;第二是这些测试方法无法定量分析人工智能,或者只定量分析智能的某个方面,但这个系统究竟达到人类智慧的百分之多少,发展速度与人类智慧发展速度比率如何,这些问题在上述研究中没有涉及
针对这些问题,科学院虚拟经济与数据科学研究中心刘锋、石勇研