在围棋人机大战第三场比赛中,谷歌开发的人工智能AlphaGo战胜韩国棋手李世石,总比分3:0领先,这也意味着“阿尔法狗”实际上已经获得胜利。既然已经在围棋这一人工智能领域的最大挑战上击败了人类最优秀的棋手之一,那么令许多公众感到恐慌的一个问题随之而来——哪些职业未来会被人工智能所取代呢?
“阿尔法狗”是一些网友对谷歌AlphaGo人工智能的昵称。昨日,“阿尔法狗”凭借着卓越的算法能力,在举世瞩目的“人机大战”中连续第3局战胜了围棋世界冠军、围棋九段(职业级别最高段)选手李世石。“机器战胜人”,引发了大众对人工智能威胁人类的担忧。那么“阿尔法狗”到底是谁?它的围棋技术是如何学习的?人工智能又离我们到底有多远呢?
解读
“阿尔法狗”是什么鬼?
“阿尔法狗”其实是一款围棋人工智能程序,由位于英国伦敦的谷歌旗下DeepMind公司开发。它也是第一款能击败专业围棋选手的计算机软件。
据DeepMind的团队介绍,选择围棋,恰恰是因为围棋的复杂。围棋的“分支因子”无穷无尽,走法比全宇宙的原子数量还要多。传统的计算机程序在下棋时,会使用“暴力计算”的做法,为所有可能的步数建立搜索树,也就是根据数学和逻辑推理的方法,把每一种可能的路径都走一遍,从中选出最优的走法。
但是围棋棋盘有361个点,走法变化繁多,普林斯顿的研究人员算出了19×19格围棋的精确合法棋局数的所有可能性是一个171位数——比宇宙中的原子数还多。这样的计算结果,哪怕是巨型计算机也要算上许多年。而且由于围棋的每颗棋子都相同,没有大小的区分,这使得围棋的下法中增加了很多“随机”的成分,无法用逻辑推理来预测。所以围棋一直被认为是人工智能领域的最大挑战。
在阿尔法狗出现之前,电脑的围棋能力还停留在业余水平。专家预言,想击败世界上的精英选手,电脑技术至少还要再发展十年。但是“阿尔法狗”做到了。
简单来说,“阿尔法狗”系统之所以可以玩转围棋,是因为它具有两个大脑,一个叫做“策略网络”,负责选择下一步走法;另一个“价值网络”,负责预测比赛胜利者,每走一步估算一次获胜方,而不是一直搜索到比赛结束,从而减少了运算量。两个大脑配合工作,于是将围棋巨大无比的搜索空间压缩到可以控制的范围之内。
揭秘
“阿尔法狗”的围棋是怎么学的?
战胜人类的第一步是模仿人类。“阿尔法狗”首先用围棋专业棋手的3000万步实例对“价值网络”进行训练。而假如一个人要学习3000万步,每步1分钟,需要60多年。通过这种经验学习,阿尔法狗对人类走法的预测准确率就能达到57%了。
模仿之后,第二步便是超越人类。“阿尔法狗”最特别的一点就是,它可以“深度学习”。DeepMind公司CEO哈萨比斯说:“AlphaGo的棋风跟人类很像,因为它会像人一样去学,而且在下棋的过程中变得越来越强大,你我都是这么学的。”
传统意义下,计算机做出的所有反应都依赖于人类事先写入的、具体的程序。因此,如果把所有非典型的例子都一一穷尽,转化为代码告诉计算机,是一项非常庞杂的工作。
但是“阿尔法狗”不会如此“按部就班”,它可以像人脑一样自己来学习,不断提升棋艺,靠的就是“深度机器学习网络”。简单来说,阿尔法狗可以自己与自己对弈,目前它自我对弈已经超过3000万局,在这个过程中,“阿尔法狗”不断积累胜负经验,举一反三,形成对围棋的一种“全局观”。如此,“阿尔法狗”在接下来的比赛中就不会完全依赖于“经验”,而是依靠自己的评价网络,带有创新性地选择最有利于自己的走法。
“阿尔法狗”与人类对战已经不是第一次了,去年10月,它就曾以5:0的成绩完胜欧洲围棋冠军、职业二段选手樊麾。在那之后,有专家就曾预测,“计算机程序击败围棋世界冠军是迟早的事,这是因为,计算机的运算速度比人脑快得多,能凭借‘大数据+深度学习’在短期分析完一个人一生也无法穷尽的棋谱,棋力提升的速度和幅度都很惊人。”
分析
人工智能距离我们有多远?
在“阿尔法狗”战胜李世石后,许多人惊讶于人工智能的高水平,并且立志学习围棋,以便有一天能离人工智能更近一步。事实上,人工智能距离我们并不远,并且会越来越近。
如果你有一部iPhone,就可以通过SIRI语音助手直接让它为你接打电话、读取短信、介绍餐厅、报告天气等,用户可以和SIRI对话,如果SIRI没理解,还会反问,“您是要导航去公司,还是回家?”这里的SIRI就是一套人工智能语音系统。
人工智能,就是能以人类智能相似的方式作出反应的智能机器。家里的扫地机器人可以自动发现污物并帮助打扫,这就是人工智能的功劳。
前不久腾讯开发的一款写稿机器人Dreamwriter,可以根据算法在第一时间自动生成稿件,瞬时输出分析和研判,一分钟内将重要资讯和解读送达用户。上个月,搜狐推出了智能股市播报系统,由机器人自动跟踪、捕捉市场的动态,进行纯粹客观描述,以信息流的方式推送给用户。上述两项人工智能引发了对机器与人工之间如何平衡的讨论,有专家表示,“机器重在扫描挖掘发现信号和机会,而人工重在深度分析和评论,只有找到其中的平衡点,才能满足用户对资讯有效性的实际需求,带来创造性的阅读体验。”
此外,支付宝推出的“芝麻信用评分”也是基于人工智能机器评出的,人工智能结合用户信用历史、行为偏好、履约能力、身份特质、人脉关系五个维度客观呈现个人信用状况的综合评分。分数达到一定标准,可以享受各种信用借贷、免押服务、实名社交服务。
这些生活中的场景都是基于人工智能完成的,而科学家们也在致力于用人工智能解决更多生活中的问题,哈萨比斯说:“尽管游戏是开发和测试人工智能快捷高效的完美平台,但我们最终还是想用这些技术来解决现实世界中的重要问题。我们的方法具有普遍性,所以我们希望有一天能够对它们进行扩展,帮助我们解决人类社会中最棘手也是最紧迫的问题,这些问题从气候建模到疑难杂症分析,不一而足。”