从梦想照进现实的人工智能

人类作为已知唯一的智慧生命,对其他智能形态的探索从未停止过,无论是地外文明还是硅基智能。我们对于人造智能的想象可以一直追溯到古希腊神话,但直到20世纪40年代人类对人造智能都只是停留在幻想阶段,机器智能的主要载体还是神话和科幻小说。

赫菲斯托斯和他的机器仆人

转折点

第二次世界大战成为了幻想与现实间的转折点。战争让各国对计算和通信能力的需求变得紧迫,计算科学、信息学一跃成为了主流的研究方向。由于二战远离美国本土,很多科学家背井离乡来到美国寻求庇护,加之军事援助等经济扩张手段,美国迅速获得了大量财富。当全球都还水生火热的时候,漂亮国是人和钱都齐了。

手里有了人和钱,加上军备比拼对计算和通信的需求,比如精确制导远程武器,信息科学和相关产业在美国的发展势如破竹。二战后仅一年,人类历史上第一台通用计算机ENIAC(Electronic Numerical Integrator And Computer)在美国诞生了。

ENIAC的诞生标志着通用可编程计算机终于走进了现实

两年后,诺伯特・维纳和克劳德・香农各自发表的开创性著作创立了“控制论”和“信息论”, 加上路德维希·冯·贝塔朗菲在1945年发表的对“系统论”的总结性著作,后世称之为“信息学三论”的三门支柱性理论得以确立。自此,信息科学的发展,无论是理论研究还是工程实践都开始变得系统和有序起来。

三论是人类现代文明历史进程中光辉的里程碑

绕不过的图灵

2014年上映了一部电影叫《模仿游戏》,讲述了图灵在二战时期与一帮小伙伴发明密码破译机Bombe,并成功破译了德国认为绝不可能被破译的密码方法Enigima,从而加速了盟军胜利的步伐的故事。(豆瓣评分8.8,top250, 推荐观影)

模仿游戏

为什么叫“模仿游戏”呢? 图灵在他的文章《计算机器和智能》(Computing Machinery and Intelligence)中提到,如果一台机器模仿人类与人交流,豪不知情的人无法辨别与之对话的是人类还是机器,这台机器就通过了模仿游戏这项测试。模仿游戏就是图灵测试(图灵测试是后人为纪念图灵而定的名字)。

通过图灵测试是否就说明这台机器是智能的,智能的标准是什么?图灵在被警察抓后有段台词:“机器当然无法像人类一样思考,机器与人类不同,有趣的是,如果某个东西与你的思考方式不同,那是否说明它不会思考?你瞧,我们允许人类之间的种种差异,你喜欢草莓,我讨厌滑冰,你看悲伤的电影会哭泣,我对花粉过敏,不同的口味,不同的选择,意义究竟在哪?如果我们并不会因为大脑运作方式不同而质疑思考方式的不同,我们如此对待另一个人的大脑,为什么我们不能对一个由铜线与钢铁铸成的大脑,抱有相同态度呢?”。 虽然是电影台词,但我相信这也是图灵本人对智能的理解。

图灵认为,要实现人造智能有两条途径:一是编写更复杂更庞大的程序。这个好理解,就是为程序不断添加新功能使其显得智能,比如可以分析数据、可以识别图像,这些都可以通过数据结构和算法来实现;第二种是模拟人的思维方式,这个就比较难了。图灵相信我们的大脑一定存在某种内在机制可以产生智能,只要找到它,就可以使机器主动学习,就像新生儿一样,逐渐发展出智能,然而这条路至今尚未走通。

图灵机——图灵永恒的遗产

聊人工智能绕不过图灵,聊图灵不能不提图灵机。早在1936年,图灵就在他的论文《论可计算数及其在判定性问题中的应用》(On Computable Numbers, with an Application to the Entscheidungsproblem)中就提到了今天被称之为图灵机的概念模型。

图灵机有多重要呢?这么讲吧,图灵机和冯・诺依曼架构就是我们现在所有计算机的“灵”与“肉”。

图灵机是一种计算机模型,由一个无限长的纸带(即图灵机的存储器)和一个能够读写纸带上的内容并根据一定规则改变自己内部状态的控制器(即图灵机的处理器)组成。不要小看这个模型,虽然简单,但却可以描述任何人类可以完成的逻辑推理和计算过程,也就是说,只要一个问题是可以判定的,计算过程可以被符合和算法所表示,图灵机就能完成计算。

图灵机 就是这么一台机器承载了人类所有的逻辑推理,图灵机像一把在无尽黑夜中燃起的薪火,照亮了人类探索人工智能的道路。

可以思考的机器

图灵在美国期间和信息论祖师爷香农一见如故,香农对图灵机的构想非常感兴趣,认为既然这么一台机器能承载我们人类引以为傲的逻辑推理和计算能力,那能不能再往前走一步,让机器具备“思考”的能力(这里的思考是指通过持续学习不断进化的能力)。说实话,在一个通用计算机已算是前沿科学的环境下,能有这样的构想是非常难得的, 由于缺乏基础条件,两位先驱的研究都还只是理论层面,最终也未能设计出一套实现方法,甚至都没能为机器智能下一个明确的定义。

但就是图灵和香农就智能机器的探讨,让可以思考的机器(人工智这个正式称呼还得等到1956年)这个概念从科幻走进了科学,正式开启了人类在科学领域对人工智能的探索。之后几十年人工智能的路走得是起起伏伏,人类从希望到失望又到希望,直到互联网的出现让海量数据这一条件成立,然后又是算力的成熟,直到今天才有我们看到的目前为止最为智能的人工智能模型GPT-4——一个基于海量文本数据(45TB)训练出来的大型语言模型,具有千亿级的参数,每一次训练都是几百万的经费在燃烧。

然而,即使惊艳如ChatGPT,也不是香农理想中的通用人工智能(或许更符合图灵的期望)。ChatGPT不是通用人工智能,但却是通往通用人工智的一个里程碑和一剂强心剂,它的出现让大量人才和资源再次涌入人工智能领域(不少人已经把All in Web3.0的签名改为了 All in AI)

人工智能在图灵与香农的交流中萌芽, 到达特茅斯会议中确立身份,经历了符号主义、连接主义和行为主义各大学派的纷争,再到机器学习以及后来深度学习形成的新一轮浪潮,一路走来有繁荣也有寒冬。今天,大型语言模型扛起了大旗,希望这次扬帆起航波澜不惊,不要像过去一样被捧杀,祝顺利吧,Bom Voyage!