[返回哲学世界首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[坛主管理]

人工智能还给人类的思维难题(中)

送交者: wangguotong[★★★声望勋衔13★★★] 于 2024-10-16 2:36 已读 3200 次 1赞  

wangguotong的个人频道

+关注

赵汀阳:人工智能还给人类的思维难题(中)


(四)未来就是赌注


抽象思维的崇高地位来自逻辑和数学的成功,以及声名有点可疑的哲学,但实际上,人类的生存和生活更多使用的是经验思维。经验知识的主要生成方式是处理数据的概率论。就目前而言,人工智能处理大数据也是借助经验主义的概率论,还没有学会通用的抽象思维。


概率论的实质是信息压缩(compress),把充满“噪音”的杂乱数据压缩为可理解又有足够解释力的模型。以概率去压缩数据,其“保真性”是件有争议的事情。假如数据是个有限且可枚举的封闭集合,概率就等价于信息无损的完全归纳了,可惜大多数情况并非如此,而是不确定、不稳定、非封闭的无穷变化状态。只能退而求其次,在损失无关紧要信息的基础上去建立足够有效的解释模型,总之是把不能直接理解的经验数据压缩为可理解的模型。康德想象的对知识对象的建构大概就相当于建模——这个说法没有征求康德的意见。如果有什么区别的话,康德的猜想是心理学式的,但至今无从知道先验想象力或先验统觉如何运作,而人工智能的建模却有实在可操作的经验主义方法论。


必须来讨论挥之不去的关键问题,即“未来”。人类需要处理的绝大多数事情都是“未来”(偶尔怀旧),可是未来是人类力所难及的根本问题。哲学干脆去想象一些使未来黯然失色的最大极限概念,比如“永恒”“终极”“绝对存在”之类,但那些极限概念并不是思想的对象,而是信仰的对象,因为无从思考。那些极限概念的所指超越了时空,是无限性本身,人类没有能力去遍历无穷多的所有可能世界,所以不可能认识无限性本身。德尔图良所谓“唯不可思议(absurdum,也译作‘荒谬’)可信之”的深意在此,无限性超出了思维能力,所以不可思议或荒谬,只能是信仰的对象。形而上学把一系列极限概念(无限性=永恒=完满=超越=绝对存在)看成思想对象,那是知识论谬误(康德已给出证明)。人类能够思考的最大概念是时间,而时间的意义在于后继性,也就是未来,如果没有未来,现实连同历史都失去意义,所以如果不考虑未来,就没有必须反思的事情了。要求“活在当下”的“当下主义”(presentism,弗朗索瓦·阿赫托戈(Francois Hartog)提出的概念)是一个存在论谬误。当下时刻是个趋于无穷小的点,没有足够形成意义的尺度,“活在当下”只能意味着意义瞬间消散。每个当下的意义都在于未来,即下一步,以及下一步的下一步。重复一遍:未来是时间的意义。


未来问题的实质在于求解“不可能预定的最可能未来”。不难看出,这是风险性的“赌注”。生活就是冒险,即必须在不确定的复数可能性(理论上是无穷多可能性)之中作出选择。成王败寇、兴衰荣辱、运筹帷幄、功败垂成、天赐良机、时来运转之类,都在讲述风险赌注的故事。风险选择都是“赌博性”,但我们不关心赌场里的投机游戏。风险赌注是个严肃的存在论概念,其极端形式就事关“存在还是不存在”(to be or not to be,在知识论上也称为或然决策。只有全知才能作出确保为真或确保最优的必然选择,人没有此种能力,因此,即使在高概率的知识加持下,选择一种未来也仍然是“赌博性的”或然决策,按照贝叶斯的说法,只是在研究“机会”。如果嫌弃“机会”概念有点唯利是图的味道,也可换成装腔作势的“命运”概念。休谟问题的要点是“未来”,选择未来就是冒险,人们一直奢望能够发现必然赢的下注方式。


休谟问题可以有多种角度的理解和表述,但根本意义相同,比如可以表述为:根据所有以往经验不可能必然推出未来;或另一种表述:在有限的所有经验里不可能确认必然的因果关系。被“惊醒”的康德试图以先验论去拯救对于知识不可或缺的因果概念,但如前分析,即使先验论证可以证明因果概念是不可或缺的先验范畴,也不可能保证产生必然的因果知识。几乎没有任何一个先验范畴能够被证明对于所有可能世界为真,因此,即使先验论为真,也不足以建立普遍必然的经验知识,简单地说,先验论也对付不了无穷性。与康德试图以先验论去解决休谟问题不同,贝叶斯给出了一个经验论的解决方案,尽管只是近似解决。经验论只求赢面较大的赌博,贝叶斯概率就是相对最优的解决,但对未来的正确选择不是能够一次性完成的,而是在不断选择未来的过程中慢慢涌现出来。


在发现贝叶斯概率之前,人类仅凭直观而不知不觉地采用贝叶斯方法论去生产经验知识,大模型人工智能也采用贝叶斯方法论,这暗示了,至今还没有发现比贝叶斯概率论更好的方法去选择一个相对可信的未来。值得一提的是,除了需要科学分析和数学运算的事情,人类在日常生活里几乎每天使用的只是能够节约大量思考时间的“模糊版”贝叶斯方法,差不多接近于直观推测,几乎不算是运算,至多有点大略心算,因此错误率比较高,以至于长期以来忽视了贝叶斯方法的巨大能量。人工智能的神经网络运算功能强大,不怕数不胜数的数据,能够把贝叶斯经验主义方法的能力发挥到极致。


ChatGPT运行测试版时,我做了一个猜测:估计贝叶斯方法论是其核心技术。后来看到业界的许多类似分析,说明大概是猜对了。我没有人工智能的专业知识,而是根据日常直观的反推理,类似侦探的反推理:首先已知ChatGPT仍然属于图灵机,那么尚未具备自我反思能力;并且,ChatGPT能够经常输出有效语句,那么,要处理“无穷多的”标识,在图灵机能够运作的方法中,最有助于选中合理后继标识的方法论是贝叶斯方法,那么,它最有可能使用了贝叶斯方法。这个“侦探式”推论,类似于皮尔士的“溯因推理”(abduction),即从事实反推可能原因的方法。皮尔士推理与贝叶斯推理的运行方向相反,但其中道理相通,甚至是互补的,类似几何的补角,或约等于逆运算,我愿意相信,两者能够互推。


贝叶斯方法只是经验论方法的基本精神,现代数学家们发展了具有贝叶斯精神的更复杂更先进的方法和算法,最终形成了大模型人工智能算法,其基本原理是“后继标识预测”(next token prediction)的算法。自从贝叶斯以来,皮尔士、所罗门诺夫、柯尔莫哥洛夫以及当代许多数学家和科学家(名单太长),也包括经济学家海耶克和哲学家波普尔等,似乎不约而同地反思了同一个问题,并从不同角度所见略同地发现了经验论中最基本也最有效的思维方法:把经验知识理解为一个无穷开放的演化过程,即不断以新经验去修正旧知识的无穷迭代过程,按照贝叶斯的概念来说,就是不断以“后验概率”去修正“先验概率”的无穷过程。这种经验论方法的巧妙之处在于,既然人类没有遍历无穷多可能世界的全知能力,也没有对无穷经验普遍必然有效的先验知识,那么,以一种无穷性(认知的无穷迭代过程)去应对另一种无穷性(世界的无穷可能性)就是最优方法。尽管两种无穷性的规模并不完全对等,世界的无穷性永远大于认知的无穷性,但在康托集合论的意义上,认知过程的“无穷之势”将映射地无穷地逼近世界的无穷性。


这里要澄清一个误导性的翻译。把贝叶斯方法里的prior probability译为“先验概率”是不准确的,其实完全不是先验论意义上的a priori,只是预先的主观判断,应译为“预设概率”或“先估概率”。与之对应的“后验概率”(posterior probability)则是正确译法。贝叶斯方法的意思是,即使在完全无知的情况下,人也可以对不确定的未来给出一个预先估计,即预设概率。当然,预设概率多半不准确(碰巧猜对的情况少之又少),然后再根据新经验去修正判断,是一个不断以“后验概率”去修正“预设概率”的无限过程,于是有贝叶斯方法的基本公式或最简练版本:P(A|B)=P(B|A)*P(A)/P(B)。其中要点是,新获得的后验概率同时就变成了预估下一步的预设概率,可见预设概率不是“先验的”。


贝叶斯方法论或蕴含如此的哲学理解:(1)经验知识的有效性在于此种知识对于未来的有效性,因此,经验知识的核心问题是未来,即试图知道那不可能确知的未来。其实,不仅知识而且任何作品的意义,甚至是任何存在的意义,都在于未来。(2)未来是无限开放的概念,意味着无穷多可能性。未来性是时间的本质,而时间只是现象(作为现象的时间由具体运动来定义),未来才是真正的形而上学概念。未来无法定义也无法直接测量,由不确定而全然无知的无穷可能性所构成,在这个意义上,未来是真正超越的,是知识的绝对界限,所以不存在一种能够确保普遍必然性的先验知识,同时,未来也是经验知识不可消除的永远问题。(3)建构经验知识是无限连续的过程,意味着关于世界的真理不可能有一个定论。除非给定一个可量化的预定目标,定义了某种经验真理的完成度和满意度,否则经验真理永不止步。与经验真理相关,一般认为波普尔的“可证伪性”优于“可证实性”的传统概念。这或许是个误解,可证实性是相对于特定可完成的有限目标,而可证伪性相对于无限过程,两者不矛盾。其实,可证伪性的概念也不太准确。既然经验知识永远不可能被完全证实,同理,也不可能被完全证伪,经验知识的准确性或“似真度”只是永远不充分而已。可证实性或可证伪性此类“定性概念”都属于古典哲学遗风。以经验知识的性质而言,恐怕只能说经验知识具有不同程度的有效性。“有效性”是一个在概率上可衡量的概念。(4)经验知识的无限修正过程表现为相关可能性的无限收敛过程,即由无穷多可能性不断收敛为逼近必然性的不可完成过程,类似于圆周率不可能算完。其中,可能性的收敛度与经验知识的有效性成正比。


经验知识看起来平平无奇,不如先验知识那么完美,但正是经验知识构成了人类生活和思维的基本运作,决定了人类如何选择未来。人类替人工智能选择了贝叶斯—所罗门诺夫方法,显然,人类把自己掌握的最好的经验论方法赋予了人工智能。此种方法并非在绝对意义上是最好的(绝对最好的方法应该是人们幻想的上帝全知方法,即不费任何时间就能够遍历无穷多可能世界的方法,但这完全是幻想),只是说,没有更好的,就算是“最好的”。假如外星人看见人类或人工智能使用如此笨拙的方法,或许笑掉大牙。必须承认,就工作方式而言,经验论的方法是很笨的。大多数人在日常生活中使用的经验论方法只是与贝叶斯方法粗略相似的思维,是“下一步预测”的模糊版,似乎比人工智能还要笨,然而很有效,而且不需要大数据,也不需要精确分析,就是说,与人工智能相比,人类经验论思维的“成本”要低很多,而效率却不低。这个人脑奇迹提示,人类思维还隐藏着不少有待破解的秘密。就已知能力而言,人的思维在关键时候还使用了先验论方法,即通用的逻辑和数学,这是人类思维如虎添翼的其中一个原因,也是人工智能暂时还不会的技能。


(五)回到先验论问题


为什么不让人工智能学会通用的逻辑和数学?科学家们当然想,但事情有点复杂,目前似乎有技术上的限制。已有的人工智能只能运行物理方式上可实现的程序,因此不可能突破图灵机的概念。人脑是生物系统,物理与生物的差异很可能就是答案。或许将来的人工智能会在物理性能上取得巨大突破,以至于获得与生物系统等价或更强的能力,或发生更惊人的突破,比如创造出物理和生物一体化的人工智能,皆未可知。但在图灵机概念下,受制于物理上可运行的程序,处理大数据的最优思维方法就只能限于经验论方法。


人工智能不识字,只是使用贝叶斯方法去猜测下一个标识,但其强大的运算能力以勤补拙,甚至以勤胜巧,居然以“文盲”的方式找到了语词间大部分的正确相关性,在客观效果上等于说出了正确的语言和文本,甚至“算对”部分数学题(取决于数学的标识和关联性是否有足够的确定性和限制性),那么,随着人工智能运算能力的增强以及大数据的“无限”增量发生,人工智能是否终将能够以单纯的经验论方法产生出等价于人类基于经验论方法+先验论方法的知识?以俗话来说,“一招鲜”是否真的能够“吃遍天”?如果答案是肯定的,那么人工智能在图灵机的概念里也有希望成长为不输于人类的超级人工智能;如果答案是否定的,人工智能就必须突破图灵机的概念。上述问题也可以转换为哲学问题:经验论思维的“算力”是否能够进化到几乎等价于抽象思维的普遍化能力?明白地说,经验论的极限能力是否趋近先验论的能力?是否存在此种思维奇点?


如果以贝叶斯方法来定义经验论的能力,那么,知识的增长与经验的增长是同步的。这种经验知识的增长方式因其单纯而很笨,“吃一堑长一智”意味着“吃一堑只长一智”,并不能产生“举一反三”的知识推广增长。但需要注意的是,严格对齐经验的经验论不是归纳主义,而是永无定论、步步演进的贝叶斯概率论。归纳主义是对经验论的误解。罗素发明了一个具有休谟精神的讥讽性的“归纳主义火鸡”寓言,即火鸡根据“自古以来”每天都有人来喂食的经验,得出一个归纳主义结论:将来的每一天也有人来喂食,但事与愿违,它很快就被杀掉做成食物了。这个故事说明,除非面对的是一个封闭的可枚举的有限集合,并且遍历了所有可能情况而形成完全归纳,否则不可能通过归纳而获得普遍必然的结论。举一反三的推广法并不是经验论方法,反而是基于“世界齐一性”的先验论假设的递归算法。假定真有某个原理在无穷可能性里递归有效,这个原理肯定不是从经验推导出来的,而是“先验的”。


根据先验知识的伟大成就,尤其是逻辑和数学,无论如何也不可能反对先验论。但我们总是不得不回到先验论本身承载的一个顽固疑点:即使先验原理在先验系统内是普遍必然的,也不能保证其经验应用是普遍必然的。明白地说,“先天为真”(a priori)不能保证“先验为真”(transcendental),因为原理管不住实践。这大概等价于前面讨论到的康德难题,康德为了保证先验原理在经验里的普遍有效应用而假设了无法证明的先验想象力、先验统觉、先验亲和力和先验图式——奥卡姆肯定不会同意增加这些无法证明又解释不清的项目。先验想象力和先验统觉过于神秘而费解,但先验亲和力和先验图式在今天却有望在经验论里得到解释(这不符合康德的想象)。如果删掉定语“先验”,亲和力在效果上就有些接近于人工智能在数据中发现的关联性(例如ChatGPT预测的后继标识关联性);图式则或略接近于人工智能试图建构的“世界模型”(例如Sora的拟真情景建构),不过人工智能的世界模型尚未成熟。这似乎说明,康德设想的那些先验心理学概念其实应该由经验论来解释,康德可能挑错了那些概念的发生地,错误地命名为“先验的”。


1819世纪哲学家们推想的先验系统在当时很有说服力,是因为与亚里士多德逻辑学、欧几里得几何学、古典数学和牛顿物理学高度互证,但与后来的包括非欧几何、康托集合论、概率论、哥德尔定理、相对论、量子力学、生物学以及更新的复杂科学在内的当代科学却不吻合。既然先验系统的设想有可能出错,那么就意味着,对先验系统的设想方式是经验的。无论如何,先验论的思路有着重大价值,似乎有两种或可提高先验论“安全度”的改造路径。


一种办法是把先验系统约束为“贫乏的先验系统”,即以奥卡姆态度把思维所需的先验原则减少到不可减省的数量,剩下“久经考验”的先验原则就应该是安全而普遍有效的。例如康德的先验范畴里有不少可疑的范畴,与其说是思维的普遍范畴,不如说是欧洲语言的特殊语法现象(我曾有过分析,在此不复述);又如乔姆斯基的先验语法,恐怕不是人类语言的普遍结构,比如中文语法就未必能够还原为乔姆斯基语法。发现疑点不难,难的是认定到底哪些先验原则是不可减省的。通常相信,最保守地说,逻辑的基本概念和基本规律必定是先验的,甚至满足莱布尼兹的最高标准,即对于“所有可能世界”为真。但看来是一厢情愿了,首先排中律最为可疑,不能无条件使用,必须有限制条件才能使用(只有在矛盾律生效的范围内,排中律才是有效的);矛盾律的有效性又仅限于命题关系或真值关系,在其他事物上就非常可疑,比如人类至今还不能确定什么是好什么是坏,更不能确定好坏是矛盾的。可见排中律和矛盾律都不能用于解释真实世界,也不能用于价值问题,只能解释思维本身的形式关系;甚至最坚固的同一律在某些可能时空(比如五维时空)中也变得含糊。同一律的有效性基于个体、实体、本质等一系列形而上学假设,可是这些假设只属于思维而不属于经验世界或量子世界。显然,很难确保哪些先验概念或原则在任何意义上或对于所有可能世界为真。在任何意义上无条件为真的先验原则是属于上帝的神学假设,所以,即使以“贫乏”为代价去简化先验系统,恐怕也难以捍卫通用先验论。


另一种现实主义的可能路径是给先验论增加存在论的限制条件,或者说某种特定的“存在论承诺”,使通用先验论收缩为特定的“收敛的先验论”。包括我自己在内,很多人都不愿意放弃通用先验论,我们太喜欢能够给出普遍必然答案的先验论了,但在事实面前,通用先验论不得不让步。所谓“收敛的先验论”就是承认经验论是先验论的应用生效条件,或者说,经验论是先验论的存在论约束条件。收敛到什么程度?比较可靠的尺度应该是“某个可能世界”,相当于莱布尼兹真理标准的第二级别,即至少对于某个可能世界必然为真。即使把先验真理限制在某个可能世界,仍然不算谦虚,如果那个可能世界是足够丰富的,那么它包含的可能性也无穷多,未来仍然无限分叉,比如人类生活,因此仍然难以确认对于某个可能世界哪些原则是先验而普遍必然的。


人类对思维自身的反思远远没有探底,很可能还有未被发现的秘密。自反性的反思有着自相关或自我纠缠的难处,而人工智能可以成为侦探人类思维潜力的一个“镜像式的”实验场地。当然,人类也没有别的可用镜像。


三、动词逻辑对人工智能有用吗


(一)如果选取的思想对象不是名词而是动词


先验论和经验论两种能力是如何协同合作的,即先验与经验的配对,尚不很清楚。要克服这个康德难题就需要深入一个未被充分反思的思维死角。未被反思甚至不乐意去反思的思维死角一般都是支撑“所有观念”的形而上学预设。只有决心对形而上学预设进行死无所恋的反思,才会发现那些看起来很美的形而上学预设并没有那么理所当然。这里我只反思其中一个形而上学预设:名词主导的思维,或以名词为本的思维,简称名词思维。思想的对象是名词,甚至反过来,名词都是思想的对象,这是一个从未加以论证但普遍默认的假设,很可能与语言的语法有关。名词作为主语来引导句子,最终又落在宾语上(还是名词),于是名词就似乎在主导思想。但实际上,严格地说,名词都是虚构,不仅主观地定义了(定义即虚构)各种独立存在、内在有着不可替换也不可改变的“本质”的事物,进而以名词的分类学和语法关系去描述世界。天地不言,无法自辩,万物自己从来没有把万变的事态限定为不变的事物,真实存在只有连续变化的运作和过程,不会停下来成为固定的名词。基于名词关系的名词思维建立了以为是“先验”的万物秩序,其实与真实的存在状态有着很大差距。从相对论、量子力学到复杂科学都证明了名词思维与动态存在之间的差异,也是先验与经验之间的鸿沟。名词思维是成本最低而效率最高的思维方式,以建构的方式迅速地把万物归类定性,固定在整整齐齐分门别类的结构里,就像图书馆,可问题是,世界并不像图书馆。名词思维的建构能力是优势,但其建模是失真的。


名词思维估计是自然语言自动生成的。既然名词是语法上的第一主角(主语),并且在语法上也占据了对象的位置(宾语),也就自动成为“法定的”思想对象。我们对语言事实无可抱怨,就像对宇宙无可抱怨一样。自然语言在历史中形成,有着迭代经验负荷,我们没有必要也不可能去改变一种自然语言。可是思想还需要更大的自由余地,还需要更准确的表达,还需要表达万变的动态,或者说,思想需要与存在同步,而不是与语法同步。为了与存在同步,人类在自然语法之外另外发展了不同用途的语言,包括诗、逻辑和数学(比喻性的“语言”不算在内,如“绘画语言”“舞蹈语言”“音乐语言”,这些在实质上不是语言)。


诗可以容纳乔姆斯基反对的不合语法的、自相矛盾的、荒谬的表述,比如“无色的绿色意象”或“暴怒而安静的念头”“奇大无比的小蚂蚁”“令人恶心而迷人的眼睛”这样貌似荒谬的词句在诗里出现是平常的,荒谬的表述在诗中有时或比正常语法更接近存在——真实生活往往混乱无序或自相矛盾,既有趣又无聊,既欢乐又痛苦,自相矛盾的诗句与自相矛盾的经验反倒是一致的。


思想和知识却必须逻辑一致。如果思想和知识是混乱的,人类可能现在还在什么地方苦苦挖根茎吃。数学语言是逻辑的典范,定义了一个由理想事物及其完美关系构成的世界,几乎是上帝标准的世界。但数学不是真实世界的反映,而是用来衡量真实世界的绝对标准尺子。数学表达的是,假如存在及其关系是理想化的,那么必然如此这般。数学几乎就是真理的化身,是真理的最后保证,因此,不难理解20世纪初期的数学危机何以引起严重的智力恐慌。康托集合论、逻辑悖论、哥德尔定理还有量子力学一起釜底抽薪地打击了真理的绝对性,从而迫使人类对思想进行了深刻反思。这篇文章里我略过了这个极其重要的反思运动,是因为数学自愈了,数学很快就调整自身而超越了危机,似乎还没有严重的后遗症,简单地说,数学放弃了要求过高的普遍公理化运动,收敛为只在某些有限系统里实现公理化,而对于无穷开放的系统,就只以有穷的能行性(feasibility)去保证真理性。能行性也是人工智能的运作标准,这意味着,我们不能指望人工智能在每件事情上永远正确,因为人工智能也不能遍历无穷多可能世界。


如果说数学语言更接近理想化的存在本身,逻辑语言就更接近理想化的思维本身。按道理说,20世纪的数学危机和物理学危机“应该”连带触动对逻辑的彻底反思,但逻辑学只是对悖论、蕴含问题以及各种逻辑分支进行了一些反思,对逻辑系统进行了修补、优化和升级,但没有发生根本性的反思或系统性的改变,看来人们对逻辑的信念最为顽固。逻辑肯定不存在算法上的疑点,但请允许我对逻辑提出一个概念性的疑问:在名词思维的限制下,逻辑似乎遗漏了某个可能的思想维度。通用的逻辑是名词逻辑,虽然在系统的一致性和完备性上几乎无懈可击了,但似乎遗漏了关于动词的逻辑问题。动词都被转换为名词化的“行动”或“事件”而按照名词逻辑去理解,涉及动词的事情一般处理为模态逻辑或模态逻辑的分支变形(比如“行动逻辑”)。但是,把动词加以名词化,定义为限定的“事件”,动态性就消失了,只见动词产生的名词结果。名词和动词分别要揭示的问题终究有着根本差异,名词和动词在思想上也有不同的性质,动词的意义并不能完全还原或转换为名词。因此可以提问:假如我们选择的思想对象不是名词,而是动词,会怎样呢?为了充分表达思想可能遇到的问题,似乎需要在名词逻辑之外增加“动词逻辑”,它或能敞开思维里相对被忽视的一个或许更重要的维度。此外,动词逻辑或可能对人工智能的思维有帮助,我这样幻想。

喜欢wangguotong朋友的这个贴子的话, 请点这里投票,“赞”助支持!

内容来自网友分享,若违规或者侵犯您的权益,请联系我们

所有跟帖:   ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名: 密码: [--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助



[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 创建您的定制新论坛频道 ] [ Contact us ]