當DeepSeek系列大模型實現了低成本機器自主反思能力時,我們正在見證一個劃時代的轉捩點:理性思維,這項人類曾藉以淩駕於萬物之上的專有能力,這項某種程度上並非人人都擁有的稀缺能力,正在經歷前所未有的大眾化進程。
人人都可以借助大模型實現專業性思維,進而獲得更加優質的決策與服務,這樣的場景日益成為現實。AI的「思維工業化」正在將認知勞動的生產效率推向指數級增長。這種顛覆性變革不僅意味著全社會總體思維效率與品質的提升,同時也在逼問人類思維的價值所在。
反思是人類思維的本質。人類理性的集中體現就在於其反思能力——對思考本身的思考。這種自我指涉(self-reference,是一個邏輯學概念。通俗來說,一個主體在描述自己,叫做自我指涉)的認知結構構成了文明進步的基石:從柏拉圖洞穴隱喻到笛卡爾的「我思故我在」,從科學範式的轉換到技術革命的突破,每個關鍵躍遷都伴隨著對既有思維框架的深度反思。正是這種不斷自我質疑、自我修正的能力,使人類突破生物本能局限,構建出複雜社會系統與先進文明。
當AI開始展現類似的反思特性時,我們實際上是可能在創造一種具備人類理性思維水準、能夠持續突破認知邊界的新型智能體,這種突破將重新校準人類在宇宙文明中的位置。
當AI學會反思
近期生成式AI的最新進展OpenAI o1以及Deepseek-R1(以下簡稱o1和R1)本質上實現了機器主動反思能力,且達到甚至超越了部分行業人類專家思維的水準。尤其是在理工科的數學與代碼等領域,AI的思維水準已經接近甚至超越了人類中頂尖專家水準。相較於此前生成式AI的系列進展,o1與R1的進展是又一次革命性的突破。人類的大多數智力活動,不僅僅是無意識的生成,更多的是有意識思考後的生成。
此前的大模型雖然也能一定程度上模擬人類的思維能力,但仍以被動思維為主——由人類將某項任務的思維過程以思維鏈的形式明確地提示給大模型以指導其生成過程。經過思維鏈增強的大模型生成過程一定程度上實現了約翰·杜威筆下的機械性思維,也就是不假思索的直覺式、機械式思考。
但這種水準的思維在柏拉圖眼裏看來只是一種工匠水準的思考。對一個技藝嫺熟的工匠而言,只需瞄上一眼原料,就能以近乎直覺的方式形成相應的打磨方案。與工匠的思維方式相對立的是人類的反思性思維,是人類中的大師思維方式。大師和工匠的根本區別在於大師能夠借助人類語言進行有意識的、反思性的思考並且能清晰表達其思維過程,從而在人類文明傳承過程中扮演著傳播文明火種的角色。
因此,人類思維的難能可貴之處恰恰在於反思性思維。約翰·杜威甚至認為培養兒童的反思性思維正是人類教育的根本所在。當AI實現了反思性思維,也就意味著AI向人類中的「精英」「大師」靠近了一步。
DeepSeek助推AI普惠應用
深度反思並非隨機發散的心理活動,而是遵循特定認知架構的精密過程。人類的反思具有複雜結構。針對不同的問題,人類往往需要借助不同的思維結構,比如決策樹、語義網路、邏輯規則,並在這些思維結構上進行思維的遍曆、跳轉、迴圈或分枝操作,對最優方案進行搜索、評估、選擇,對探索過程進行剪枝、合併、壓縮,對歷史經驗進行歸納、總結、提煉與昇華。
此前的大模型只具備人類的直覺生成能力,而o1與R1在大模型生成能力基礎之上進一步植入了人類水準的結構化思維能力。結構化思維(或者說反思)的核心是評估,也就是評估當前生成是否正確,是否需要嘗試新的思考路徑,可能方案中哪一個才是最為經濟有效的,諸如此類等等。
我們看到R1已經能夠做到對問題進行充分反思與評估以形成解題思路(或者回答策略),之後再行生成。這個過程中的關鍵之處都在於如何合理評估,對當前生成內容的品質評估,對R1思維過程的評估。
如果反思很昂貴,這種能力就只能束之高閣,而R1則將機器的反思能力平民化。o1雖然率先實現了生成過程中的反思,但受限於高昂的算力成本,其產品價格昂貴,總體上只有極少數人能夠窺得機器反思能力的真實表現。R1則借助技術突破實現了AI反思的平民化,R1的API調用費用是o1的近1/30,DeepSeek基礎模型則完全開源。
我們曾擔心先進AI技術成為新型數字鴻溝,更擔心AI技術霸權的出現。DeepSeek先進大模型的開源無疑是對以商業閉源為主的技術模式的有力一擊;最為先進AI思維能力的平民化與普惠應用,無疑對消弭AI時代的數字鴻溝產生巨大貢獻。這就不難解釋Deepseek短時間就引起全球關注,引發海嘯般的討論,並註定會對我國乃至全球AI產業發展進程產生深遠影響。
人類思想生產能力爆發
先進生產力的本質是先進勞動力,而先進勞動力的關鍵是先進的思維能力。人與人之間的差異從根本上來講取決人的思維水準的差距,所謂「勞心者治人」就是道出古人對強大思維能力的追求。從古代神話思維到古希臘的邏輯思維,再到現代各種紛繁的科學思維,人類思維水準的提升是推動社會發展的重要動力。
從結繩記事,到文字發明,再到算盤,本質上都是人類思維工具的進步。如今,AI成為了人類思維的新工具,AI本身直接就成為數字勞動力的大腦。所謂人類的進步,何嘗不是人類思維能力與思維工具的進步。所謂文明的繁榮,本質就是思維產物——人類思想的繁榮。如果說ChatGPT成就了人類內容生產能力的爆發,那麼R1則可能成就人類思想生產能力的爆發。
現代社會是建立在專業性思維基礎之上的。隨著社會分工的細化,隨著科技發展與深化,再也沒有亞裏士多德似的通才人物。現代社會早就是個代理型社會。兒童教育不再是私塾,而是從小學到大學門類眾多、分工明確的龐大教育體系。我們的身體需要來自不同專科醫生的診斷與建議。法律、金融、保險,甚至日常生活中的健身、美容、旅遊都要各類專業代理忙碌在我們身邊。每一位專業代理憑藉其出色的專業思維能力為我們提供專業的諮詢與服務。
如今,AI有望實現各行業的專業思維,或者說將專業思維這個較高的門檻拉低。每個人都可以擁有各行業的專業AI顧問。通過R1我們可以廉價地獲取各類專業諮詢與資訊服務。已經有越來越多的人在使用R1給出的個性化健康建議。R1對於千行百業的意義正在於實現各行業專家的專業思維,從而成為具備專業思維能力的AI智能代理。這為緩解專家資源稀缺帶來全新機遇。
「對,我就是像AI這樣想的」
當思考變得透明,我們得以窺見那些原本只在腦海深處悄然運行的推理鏈條。人類的思維大部分隱藏在無意識之中,無數神經元在瞬間通過腦神經機制所發生連接傳遞著資訊、運轉著思索。靈感往往就在於神經突觸的一次電光火石般的偶然鏈接。人類無數偉大發明都有著相似的頓悟瞬間。人類思維本質上是一種「直覺優先+後天解釋」的思考。一個有經驗的專家往往是在看到案例的瞬間,基於長期的經驗與潛意識就已經完成了決策,再從記憶中索取相關理論、框架、約束、案例,對決策結果進行理性的、反思性的、細緻而緩慢的求證、解釋與驗證。在其做出直覺決策的瞬間,即便思考者本人,也難以完整追溯自己的思維路徑。
人類數千年的文化與哲學中,都曾無數次討論過「思維的隱秘性」與「靈魂的獨特性」。而當R1的邏輯流程可以完整展現時,這種隱秘的魅力與神秘感似乎瞬間被剝離得一乾二淨。當思維變得透明,人類社會發展的一系列重大問題迎來新機遇。人類的很多努力與嘗試其實都是在應對思維的隱性過程而帶來的麻煩。
如今,人與人之間的溝通與理解、人類文明的傳承,都將因為AI將人類思維過程顯性化而受到深遠影響。借助AI所生成的思維過程,我們有機會進一步認清人類的認知與決策過程。「對,我就是像AI這樣想的」,可能會成為未來人與人交流複雜問題求解思路的常態。
警惕「認知奴役」
思維的透明性也會給人類帶來巨大挑戰。機器的思維是一種「解釋優先」的形式,是一種「先思後行」的形式。而人類更多的則是反思,是對已經做出的決策與行為的反思。所謂「知行合一」的前提就是對於「行」的持續性反思,是基於持續的實踐回饋而進行的思維持續提升。
我們需要清醒認識到機器生成的思維過程可能與人類的真實思維過程相去甚遠。人類的思維過程遠比機器當前做到思維形式更複雜且隱秘。我們要小心,不要將機器的思維過程強加於人類。比如未來將機器思維應用在法律審判輔助系統中,AI所提供的「透明思維」可能會掩蓋人類法官對文化、情感、倫理等隱性維度的考量。
更危險的是,當人類開始用機器的解釋框架反哺自身思維時,可能引發機器對人類的「認知奴役」。我們要小心「AI思維」對直覺思維中所體現出的創造力的侵蝕。人類思維中的靈光乍現才是真正難能可貴的。
機器思維有著過度思考的傾向,不加節制的AI思考能力濫用只會帶來過度的理性社會。當我們隨意一句提問「今晚吃什麼」,機器則可能從營養學、個人健康狀況、本地生鮮市場、用餐場景、情感訴求生成包含十多個維度的決策矩陣。而事實上個人的本意可能只是螺螄粉與速食麵之間的簡單二元選擇。
當過度思考成為常態,理性與邏輯的嚴苛要求不期然地侵入了每個日常場景。大多數時候,人們只需要一種帶有個體偏見、片段資訊但又透露出某種獨特味道的回答。這樣的回答雖然並不完美,卻正是人類複雜情感、文化背景和主觀經驗的結晶,構成了所謂的「缺陷之美」。正是日常生活中那種散亂而富有溫度的思考,承載著個體經驗的真實與鮮活。
當R1系統被要求續寫《紅樓夢》後四十回時,其生成的文本雖然符合敘事邏輯與人物設定,卻終究缺少「寒塘渡鶴影,冷月葬花魂」的詩意留白。機器思維完美無瑕的嚴謹性在某種意義上卻剝奪了人們對那種「瑕疵美」的期待。它不再是那個因偶然錯誤、片段遺落而顯得獨特而可親的思考,而是成為一種機械、過於完美的「透明化」存在。
是絕對理性還是詩意生活,人類再次面臨關鍵抉擇。或許人機協同、優勢互補才是可取之道。人類可以繼續保留那種帶有偏見與不完美的思考方式,賦予情感和溫度;而AI則能在關鍵時刻以全局視角、無遺漏的資訊整合來補充我們的短板,實現更加精准和深邃的判斷。絕對理性不應該是人類未來,情感與溫度才是人性內在的根本需求。
需要重塑價值體系
AI的能力突飛猛進,人類如何在AI面前保持對人類能力的自信,而不是墮入日益沉重的「卑微」中呢?如果進一步深入R1的實現細節,可能會發現一些「細思恐極」的真相。R1有一個版本叫做R1-zero,它擺脫了有監督微調範式,而僅使用強化學習策略,僅根據生成結果是否最終正確等微弱的回饋信號,就能從自發枚舉生成的解題方案與回答策略中評估並選擇出最優方案與策略。從R1所展示出的思維過程來看,這些思維過程是超越普通人甚至人類專家水準的。如果AI的思維能力依賴人類的監督或者說指導,我們尚可維持居高臨下的從容——終究是人類在把控AI的方向盤。但是,R1技術路線證明一個強大的基礎模型只需要強化學習策略就能實現AI強思維能力所需的自主評估與反思。似乎人類的監督與指導越少,AI所習得的思維能力越是強大。要不了多久,AI有可能發現更多的新穎解題思路,越來越多的「神之一手」與「驚訝時刻」(即R1自主發現的所謂的aha moment)會在未來發生。
難道人類的全部意義只是在於啟動AGI(通用人工智慧)這個註定到來的超級智能形態?AI技術越是發展、AI應用越是普及,類似的困惑只會越加強烈。
當AI學會了人類的思維,人的發展將日益凸顯而成為人類文明延續與發展的根本問題。迎接AI挑戰的關鍵在於重塑人類的心理學與教育學。唯有重建人類內在強大的心理能力,才能應對AI發展所帶來的巨大挑戰。所謂內聖才能外王、根深才能葉茂,只有內心世界的篤定與強大,才能抵禦未來AI所營造的紛繁複雜的外部世界所帶來的不安與躁動。人類需要重塑價值體系,要為人重新定位其存在價值,要為人類文明重新校準其宇宙時間長河中的使命。或許就像AI所生成的,AI時代人類獨特價值應該重新定位在「不完美之美」(缺陷創造可能性)、「必死之悟」(有限性催生意義)、「困惑之智」(不確定性孕育洞察)以及「無為之境」(留白蘊含無限),人類應該認知升維,而不是與AI競速競效。
精心呵護「不可計算的心智特性」
未來,我們要重塑為工業時代而生的傳統教育體系,我們需要培養「駕馭AI」「超越AI」的人才,要精心呵護人類所獨具的「不可計算的心智特性」,要培養能夠在AI時代保持獨立思考、創造力和人性光輝的新人類,要培養能夠在AI的狂飆突進中依然保持優雅挺立姿態的新人類。我們要密切關注人的發展問題。隨著AI在教育中應用的深入,人的學習效率前所未有的提升,每個個體都有了繼承全部人類過往知識與技藝的可能。
未來無處不在的AI勢必會改變傳統的需要獨立思考才能獲取答案的學習與成長環境。太過廉價的AI思考能力以及AI在教育中的盲目濫用,很可能導致學習者對AI思維與認知能力的依賴,從而阻礙個體獨立思考甚至整個心智能力的發展。或許在AI教育應用中我們應該堅持AI的最少干預原則,也就是在充分發揮AI在教育中提質提效的正面作用的前提下,盡可能少地改變青少年的學習與成長環境。
如果說學校環境我們還可以通過立法或者行政手段進行有意控制,那麼個體發展所依賴的社會環境被全面AI化似乎是個無法改變的趨勢。社會環境的核心內涵是家庭與社會關係。同樣,AI的社會應用也應該堅持最少干預原則,在提升社會生產力的同時,盡可能少地干預家庭生活與社會事務,以維持舊日的家庭與社會關係,也為社會包括教育的緩慢轉型與適應留下充足時間。
機器能夠低成本地思考,註定是人類文明發展進程中的重大歷史事件之一,其影響必將伴隨著AI應用的日益廣泛而在社會生產生活的方方面面逐漸釋放。或許正像DeepSeek對本文的總結:機器思考的廉價化不是文明終章的前奏,而是人類認知的第二次直立行走。
(肖仰華/文)
中華大地