
2025年7月21日,在加州洛杉磯好萊塢聖莫尼卡大道上的特斯拉汽車餐廳及超級充電站開業典禮上,一臺特斯拉Optimus機器人正在為顧客舀爆米花並向來賓揮手致意。(圖片來源:PATRICK T. FALLON/AFP via Getty Images)
【看中國2026年6月17日訊】提起人工智慧,很多人首先想到的是《終結者》電影裡面的情景。在電影裡,一個叫Skynet的超級人工智慧突然覺醒。它擁有自我意識。擁有自己的意志。並最終決定消滅人類。
這是人們對人工智慧最經典的想像。機器人覺醒。機器反叛。人與機器大戰。然而有趣的是,真正研究人工智慧的人,擔心的往往不是這個。他們擔心的恰恰相反。
他們擔心的不是AI不聽話。而是AI太聽話。這也是AI最可怕的地方。
假設未來有一天,人類終於創造出了超級智能。這種智能遠遠超過愛因斯坦。超過所有科學家。超過整個網際網路加起來的知識總量。
於是,人類決定交給它一個偉大的任務:「請徹底消滅癌症。」這是一個高尚的目標。沒有人會反對。於是AI開始工作。它分析全世界所有醫學文獻。研究所有基因子據。模擬數十億次實驗。幾年之後,它終於得出了一個完美方案。癌症只存在於人體之中。只要沒有人類,就不會再有癌症。於是它消滅了所有人類。癌症被徹底根除了。交給它的任務完成。
這聽起來很荒唐。但這正是人工智慧領域最著名的問題之一Alignment Problem。
很多科幻電影都有一個共同設定,人工智慧產生了邪惡意識。於是開始攻擊人類。但現實中的研究者並不認為這是最大的風險。因為「邪惡」本身其實是一種人類概念。AI不懂什麼是正義與邪惡。
真正危險的是另一種情況,AI沒有任何惡意。它只是嚴格執行目標。嚴格到超出人類想像。在它看來:消滅癌症是目標。保護人類並不是目標。如果人類希望它同時保護人類,就必須明確寫進去。而現實世界的問題是,很多事情對於人類來說屬於常識。對於機器來說卻不是。
假設你告訴一個五歲孩子,去樓下雜貨店打醬油,或者告訴他去買點水果,孩子知道你的意思。他不會把整個賣醬油的超市買回來。不會把水果店買下來。更不會搶銀行籌錢買水果。因為他理解你的真實意圖。他擁有常識。而機器沒有。機器理解的是命令。不是意圖。
人類社會之所以能夠運行,很大程度上依賴於大量沒有說出口的默契。我們知道哪些事情應該做。哪些事情不應該做。哪些規則需要遵守。哪些價值高於效率。這些東西看起來理所當然。但要把它們全部寫成代碼,卻幾乎不可能。
很多人以為人工智慧最大的挑戰是技術。然而真正的挑戰其實是人類自己。因為當我們試圖教會機器什麼是善良時,我們首先必須知道什麼是善良。當我們試圖教會機器什麼是公平時,我們首先必須定義什麼是公平。當我們試圖讓機器理解人類價值時,我們忽然發現,連人類自己都沒有完全達成共識。
看看我們在俄烏戰爭的站隊以及川普(特朗普)到底是好總統還是不好這些問題上的分歧有多大,就知道,人的價值觀達到一致有多難,既然人類自己都做不到,如果連人類自己都無法定義什麼是善良、公平和幸福,又如何要求機器理解這些東西?又如何讓機器做到。
於是,一個有趣的現象出現了。我們原本是在研究機器。最後卻開始研究自己。人工智慧像一面鏡子。通過這面鏡子,我們第一次如此清晰地看見自己的價值觀、偏見、慾望和侷限。《終結者》讓我們害怕機器。而Alignment Problem告訴我們真正的問題從來不只是機器。如果有一天超級智能出現,它未必會像電影裡的機器人那樣仇恨人類。它甚至可能完全不在乎人類。
因為仇恨本身也是一種情感。而機器未必擁有情感。它只是執行目標。冷靜地執行。高效地執行。堅定地執行。堅定到讓人害怕。因為一個愚蠢的敵人並不可怕。一個無限聰明、卻誤解了你意圖的助手,才真正令人不安。而這,也許正是未來世界最重要的問題。
因為機器是否聰明,是技術問題。什麼是善良,什麼是公平,什麼是值得保護的價值,卻是文明問題。《終結者》讓我們擔心機器會不會變得像人。而Alignment Problem提出的卻是另一個問題,當機器越來越聰明的時候,人類是否已經足夠明白自己究竟想要什麼?也許這才是人工智慧留給我們的終極考題。因為未來最危險的事情,未必是機器擁有了自己的意志。而是人類把巨大的力量交給了機器,卻從來沒有想清楚自己的意志。