AI人像写实革命:从塑料肌肤到呼吸的皮肤

mysmile 9 0

我今朝手执杯咖啡,慣性刷着动态,准备好迎接成堆靓到失真嘅AI人像——完美嘅面孔、絕佳嘅打光……同埋嗰层挥之不去嘅“死皮”。你知嘅啦,就係嗰种好似假人浸咗液體乳膠嘅詭異光澤,靚係靚,但假到離譜,毫無靈魂-2。我以為呢個係享受AI美感必須付出嘅代價,直到我睇到個名叫SRPO嘅技術出現,先至發現,AI人像寫實嘅最大瓶頸——嗰層“塑膠肌”,真係可以被徹底抹走-2-10

呢個由騰訊、港中文(深圳)同清華大學搞出來嘅SRPO(語義相對偏好優化),根本唔係喺張圖生成之後再加濾鏡、銳化咁簡單。佢係一場從底層重寫AI思考方式嘅手術-2。傳統方法教AI“邊張圖更好”,而SRPO係喺擴散生成嘅每一步都問:“點樣微調,先可以令呢一寸皮膚睇落更可信?”-10 結果就係,皮膚終於識得呼吸,毛孔識得捕捉光線,皮下散射效果唔再似PS圖層咁生硬。人類評測者對其真實感嘅評分,比起舊方法高出足足300%-2。呢個唔係小修小補,係將AI人像寫實嘅標準線,一嘢拔高到全新嘅層次。

講到呢度,你可能以為追求極致嘅無瑕完美就係終點。但弔詭嘅係,AI變得真正似人嘅關鍵一步,竟然係學識“搞砸啲嘢”。早排嘅AI圖,破綻就喺於過分完美:每一粒像素都太滑、太亮、太乾淨,似蠟像多過似人-3。而家嘅新模型,好似Gemini裏面集成嘅Nano Banana,開始故意模仿手機攝影嘅種種不完美:過度銳化、死黑嘅暗部、傳感器產生嘅噪點-3。AI發現,我哋眼中嘅“真實”,並唔係物理世界嘅客觀再現,而係經過手機鏡頭算法“馴化”後嘅主觀認知。所以,佢唔再追求渲染物理上絕對正確嘅光影,轉而去渲染“手機鏡頭裏面嘅世界”-3。當AI生成嘅圖片有住同你手機隨手拍一樣嘅輕微模糊同光影缺陷時,你反而會覺得:咦,幾真實喔。呢種策略,被外媒稱為“巧妙地繞過了恐怖谷”-3

當然啦,技術嘅民主化先係呢場革命最激動人心嘅部分。SRPO嘅完整訓練,用一個32張GPU嘅集群,10分鐘就搞得掂-2。呢個速度,意味住任何有想法嘅團隊甚至個人,都可以用可承受嘅成本,去訓練專注於解決某個特定質感問題(比如布料、金屬)嘅模型-10。門檻從天價嘅算力,變成了想像力。

另一方面,分辨率嘅提升帶來了質的飛躍。當“即夢”呢類工具支持4K直出時,帶來嘅唔止係像素多少嘅變化-6。2K下容易崩壞、顯得空洞嘅眼睛,喺4K下獲得了足夠嘅像素去描繪瞳孔嘅光澤同睫毛嘅投影,眼神終於有了故事同情緒-6。有創作者甚至感慨,自己創造嘅AI模特仿佛有了生命,成了自己嘅演員同繆斯-6。呢個係從“像”到“是”嘅關鍵一步。

呢場AI人像寫實革命,正喺度衝擊各行各業。考古同文化遺產領域,研究人員開始用MetaHuman Creator呢類工具,基於古人骨骼,快速生成能夠說話、眨眼、同公眾互動嘅高保真數字面容,讓歷史人物“活”過來,極大地增強了公眾嘅情感連結與沉浸感-7。而影視行業更係經歷緊一場地震。一部傳統需要兩三百萬成本嘅精品玄幻劇,用AI製作可能只需幾十萬,生產周期從以年計壓縮到以月甚至以周計-8。以往因成本限制根本無法拍攝嘅“末日廢土”、“星際戰爭”等宏大題材,而家中小團隊都能駕馭,實現了真正嘅“技術平權”-8

不過,當技術將製作門檻拉到史上最低時,一個反向定律越發清晰:工具越民主,深度創作嘅價值就越稀缺-8。業內人士一針見血咁指出:“如果冇一個好嘅內容讓觀眾沉浸進去,佢第一眼看到嘅就係瑕疵。”-8 換句話說,技術瑕疵可以被容忍,但情感空洞絕對無法被原諒。AI解決了“點樣呈現”,而好故事先決定“值唔值得睇”-8

所以話,我哋而家見證嘅,唔單止係皮膚質感從塑料變到會呼吸,或者分辨率從2K跳到4K。我哋見證嘅,係AI對“真實”理解嘅深刻進化——從追求物理完美,到模仿人類感知;係創作權力嘅一次大規模下放——從少數精英團隊,到每一個有故事想講嘅人;最終,呢一切技術喧囂,都將回歸到一個最古老嘅原點:你,想用呢個逼真到震撼嘅“數字生命”,去講一個乜嘢樣嘅故事? 呢個問題嘅答案,先係區分流水線製品與真正作品嘅最終標尺。未來已來,而且靚到有溫度,真實到有瑕疵,就睇你點樣用它了。