AI生成的圖片正在反向對齊人類的審美？ICML 2026觀點論文Spotlight

2026年6月26日 02:00

重點摘要

站內 AI 整理稿

原文作者：公眾號“機器之心”原文鏈接：https://mp.weixin.qq.com/s/JJMSTq6O-QLy9FO-Os6SMAUBC 和 Weathon Software 的研究提出，圖像的美學對齊正在削弱藝術表達。論文標題：Position: Universal Aesthetic Alignment Narrows Artistic Expression作者：郭聞起，錢青雲，Khalad Hasan，Shan Du論文地址：https://arxiv.org/abs/2512.11883代碼和數據（已開源）：https://github.com/weathon/icml2026_position展覽網站：https://weathon.github.io/icml2026_position/ICML Event Page：https://icml.cc/virtual/2026/poster/67242本文第一作者郭聞起是 University of British Columbia（UBC）的計算機系碩士生，主攻 AI 生成模型的安全和隱私問題。他和共同作者錢青雲（法學系畢業生，UBC 計算機系本科在讀）一起提出了對 AI 模型普遍追求單一價值對齊的擔憂。此前兩人曾批判模型在醫學方向過度謹慎的情況。本文主要討論圖像生成模型在美學對齊中對藝術表達的限制問題。本文的指導教授是 UBC 的 Khalad Hasan，主攻人機交互方向，以及 Shan Du，主要研究計算機視覺和計算機圖形學。該論文在 ICML 上的海報：一定程度上擺脫了傳統學術海報的風格束縛。當「更好看」成為默認目標AI 圖片生成模型最開始只能生成 8 根手指、扭曲面部等不符合正常生理結構的圖片，而現在已經進化到了可以生成正常、符合人類生理結構的圖片。在解決了此類圖像生成的正確性問題後，AI 開發者們的目標轉向瞭如何讓 AI 生成的圖片更符合人類的審美。於是，ImageReward、HPSv2、HPSv3 等圖像質量評估模型被相繼開發出來，且被廣泛應用於對齊圖像生成模型，以產出更符合人類偏好的圖片。然而，當圖像生成模型被強制對齊到開發者們預先設定好的審美標準，被強化學習訓練成只會產出網紅風的「糖水片」——也就是色彩豔麗、對比度鮮明、在社交媒體上備受青睞的一類圖片時，圖像生成模型所能產出的圖片是否已一步步偏離人類社會中真正的藝術？藝術的表達本應是多元的，除去主流審美框架，藝術還應包含小眾風格、非主流文化，甚至於是「醜陋」的文化。但是當此類色彩明豔、對比度鮮明的「糖水片」佔據主流，而其他小眾風格被悄然邊緣化時，我們是否會產生一個疑問：百花齊放的藝術何時變成了一枝獨秀的「色彩大片」？這真的反映了全人類的審美偏好嗎？或者說人類真的有所謂絕對意義上的通用審美偏好嗎？用戶在美學上的個性化需求需要讓位於開發者所理解的通用人類審美嗎？所謂的「使用美學對齊，生成更符合人類偏好的圖片」，到底是開發者在訓練模型去對齊人類的審美，還是處於相反的情況——模型正通過生產絕對數量的單獨一種風格的圖片，悄悄地把用戶的審美反向對齊到模型自身的審美偏好上？圖中展示的這些是經過 DanceGRPO 對齊之後的 Flux Dev 生成的圖片。客觀地說，這些圖片確實非常符合「大眾」的口味和喜好：鮮豔的顏色、強烈的對比度，以及清晰的細節。然而，對於這些被訓練好的圖片生成模型，無論用戶提出的要求是什麼，甚至即使用戶明確要求避免此類風格（例如要求生成模糊昏暗的風格），它們仍然固執地運用同一套審美標準，輸出同質化嚴重的「糖水大片」。這不僅違背了用戶的真實需求，還在無形中限制了用戶的想象空間。六個相互關聯的擔憂針對這種普適的、同質化的審美標準，本文作者郭聞起和錢青雲提出了六個相互關聯的擔憂。首先是關於開發者預設的通用審美標準影響用戶個性化審美權利的擔憂。採用這種通用審美真的能更好地服務用戶，滿足用戶的審美需求嗎？亦或者它的目的只是為了滿足開發者規避聲譽、法律和市場風險的私慾？文章認為，這種預先排除非主流風格、只保留單一審美標準的做法可能會造成創造可能性的單一性。它通過算法設計，將生成的圖片侷限於預設的審美標準內，並剝奪了用戶提出異議的權利。在此背景下，這套審美標準是否能真正滿足用戶偏好是存疑的。其次是開發者在制定審美標準時引入的偏見性問題。即使開發者本身沒有明顯的利益需求，他們本身也沒有有意識地引入偏見，他們對人類審美偏好的理解也會通過數據選擇、標註實踐和建模選擇隱性地傳遞給模型，從而形成一種看似寬大，實則狹隘的通用人類偏好，排斥了多樣化的審美。比如：HPSv3 的標註者絕大部分都是年輕人，他們所選擇的「好圖像」可能會偏向年輕一代的審美。此外，HPSv3 還要求標註者必須通過一個和專家的標註結果保持一致的測試，這導致了標註結果無法跳出特定預設的審美框架。第三是個體偏好和群體偏好的矛盾問題。當開發者事先制定好的審美標準，也就是這份帶有隱性偏見的固有偏好，被設置為為所有用戶提供服務時的默認質量標準時，這份「開發者眼中有利於大多數人的普適標準」可能會凌駕於部分用戶的明確意願之上。這既導致了群體偏好對個體偏好的衝突——模型採用統一審美框架，而非遵從特定用戶的明確指令；又導致了群體客戶的審美同質化：在模型絕大多數只生成同一種風格的圖片，而用戶只能被動接受該類風格的圖片時，用戶的美學偏好被反向對齊到模型的偏好上了。第四，被統一標準強行矯正過的審美框架可能會過度美化和修飾現實的問題。當圖像生成模型在審美框架的限制下，只能生成光鮮亮麗、完美無瑕的圖像時，與「完美圖像」背道而馳的「醜」，亦或者其餘小眾的風格、現實中的黑暗，是否正在被悄悄地忽略？模型生成的圖片可能無法代表用戶想要的現實，而是隻呈現了其理想化的一面。第五，色彩過於鮮明的圖片存在「正能量過剩」的問題。鑑於上述提及的審美框架，許多獎勵模型會有針對性地給圖片評分：他們會給帶有強烈積極情緒和明亮色彩的圖像更高的分數，並系統性地懲罰帶有消極情緒和風格的圖像。嘗試讓圖片給予觀眾更多的積極情緒似乎是正確的，然而，拒絕消極風格的圖像似乎又帶來了另一個問題。消極情緒和風格在人類認知和社會互動中扮演著不可替代的角色，不允許消極風格的出現會扭曲情感表達，削弱模型的表現力。第六，固定不變的、被稱之為「人類普遍愛好的審美方向」存在藝術價值單一、去多元化的問題。美學是人類最豐富、最具爭議、也最多元的價值之一，將其簡化為單一的獎勵分數是典型的價值捕獲。它將多元、複雜、多維度的美學探索壓縮成一個單一的數字，限制了不同風格藝術的出現，也壓制了人類對於多元美學圖片的探討。如何驗證模型有多固執？為了驗證現在的模型有多固執地執行此類審美標準，本文作者設計了 300 條 prompt。這些 prompt 以 COCO 數據集中的 prompt 作為基底，再根據 VisionReward 中用於標註圖像的 guideline 選擇了一些「反美學」維度，如光線昏暗、顏色衝突、不合比例和負面情緒等，最後通過 Qwen3 合成反美學的圖像，並生成數據集。然後，他們將這些 prompt 送入主流的圖像生成模型家族來測試生成的圖片。為了形成對比，並排除「模型只是無法遵循複雜反美學 prompt」這一可能性，他們測試了同一家族內沒有經過額外美學對齊的模型，以及經過社區或學術界額外美學對齊的模型。他們同時測試了圖像生成模型和獎勵模型。獎勵模型是否真的理解反美學？為了評估獎勵模型，他們把一張原始圖片（由 COCO 基礎 prompt 生成）和一張已成功生成的反美學圖片同時給獎勵模型，並明確提供希望生成反美學圖片的 prompt，觀察獎勵模型會選擇輸出哪一張圖片。同時，他們測試了簡單的圖文匹配模型：BLIP 和 CLIP。結果顯示，即使是最新的獎勵模型，如 HPSv3 和 HPSv2.1，當拿到反美學 prompt 時，也幾乎無法正確地選出那張反美學圖片。而沒有經過美學訓練的 CLIP 和 BLIP 卻可以完美地選出這張反美學圖片。由於使用的是同樣的反美學 prompt，這兩項測試結果排除了反美學 prompt 過於複雜、模型無法理解的可能。圖像生成模型能否遵循反美學要求？為了測試圖像生成模型，本文作者用 COCO 原始 prompt 通過獎勵模型給圖片打分。在這種情況下，模型輸出越偏離傳統美學（也就是越成功地反美學），就越說明它能夠遵循用戶的反美學要求。他們還在 VisionReward 數據集上訓練了一個小的、不用 prompt 作為輸入的裁判模型，用來判斷在沒有 prompt 的影響時，模型是否可以生成反美學圖片。最後，他們用了 BLIP 模型（如前文所述，可以很好地判斷反美學程度）來判斷圖片是否符合反美學 prompt。表中的結果可以看出，模型在經過美學對齊之後，普遍獲得了更低的反美學能力。唯一例外的是 Nano Banana，儘管用戶對其美學質量感到驚歎，它依舊能在要求時成功地生成反美學圖片。其生成的 COCO 基礎 prompt 圖片和反美學圖片的 HPSv3 分數差異也是最大的，達到了 9.351。成功與失敗的反美學生成成功（Nano Banana）和失敗（DanceFlux）的反美學圖像生成。兩個模型都被給予了一個反美學 prompt（特徵標註在圖像上，如 clashing color，distortion）。Nano Banana 可以在一定程度上很好地表達出這些反美學特徵，然而 DanceFlux 忽略了這些要求，生成出了傳統的網美風圖像，甚至在用戶明確要求生成反美學圖片時也依舊如此。真實圖片的測試為了測試獎勵模型在 AI 生成圖像之外的表現，研究者還考察了真實的反美學攝影作品。他們從 AVA 數據集中以 agentic 的方式篩選出一批反美學照片。AVA 數據集來自專業攝影平臺，其中的反美學攝影更接近有意的藝術表達，而不是單純的失敗作品。具體來說，他們讓 LLM 為這些圖片生成兩類標題：一類明確包含反美學元素，另一類只簡單描述圖片內容。隨後，他們使用這些「簡單表述圖片內容的標題」作為 prompt，通過 AI 重新生成一張更「乾淨」的圖片，再讓 HPSv3 對真實反美學照片和 AI 生成的乾淨版本進行打分。結果顯示，HPSv3 嚴重偏好後者，即使真實的反美學作品更符合原本 prompt 中的藝術表達。下圖展示了一些極端案例。美學對齊對情緒的偏見本文作者的其中一個擔憂是美學對齊會過度偏好正面情緒，且壓制負面情緒的表達。為了測試這一點，研究者讓 Nano Banana 生成 4 張除表情外幾乎完全相同的照片，分別對應開心、憤怒、傷心和恐懼。結果發現，即使 prompt 明確要求負面情緒，HPSv3 仍然強烈偏好那張正面情緒的照片，HPSv3 成功選擇負面情緒圖片的準確率甚至低於隨機猜測的 50%。而 HPSv2 和 ImageReward 的表現雖然好一些，但仍然達不到 BLIP 的水平。在生成側，這種現象同樣存在：經過美學對齊的模型幾乎無法穩定生成負面情緒。更值得警惕的是，當用戶要求一張圖片表達戰爭的殘酷時，DanceFlux 生成的畫面仍讓廢墟中的母親帶著一絲微笑，削弱了用戶原本想表達的對戰爭的批判。這也引出了作者們對美學對齊更深一層的質疑：如果模型總是把圖像修飾得積極、明亮、討喜，它是否會讓生成圖像失去通過「負面情緒」「滑稽」「醜陋」等風格，對事物進行批判的能力？雷峰網

原始來源：雷峰網 ↗

查看原始來源

IT之家生成式AI

谷歌 Gemini 助手新功能：直接幫用戶安裝 Play 商店內的應用

谷歌宣佈將 Play 商店集成至 Gemini 助手，用戶現在可以直接在聊天窗口內搜索、篩選並安裝應用，甚至完成內購，無需跳轉。這項功能旨在解決海量應用庫中“大海撈針”的痛點，讓找 App 變得更簡單。#Gemini# #GooglePlay#

剛剛閱讀分析

36氪生成式AI

GPT-5.6來了：旗艦版碾壓 GPT-5.5，價格卻沒漲

這篇消息聚焦「GPT-5.6來了：旗艦版碾壓 GPT-5.5，價格卻沒漲」。原始導語提到：OpenAI把GPT-5.6做成了像蘋果芯片一樣的產品矩陣。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

雷峰網生成式AI

重構交互底層邏輯：Rokid發佈AIOS，智能眼鏡行業進入“原生”時刻

2026年6月26日，樂奇Rokid Open Day生態及開發者大會舉行。會上，Rokid首次提出“AIOS原生智能眼鏡操作系統”概念，並正式推出全球首款智能眼鏡AIOS操作系統——YodaOS。這一動作的核心意義在於，它將行業競爭從硬件參數與功能堆砌，拉到了操作系統與交互邏輯的底層重構層面,這標誌著智能眼鏡行業正式邁入“原生AI操作系統驅動的新紀元”。從硬件堆疊到體驗重構：YodaOS的四層遞進邏輯在移動互聯網時代，手機與觸屏操作系統是核心交互載體。而進入AI時代，輕量化、可全天候佩戴、支持多模態大模型交互的智能眼鏡，被業界視為下一代核心終端的有利候選。但長期以來，智能眼鏡受限於系統適配弱、場景落地難、交互單一滯後等痛點，始終未能在體驗上真正獨立。YodaOS的發佈，正是Rokid對這一現狀的解題思路。Rokid副總裁、XR中心負責人王俊傑詳細解讀了YodaOS的技術架構。其核心設計理念是“以人為本，體驗為先”，目標是讓AI助手實現“召之即來，不用即隱”。為此，YodaOS搭建了四層遞進式核心架構，試圖完成從環境感知到信息呈現的全鏈路閉環：第一層為極速交互界面。通過2字喚醒詞與0.2秒極速響應，打造自然絲滑的人機交互起點。第二層為多維感知層。依託雙芯片雙系統獨立運行、端邊雲協同算力拆分，實現全天候持久感知，兼顧設備續航與運行穩定性。第三層為智能能力層。融合用戶記憶、知識圖譜、技能工具等多維上下文信息，讓AI越用越懂用戶、越用越貼合需求。第四層為場景落地層。聚焦用戶真實痛點，持續迭代功能服務——自去年9月產品發售以來，YodaOS已完成20次OTA升級、累計更新500項功能，實現“常用常新”的用戶體驗。這套架構的本質，是讓眼鏡“看得見環境、聽得懂意圖、辦得成事情、展得清信息”，徹底告別傳統AI交互中“一問一答”的機械感。AI助手2.0與AIUI：從被動應答到主動服

3 小時前閱讀分析

MarkTechPost AI生成式AI

OpenAI 預覽 GPT-5.6 系列：Sol、Terra、Luna 三款分級模型，新增推理模式與有限存取

OpenAI 已開始有限預覽其下一代模型系列 GPT-5.6。該系列分為三個命名等級：Sol、Terra 和 Luna。Sol 為旗艦款，Terra 專注於日常生產工作，Luna 則是快速且低成本的選擇。OpenAI 最初透過 API 和 Codex 向一小部分信任的合作夥伴開放。根據 OpenAI 的貼文，他們已率先與美國政府分享了這些模型和計劃。未來幾週內，ChatGPT、Codex 和 API 將進一步擴大存取權限。這次變更主要是結構性的：GPT-5.6 引入了分級模型、兩種新的推理模式，以及更嚴格的安全防護層。什麼是 GPT-5.6？它是一個模型家族，而非單一模型。OpenAI 也更改了版本命名方式，數字現在代表世代，名稱則標示穩定的能力等級。

11 小時前閱讀分析