作者treasurehill (寶藏巖公社,你還未夠班S)
看板AI_Art
標題Re: [閒聊] 負空間的由來
時間Thu Feb 26 02:12:52 2026
根據你的實驗,我把我的負空間理論修正成以下:
1.CLIP層的負空間
這邊專注於語意對齊,是否能將描述prompt整理成一個完整的語意
而非落到語意簇集的稀疏區,導致語意梯度消失
2.Difussion層的負空間
根據CLIP層整理過後的語意梯度,作為穩定擴散模型的導引能否生成完整的圖形
如果正常的話,一開始大爆炸的的塵埃(加噪過層)
會慢慢地凝聚收縮成一個穩定的星系(圖片),這就是正常去噪過層
穩定擴散模型生一張正確的圖形
如CHATGPT所產的圖片(CLIP層加強語意對齊過後)
https://i.meee.com.tw/cAYP3cu.png
如果無法凝聚收縮成正常完整的圖形,成為一片混亂的星雲的話
如不做強語意對齊的MJ所生成的圖
https://i.meee.com.tw/3GApD2E.jpg
這就是Difussion因語意梯度消失產生的負空間
這完全對應到Difussion Model的運算過層
https://i.meee.com.tw/EGgLkbv.jpg
https://i.meee.com.tw/Izyb6Sg.png
===============================
這裡補上擴散模型的數學運算式,說明CLIP向量的確會影嚮模型收斂,所以不要再說這只
是我的幻想了。
擴散模型的逆過程 (Reverse Process)
擴散模型的生成核心在於從雜訊中逐步還原圖像,其數學表示式如下:
$$x_{t-1} = x_t + \text{score}(x_t, c) dt + \text{noise}$$
$x_t$:目前時間點 $t$ 的特徵狀態(帶雜訊的圖像)。
$\text{score}(x_t, c)$:代表梯度場(Gradient Field),它指引模型如何修正當前圖
像以逼近目標數據分佈。
$c$:代表 CLIP 條件向量(Conditioning Vector)。
$\text{noise}$:在過程中加入的隨機雜訊,用於增加生成的隨機性與多樣性。
CLIP 的角色與功能
非生成主體:CLIP 本身並不直接生成像素,它主要負責語義理解。
決定語義方向場:CLIP 透過條件向量 $c$ 提供指導,決定了梯度場的方向,讓模型知道
該朝哪個「語義方向」演化(例如:讓生成的東西「看起來像一隻貓」)。
====================================
你這個實驗處理的是CLIP層的負空間
沒有處理到Difussion層生圖的負空間
※ 引述《galaxy4552 (無聞)》之銘言:
: 覺得這篇很有趣 剛好在做模型的PCA實驗
: 而我score也許可以觀測梯度
: 但梯度這個詞有空間上的導數與方向場
: 只能說做了一個勢能
: score=α*base +β*Δfield
: Δfield = global potential / bias
: β 控制 沿 potential 上/下坡
: α 控制 相似度吸引/排斥
: ---
: α=1 β=0
: https://meee.com.tw/ZwlvHfg
: 是什麼就是什麼 或接近什麼
: ---
: α=1 β=1
: https://meee.com.tw/HQ6jnhM
: 模型開始找意思 句子長的情況下幾乎被"意思"霸版
: ---
: 原本只做上面兩個 看到這篇文章後才做了這個
: α=1 β=-1
: https://meee.com.tw/3Pi0NyD
: 字詞中已表達最強烈的意思?
: 還是說是 已經有強烈意思 不用有生成方向?
: 又或者是說 意思已經足夠 不太需要生成?
: 又或者是說 不用生成 因為意思足夠了
: 可愛的愛 被往上提
: 愛與恨的恨 被往上提 且痛恨 憎恨也都從向量底下撈出來
: β<0 等於抑制全域勢能 head,使排序更依賴 query 本身的局部語義吸引。因此,在
組
: 合詞中,最強語義成分(愛、恨)會浮出
: ---
: 這個我參數設錯 但結果好像有點有趣
: α=-1 β=1
: https://meee.com.tw/pEefbxd
: 模型在"毀滅"這個詞開始在找意思了 (反相似度檢索)
: α<0 使系統刻意遠離 query 的語義吸引,再加上 β>0 的勢能偏置,會拉出語義最遠
但
: Δfield 高的 token
: 不知道有沒有說明為何prompt可以觀測負空間到這件事
: 也許Δfield升級成向量場且是做出來時就是梯度了
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.233.2.206 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1772043174.A.3F4.html
※ 編輯: treasurehill (118.233.2.206 臺灣), 02/26/2026 02:15:43
※ 編輯: treasurehill (118.233.2.206 臺灣), 02/26/2026 02:23:11
※ 編輯: treasurehill (118.233.2.206 臺灣), 02/26/2026 02:25:32
※ 編輯: treasurehill (118.233.2.206 臺灣), 02/26/2026 02:27:50
推 Tosca: 我想看色空間~~~~02/26 08:53
推 galaxy4552: 我還蠻羨慕樓上能這麼誠實表達自己02/26 10:03
→ galaxy4552: 我都覺得我有說話困難02/26 10:04
推 hangtenboy: 很棒的討論02/26 10:49
※ 編輯: treasurehill (101.10.58.207 臺灣), 02/26/2026 18:10:07
※ 編輯: treasurehill (101.10.58.207 臺灣), 02/26/2026 18:13:34
※ 編輯: treasurehill (101.10.58.207 臺灣), 02/26/2026 18:16:39
※ 編輯: treasurehill (101.10.58.207 臺灣), 02/26/2026 18:17:15