文本引導(dǎo)的人體著裝圖像編輯技術(shù)研究
本文檔由 jimeikuai1999 分享于2025-07-09 03:13
本文主要是介紹一種針對人體著裝圖像編輯的挑戰(zhàn)性計算機視覺任務(wù),目標(biāo)是對給定的人體著裝圖像進行符合文本語義的編輯。該任務(wù)要求編輯后的圖像符合文本語義且保留非編輯區(qū)域。盡管在人臉和動物臉部的文本引導(dǎo)圖像編輯方面已有顯著成果,但在處理著裝人體時遇到困難,主要原因是服裝、姿勢和身體形狀的變化豐富多樣,難以生成具有豐富服裝細(xì)節(jié)并保持源身份和姿態(tài)的人體圖像。本文提出了兩種不同的文本引導(dǎo)圖像編輯算法:基于對比..