
▲宋展團(tuán)隊(duì)近年來構(gòu)建的多類三維數(shù)據(jù)集的元數(shù)據(jù)示意。受訪者供圖
深圳新聞網(wǎng)2026年3月4日訊(深圳報(bào)業(yè)集團(tuán)記者 鄭淑儀) 在今年的春晚舞臺(tái)上,機(jī)器仿真蔡明為什么能讓人真假難辨?答案或許就藏在人臉的細(xì)微變化中。三維人臉關(guān)鍵點(diǎn)檢測(cè),是虛擬人擁有生動(dòng)表情、識(shí)別身份、具身智能等多種應(yīng)用的關(guān)鍵技術(shù)環(huán)節(jié)之一。
近日,中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院集成所機(jī)器視覺研究中心研究員宋展團(tuán)隊(duì),與福建理工大學(xué)教授葉于平團(tuán)隊(duì)合作在《IEEE電路與系統(tǒng)匯刊(視頻技術(shù))》(TCSVT)發(fā)表的最新研究成果,為解決這一難題提供了全新思路。
該研究中,宋展團(tuán)隊(duì)基于自主研制的高精度3D/4D人臉采集設(shè)備,經(jīng)過近三年的規(guī)范化數(shù)據(jù)采集與數(shù)據(jù)庫(kù)構(gòu)建,構(gòu)建了大規(guī)模的高精度、真實(shí)標(biāo)注的三維人臉數(shù)據(jù)庫(kù),其中高保真人臉數(shù)據(jù)的個(gè)數(shù)近20萬(wàn),數(shù)據(jù)量達(dá)到世界領(lǐng)先水平。
在此基礎(chǔ)上,宋展團(tuán)隊(duì)聯(lián)合葉于平團(tuán)隊(duì)提出了一種面向無(wú)序點(diǎn)云的曲率融合圖注意力網(wǎng)絡(luò)(CFGAT),實(shí)現(xiàn)了從原始3D點(diǎn)云直接預(yù)測(cè)人臉關(guān)鍵點(diǎn)坐標(biāo)的高精度檢測(cè)框架,實(shí)現(xiàn)了從“千人一面”到“因人而異”的本質(zhì)性提升,為高保真度虛擬人面部驅(qū)動(dòng),以及機(jī)器人臉部表情高逼真度驅(qū)動(dòng)技術(shù),提供了基礎(chǔ)理論支撐。
“從真假難辨的虛擬人到未來能讀懂人類情緒、自然交互的機(jī)器人,背后都離不開基礎(chǔ)數(shù)據(jù)的支撐。這一系列數(shù)據(jù)庫(kù)已成為仿人機(jī)器人關(guān)鍵技術(shù)鏈條中的核心支撐,為高逼真度感知、表達(dá)建模與行為生成提供基礎(chǔ)數(shù)據(jù)。未來,這些數(shù)據(jù)集將進(jìn)一步服務(wù)于數(shù)據(jù)驅(qū)動(dòng)的大模型仿人機(jī)器人體系,以構(gòu)建更自然、更智能的人機(jī)交互能力?!彼握贡硎?。
據(jù)了解,深圳市高精度高分辨率4D成像概念驗(yàn)證中心于2024年成立,是國(guó)內(nèi)首個(gè)以4D成像為核心的概念中心。