香港科技大學馮諾依曼研究院院長兼計算機科學及工程學系講座教授賈佳亞帶領(lǐng)的團隊,推出的人工智能(AI)圖像編輯及生成模型DreamOmni2,開源兩周便斬獲GitHub 1.6k星標。測試各個AI模型發(fā)現(xiàn),DreamOmni2在具體物體生成、抽象屬性編輯等核心任務(wù)和關(guān)鍵指標得分都最高,不僅打敗主流開源模型,甚至超過谷歌閉源的Nano Banana。
團隊介紹,DreamOmni2在生成、編輯、抽象理解三大維度超越同類模型,核心在於從數(shù)據(jù)構(gòu)建、框架設(shè)計到訓(xùn)練策略的系統(tǒng)性創(chuàng)新,解決行業(yè)長期存在的三大痛點:抽象數(shù)據(jù)稀缺、多圖協(xié)同難、指令理解偏差。
賈佳亞團隊稱,DreamOmni2不僅是一次單一模型的技術(shù)升級,更是香港多模態(tài)AI科研實力的代表作,為本地科技生態(tài)帶來多重價值。此次成果為本地「學術(shù)研究 - 技術(shù)轉(zhuǎn)化 - 產(chǎn)業(yè)落地」生態(tài)閉環(huán)提供優(yōu)質(zhì)樣本,未來或?qū)⑽嗳瞬排c資源投入香港AI 領(lǐng)域,推動本地科技產(chǎn)業(yè)更高質(zhì)量發(fā)展。(記者 黃兆琦)