<rt id="txl8k"></rt>

        1. <i id="txl8k"><del id="txl8k"><cite id="txl8k"></cite></del></i>
        2. 真情服務(wù)  厚德載物
          聯(lián)系我們

          市場部:0564-3227239
          技術(shù)部:0564-3227237
          財(cái)務(wù)部: 0564-3227034
          公司郵箱:lachs@126.com
          技術(shù)郵箱:cc1982@163.com
          地址:六安市淠望路103號

          新聞分類
          推薦新聞
          當(dāng)前位置:首 頁 > 新聞中心 > 業(yè)界動(dòng)態(tài) > 查看新聞
          字節(jié)跳動(dòng)展示 OmniHuman 多模態(tài)框架:圖片 + 音頻 = 逼真動(dòng)畫,半身全身均可生成
          作者:永辰科技  來源:IT之家  發(fā)表時(shí)間:2025-2-7 8:07:42  點(diǎn)擊:162

          字節(jié)跳動(dòng)的研究人員近日展示了一款 AI 模型,可以通過一張圖片和一段音頻生成半身、全身視頻。

          字節(jié)跳動(dòng)表示,和一些只能生成面部或上半身動(dòng)畫的深度偽造技術(shù)不同,OmniHuman-1 能夠生成逼真的全身動(dòng)畫,且能將手勢和面部表情與語音或音樂精準(zhǔn)同步。

          字節(jié)跳動(dòng)在其 OmniHuman-lab 項(xiàng)目頁面發(fā)布了多個(gè)測試視頻,包括 AI 生成的 TED 演講和一個(gè)會說話的阿爾伯特 愛因斯坦。

          在周一發(fā)布的一篇論文中,字節(jié)跳動(dòng)指出,OmniHuman-1 模型支持不同的體型和畫面比例,從而使視頻效果更自然。

          據(jù)了解,字節(jié)跳動(dòng)表示,OmniHuman-1 模型基于約 19000 小時(shí)的人類運(yùn)動(dòng)數(shù)據(jù)訓(xùn)練而成,能夠在內(nèi)存限制內(nèi)生成任意長度的視頻,并適應(yīng)不同的輸入信號。

          研究人員還表示,OmniHuman-1 在真實(shí)性和準(zhǔn)確性方面,超越了其他同類動(dòng)畫工具。目前,該工具暫不提供下載或有關(guān)服務(wù)。

           
           
           
          合作伙伴
          華為 | 微軟中國 | 聯(lián)想集團(tuán) | IBM | 蘋果電腦 | 浪潮集團(tuán) | 惠普中國 | 深信服 | 愛數(shù)軟件
          六安市永辰科技有限公司 版權(quán)所有 © Copyright 2010-2021 All Rights 六安市淠望路103號 最佳瀏覽效果 IE8或以上瀏覽器
          皖公網(wǎng)安備34150102000370號

          訪問量:3196390    皖I(lǐng)CP備11014188號-1
          日韩精品欧美专区国内精品,久久精品免费视频网,国产a级无码一区二区三区,久久精品国产只有精品1
          <rt id="txl8k"></rt>
          
          

                1. <i id="txl8k"><del id="txl8k"><cite id="txl8k"></cite></del></i>