直擊2024 GTC,NVIDIA數(shù)字人技術(shù)讓AI角色栩栩如生!
3月19日,備受全球科技愛好者矚目的 2024 GTC 大會(huì)正式開幕,來自全球的科技從業(yè)者共襄盛舉,為推動(dòng) AI 發(fā)展協(xié)力前行。
會(huì)上,NVIDIA 表示領(lǐng)先的AI應(yīng)用開發(fā)者正使用 NVIDIA 數(shù)字人技術(shù),為商業(yè)應(yīng)用和動(dòng)態(tài)游戲角色創(chuàng)建栩栩如生的化身。
以 AI 驅(qū)動(dòng)的 NVIDIA 數(shù)字人技術(shù)包括——用于語音和動(dòng)畫的 NVIDIA ACE (NVIDIA Avatar Cloud Engine) 、用于語言功能的 NVIDIA NeMo? 以及用于光線追蹤渲染的 NVIDIA RTX?。
不了解數(shù)字人技術(shù)?沒關(guān)系,接下來會(huì)進(jìn)行詳細(xì)介紹:
● NVIDIA ACE — 可幫助開發(fā)者通過由NVIDIA Audio2Face?驅(qū)動(dòng)的面部動(dòng)畫以及由NVIDIA Riva自動(dòng)語音識(shí)別(ASR)和文本轉(zhuǎn)語音(TTS)驅(qū)動(dòng)的語音交流,讓數(shù)字人栩栩如生。ACE 微服務(wù)非常靈活,允許模型根據(jù)本地 GPU 的性能在云端和 PC 上運(yùn)行,以確保用戶獲得最 佳體驗(yàn)。
● NVIDIA NeMo — 一個(gè)端到端平臺(tái),可幫助開發(fā)者提供企業(yè)級(jí)的生成式AI模型,包括精確的數(shù)據(jù)管護(hù)、先進(jìn)的模型個(gè)性化定制、檢索增強(qiáng)生成和加速性能。
● NVIDIA RTX — RTX全局光照 (RTXGI) 和 DLSS 等渲染技術(shù)的集合,可在游戲和應(yīng)用中實(shí)現(xiàn)實(shí)時(shí)路徑追蹤。對(duì)創(chuàng)作者來說,NVIDIA RTX 能帶來實(shí)時(shí)照片級(jí)渲染和AI增強(qiáng)圖形。
開發(fā)者能通過以上技術(shù),創(chuàng)建能進(jìn)行 AI 驅(qū)動(dòng)的自然語言交互的數(shù)字人,并應(yīng)用與游戲、設(shè)計(jì)、醫(yī)療、科研等多個(gè)領(lǐng)域。
現(xiàn)在,數(shù)字人能擁有更復(fù)雜的動(dòng)畫和更擬真的對(duì)話,互動(dòng)的真實(shí)感得到了極大的增強(qiáng)。目前,應(yīng)用成果已經(jīng)在 Inworld AI、Hippocratic AI、UneeQ 等公司的技術(shù)Demo中得到展示。
Inworld AI引擎采用多模態(tài)方法來展示非玩家角色(NPC),將認(rèn)知、感知和行為系統(tǒng)集成在一起,在精心制作的環(huán)境中呈現(xiàn)令人驚嘆的 RTX 渲染角色,以實(shí)現(xiàn)身臨其境的敘事效果。
Inworld AI引擎集成NVIDIA Riva 和NVIDIA Audio2Face,前者可實(shí)現(xiàn)精確的語音轉(zhuǎn)換文字,后者可提供逼真的面部表情。
Inworld AI公司首席執(zhí)行官Kylan Gibbs表示:“NVIDIA ACE微服務(wù)與Inworld引擎的結(jié)合使開發(fā)者能創(chuàng)建可以推動(dòng)動(dòng)態(tài)敘事的數(shù)字化身,為玩家解密、推理和玩游戲開辟全新可能性。”
Hippocratic AI 已打造了一個(gè)以安全為重點(diǎn)、由 LLM 驅(qū)動(dòng)、針對(duì)特定任務(wù)的醫(yī)療代理。該代理可給患者打電話、跟進(jìn)護(hù)理協(xié)調(diào)任務(wù)、提供術(shù)前指導(dǎo)、執(zhí)行出院后管理等,展示了生成式AI醫(yī)療數(shù)字人的潛力。
UneeQ是一個(gè)自主數(shù)字人平臺(tái),專門為客戶服務(wù)和互動(dòng)應(yīng)用創(chuàng)建AI驅(qū)動(dòng)的化身。它的數(shù)字人在線代表品牌與客戶實(shí)時(shí)溝通,增強(qiáng)客戶購買信心。UneeQ 將NVIDIA Audio2Face 微服務(wù)集成到其平臺(tái)中,并將其與 Synanim ML相結(jié)合,以創(chuàng)建高度逼真的數(shù)字人,從而獲得更好的客戶體驗(yàn)和參與度。
現(xiàn)在,全球游戲發(fā)行商正評(píng)估 NVIDIA ACE 如何改善游戲體驗(yàn)。其他行業(yè)諸如醫(yī)療、金融服務(wù)、媒體娛樂以及零售行業(yè)的開發(fā)者都在使用 ACE,嘗試用 AI 提升效率及服務(wù)體驗(yàn)。
有關(guān) NVIDIA ACE 的更多信息,請(qǐng)?jiān)L問 https://developer.nvidia.com/ace ,平臺(tái)開發(fā)者可將數(shù)字人交互技術(shù)套件或單個(gè)微服務(wù)整合到他們的產(chǎn)品中。
總結(jié)來說,在2024 GTC大會(huì)中,我們看到了加速計(jì)算、生成式AI及機(jī)器人領(lǐng)域的最 新突破性成果。
近年來,大批AI應(yīng)用的涌現(xiàn),推動(dòng)了整個(gè)行業(yè)迅速發(fā)展。我們能看到各種大模型正以前所未有的速度進(jìn)行迭代。這一趨勢(shì),也吸引了許多還沒入門的用戶主動(dòng)去了解AI、運(yùn)用AI。
為了更好地普及 AI 知識(shí),讓更多的使用者和開發(fā)者了解 AI、運(yùn)用 AI,NVIDIA 官方還推出了每月一更的專欄——《解碼AI》系列欄目,感興趣的小伙伴可以通過 NVIDIA 官網(wǎng)或微博賬號(hào)@英偉達(dá)GeForce 獲取最 新的資訊。
而對(duì)于普通用戶來說,可以通過最 新的 GeForce RTX 40 系列顯卡,進(jìn)行 AI 應(yīng)用的探索及體驗(yàn)。
推薦使用索泰 GeForce RTX 4090 D PGF,這款顯卡擁有14592個(gè)CUDA流處理器、以及24GB的GDDR6X高速顯存,算力基礎(chǔ)十分強(qiáng)悍。
其搭載 TSMC 4N 工藝制成的 GPU 芯片,內(nèi)嵌有專為 AI 優(yōu)化而生的第四代 Tensor core,不僅能針對(duì) AI 繪圖、游戲畫面進(jìn)行專門的 AI 優(yōu)化,還能應(yīng)用本地大語言模型——Chat with RTX。
對(duì)于開發(fā)者來說,NVIDIA 的 CUDA 指令集也很大程度上提高了開發(fā)者的效率,GeForce RTX 4090 D PGF 支持NVIDIA的CUDA-X軟件堆棧。
此外,GeForce RTX 4090 D PGF 還適用于需要高質(zhì)量圖形和視頻處理的中等規(guī)模 AI 訓(xùn)練和推理工作負(fù)載。支持諸如 TensorFlow、PyTorch、MXNet、Caffe2 等多個(gè)深度學(xué)習(xí)框架,為 AI 應(yīng)用開發(fā)提供了超強(qiáng)的適配和優(yōu)化。
隨著數(shù)字人技術(shù)的發(fā)展,我們?cè)诓痪玫膶砭湍芸吹健螒蛑兄悄?NPC 到處跑,生活中虛擬數(shù)字人隨處見的場(chǎng)景了。
快跟上 AI 時(shí)代,從使用 GeForce 顯卡打造專屬于你的 AI PC 開始!
關(guān)注我們
