手把手教你用 可靈AI 做 AI 數字人!
當前位置:點晴教程→知識管理交流
→『 技術文檔交流 』
什么是數字人?怎么做數字人? 說白了,就是創建一個自己的克隆人,只需輸入文案,就能生成自己說話的視頻。
那今天,我將手把手教你使用數字人工具,讓你無需露臉就能輕松做出自己的數字人。
打造數字人總共只需兩步,接下來我將分步驟為大家拆解其底層邏輯。
第一步,要讓數字人動起來;第二步,則是讓數字人對口型。
對于第一步“動起來”,我們可以借助可靈 AI,因為它的動態生成效果既穩定又真實。
這里有三種實現方式:
第一種 使用可靈 AI 的文生視頻功能。 可靈:https://klingai.kuaishou.com/
點擊這個功能后,我們可以選擇參考人臉。(這個功能只能鉑金會員以上才行)
比如,我想使用自己的人臉,就直接選擇“羊羊”,不過需要提前錄制好自己的人臉素材。
在左上角的創意描述區域,使用“羊羊”的人臉,并進行詳細描述,
像“我作為一個博主,眼神是怎樣的,背景是什么樣子,動作有哪些,整體畫面風格如何”等。
描述完成后,填入不希望呈現的內容,如變形、扭曲、毀容等,
然后點擊“立即生成”,
就能得到一個以我的人臉為主,動作穩定的視頻。我們可以利用這個視頻進行后期的對口型操作。
第二種 方法是采用圖生視頻的方式。
比如,我們先獲取一張生成的圖片,像我在這里截一張圖,將其上傳到這個位置后,在創意描述處輸入我們期望圖片會呈現怎樣的動作。
這種圖生視頻方式的好處是什么呢?
一個是圖片美觀,背景也能隨心設定,可控性很強,二是還能更精細地控制動作。
第三種 方式是自己拍攝。
自己拍一張照片,然后上傳到可靈 AI 的圖生視頻中。
接著在圖片創意描述處輸入相關描述,比如讓人物動起來,描述其眼神狀態等。
不過建議大家盡量讓動作緩慢些,人物動態效果不要太強烈。畢竟人正常面對鏡頭說話時,動作幅度不會特別大,而且動作幅度太大容易出現手指變形的 bug。
上傳照片并完成描述后,點擊“立即生成”,就能得到我們想要的視頻。
這就是第一步,讓數字人形象動起來。
接下來進入第二步——對口型。
對口型有兩種方式, 第一種 是我們可以直接使用可靈 AI 的對口型功能。
點擊“對口型”后,在左邊上傳視頻,配音音頻有文本驅動和聲音驅動兩種方式可選。
如果選擇 文本驅動,還能挑選音色,輸入想說的文本就能生成數字人講解這段話的視頻。
但不足之處在于,盡管音色選擇多樣,卻無法使用自己的聲音,難以達到與本人聲音一模一樣的效果。
不過對口型也有好處,我們可以選用他人音色,說不定會更加悅耳動聽。
對口型還有 聲音驅動 這種方式,我們能上傳一段自己的音頻,可靈 AI 支持 MP3 等常見音頻格式。
上傳音頻后即可直接生成視頻。
不過,可靈 AI 每次僅支持生成 5 秒的片段。
我們可以通過變速將音頻盡量壓縮至 5 秒以內,但這并長久之計,比較適合制作短口播視頻、短數字視頻,或者將多個片段組合起來使用。
第二種 方式,我們還可以使用 必火AI工具。 必火AI:https://www.bihuoai.com/login/7i1cN6
它的優勢在于能夠進行形象克隆和聲音克隆,且生成效果較好。
下面來看看具體操作流程:
首先,上傳視頻以克隆數字分身,將前面可靈 AI 生成的動態視頻上傳;
接著,在聲音克隆處克隆自己的聲音;
最后,在數字分身板塊進行創作,若采用文本驅動,輸入想要數字人說的話,選擇自己克隆好的聲音,點擊提交,就能生成一段數字人視頻。
若采用音頻驅動方式,上傳自己的一段聲音,同樣可以生成數字人視頻。
總體而言,最關鍵的就是這兩步:
先生成一段動態視頻,再讓這段動態視頻完成對口型操作,
這樣一來,我們想要的數字人視頻便制作完成了。 現在的 AI 時代,真的是減輕了人很多的工作量, 一天做 100條 口播的數字人時代真的來了。 ? 閱讀原文:原文鏈接 該文章在 2025/3/4 11:02:04 編輯過 |
關鍵字查詢
相關文章
正在查詢... |