播客平台低成本打造 AI文字轉語音模型

Podcastle低成本打造文字轉語音AI模型,可選擇超過450種聲音。Podcastle

語音克隆技術升級。Podcastle

播客錄音和剪輯平台Podcastle加入人工智能(AI)驅動的文字轉語音競爭行列,推出AI模型Asyncflow v1.0,並將提供應用程式介面(API)給開發人員,讓他們直接將該模型整合入其開發的程式中。

據科技網站TechCrunch報道,得益於這款新模型,該公司能夠提供超過450種AI聲音來為文本配音,並稱開發方式使其訓練和推理成本壓低,從而比對手更具競爭優勢。

Podcastle加入了ElevenLabs、Speechify和WellSaid等眾多新創公司的行列,開發技術和AI模型,將各類文本轉換為由AI朗讀的語音片段,用途涵蓋行銷、廣告、內容創作、教育和企業培訓等領域。

Podcastle的創辦人葉里茨揚(Arto Yeritsyan)表示,該公司一直想打造一個文字轉語音模型,礙於訓練成本和資料需求非常高,「拜近來大型語言模型發展之賜,我們去年取得了突破,不需要大量資料就可以創建高品質的語音模型。」

Podcastle每500分鐘文字轉語音的收費約40元,相比ElevenLabs的收費為99元。

此外,Podcastle的語音克隆功能亦獲得升級,從而加快訓練過程,從過去需朗讀大約70句不同的句子縮短為幾秒鐘,就可以創建語音克隆。新程序還採用Podcastle去年發布的Magic Dust AI,來提高錄音品質。本報訊

科技-三藩市版