SoundHound 是一家位于硅谷的初創(chuàng)公司。通過(guò)將AI技術(shù)應(yīng)用于其服務(wù),它革新了傳統(tǒng)的語(yǔ)音搜索。隨著產(chǎn)品規(guī)模的不斷擴(kuò)大,該公司目前已獲得1億美元的戰(zhàn)略投資。NVIDIA GPU Ventures是其早期投資者之一,它致力于支持從事深度學(xué)習(xí)研究的初創(chuàng)公司。
除了同名的音樂(lè)識(shí)別應(yīng)用程序外,SoundHound 還提供 Hound 語(yǔ)音搜索應(yīng)用程序和 Houndify 語(yǔ)音平臺(tái),以幫助企業(yè)創(chuàng)建基于 AI 的語(yǔ)音服務(wù)。即使在亞馬遜、蘋(píng)果、谷歌和微軟等巨頭云集的市場(chǎng)中,該公司的技術(shù)也已成為語(yǔ)音搜索領(lǐng)域最具競(jìng)爭(zhēng)力的方案之一。
加入研發(fā) Collective AI
該公司正在迅速推出自己的語(yǔ)音領(lǐng)域,以實(shí)現(xiàn)更流暢和快速的自然語(yǔ)言處理。其領(lǐng)域范圍已經(jīng)從 50 個(gè)發(fā)展到了 200 個(gè),這些領(lǐng)域的語(yǔ)音服務(wù)質(zhì)量也在兩年內(nèi)實(shí)現(xiàn)迅速提升。
與此同時(shí),SoundHound 還在持續(xù)推動(dòng)各領(lǐng)域相互“交流”的能力,以此為消費(fèi)者提供更出色的搜索功能。該公司將此項(xiàng)工作稱為Collective AI,并表示這會(huì)讓使用相關(guān)架構(gòu)的產(chǎn)品更智能、更強(qiáng)大。
Collective AI 旨在幫助人們提出復(fù)雜的請(qǐng)求或問(wèn)題,并獲得回復(fù)。例如:請(qǐng)找到舊金山 4 星級(jí)以上最好的意大利餐廳,要適合兒童就餐,不能是連鎖餐廳,且在周三晚上 9 點(diǎn)以后仍然營(yíng)業(yè)。
該公司的 Collective AI 聯(lián)盟企業(yè)包括 NVIDIA、Yelp、AccuWeather.com、Sportstrader、Xignite、FlightStats、Onkyo、Sharp、Uber 和 Samsung ARTIK。
此外,SoundHound 還希望借助 Houndify 語(yǔ)音平臺(tái)脫穎而出。這項(xiàng)白標(biāo)簽授權(quán) (white-label licensed) 服務(wù)允許公司在產(chǎn)品中使用自己的名稱來(lái)定制語(yǔ)音助手,并保留生成的客戶數(shù)據(jù)。這使公司能夠打造自己的語(yǔ)音搜索品牌,同時(shí)透過(guò)客戶數(shù)據(jù)發(fā)現(xiàn)其他商機(jī)。
Houndify 開(kāi)發(fā)人員數(shù)量增至三倍
去年年初,SoundHound 有 2 萬(wàn)多名開(kāi)發(fā)人員注冊(cè)使用 Houndify,而如今這一數(shù)字已增至 6 萬(wàn)多。
SoundHound 也在不斷為 Houndify 吸引客戶。目前,該公司的合作伙伴包括 11 家汽車(chē)制造商,以及從事機(jī)器人、聯(lián)網(wǎng)揚(yáng)聲器、電器、增強(qiáng)現(xiàn)實(shí)和智能家居設(shè)備行業(yè)的公司。
現(xiàn)代集團(tuán)正在為未來(lái)汽車(chē)中的新一代語(yǔ)音系統(tǒng)配置 Houndify。汽車(chē)制造商的智能助手旨在預(yù)測(cè)駕駛員對(duì)信息的需求(例如提供會(huì)議提醒)。它還支持免提通話、發(fā)送信息、搜索目的地和音樂(lè),以及查詢天氣和管理日歷等功能。此外,語(yǔ)音的應(yīng)用范圍還將擴(kuò)展至對(duì)空調(diào)、門(mén)鎖及其他車(chē)輛的控制功能。
NVIDIA DRIVE和Jetson TX2平臺(tái)幫助 SoundHound 分別在汽車(chē)和機(jī)器人應(yīng)用領(lǐng)域?qū)崿F(xiàn)了"Speech-to-Meaning"技術(shù)。
適用于機(jī)器人的 Jetson TX2 開(kāi)發(fā)者工具包
雙重語(yǔ)音識(shí)別方法
SoundHound 采用了一種全新方法來(lái)提供快速的語(yǔ)音識(shí)別服務(wù)。該公司的系統(tǒng)采用的是本地識(shí)別模型和遠(yuǎn)程識(shí)別引擎雙重語(yǔ)音識(shí)別方法,并已獲得專利。SoundHound 的混合工程設(shè)計(jì)利用 NVIDIA Drive 的 GPU 來(lái)更快地處理語(yǔ)音查詢。
SoundHound 提供的雙重方法實(shí)現(xiàn)了對(duì)車(chē)輛中語(yǔ)音查詢的實(shí)時(shí)響應(yīng),改變了傳統(tǒng)語(yǔ)音系統(tǒng)的“蝸”速問(wèn)題。
正是這種獨(dú)創(chuàng)性使得 AI 應(yīng)用到了網(wǎng)絡(luò)終端產(chǎn)品中。過(guò)去,嵌入式技術(shù)只能識(shí)別少量詞匯,并且速度和準(zhǔn)確性較低。然而,SoundHound 通過(guò)利用 NVIDIA GPU 運(yùn)行大量詞匯來(lái)快速、準(zhǔn)確地識(shí)別語(yǔ)音和理解自然語(yǔ)言。
SoundHound 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Keyvan Mohajer 說(shuō):“我們利用 NVIDIA DRIVE 平臺(tái)創(chuàng)建了嵌入式版本系統(tǒng),從而將可識(shí)別自然語(yǔ)言的字?jǐn)?shù)增加到了一百多萬(wàn)字。它的速度非常快,而且可擴(kuò)展。”
在機(jī)器人領(lǐng)域,Mayfield Robotics 正在開(kāi)發(fā)可使用 Houndify 的 Kuri 機(jī)器人以實(shí)現(xiàn)語(yǔ)音交互,從而使人們可以與機(jī)器人互動(dòng)并向其發(fā)號(hào)施令。
在電器領(lǐng)域,開(kāi)發(fā)人員利用 Houndify 在 Sure Immersion 咖啡機(jī)上展示了一個(gè)參考模型,通過(guò)“好的,咖啡師”這一語(yǔ)音提示可喚醒咖啡機(jī)。客戶可以使用語(yǔ)音指令來(lái)操作機(jī)器制作咖啡,還可以在等待咖啡沖泡時(shí)搜索天氣、體育和其他信息。
SoundHound 使用 NVIDIA GPU 訓(xùn)練神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí),并基于 GPU 運(yùn)行著自己的數(shù)據(jù)中心。該公司在數(shù)千臺(tái)服務(wù)器上進(jìn)行自然語(yǔ)言處理,并且可以處理數(shù) TB 的數(shù)據(jù)。
Mohajer 說(shuō):“曾經(jīng)可能需要幾個(gè)月才能完成的工作,現(xiàn)在只需幾天便可完成,這都要?dú)w功于 GPU。如果沒(méi)有 GPU,這個(gè)行業(yè)將無(wú)法前行。”
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5594瀏覽量
109759 -
gpu
+關(guān)注
關(guān)注
28文章
5194瀏覽量
135483 -
語(yǔ)音識(shí)別
+關(guān)注
關(guān)注
39文章
1812瀏覽量
116058
原文標(biāo)題:NVIDIA GPU 助力 SoundHound 深耕語(yǔ)音 AI 市場(chǎng)
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程
NVIDIA DGX Spark桌面級(jí)AI超級(jí)計(jì)算機(jī)助力開(kāi)發(fā)者構(gòu)建AI模型
利用NVIDIA Cosmos開(kāi)放世界基礎(chǔ)模型加速物理AI開(kāi)發(fā)
NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試
MediaTek攜手NVIDIA開(kāi)啟個(gè)人AI算力新紀(jì)元
NVIDIA Isaac Lab多GPU多節(jié)點(diǎn)訓(xùn)練指南
NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品
睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級(jí)
NVIDIA Jetson AGX Thor開(kāi)發(fā)者套件概述
安森美助力NVIDIA AI系統(tǒng)檢測(cè)實(shí)驗(yàn)室
NVIDIA技術(shù)助力企業(yè)創(chuàng)建主權(quán)AI智能體
NVIDIA計(jì)劃打造全球首個(gè)工業(yè)AI云平臺(tái)
NVIDIA虛擬GPU 18.0版本的亮點(diǎn)
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開(kāi)發(fā)
NVIDIA 推出開(kāi)放推理 AI 模型系列,助力開(kāi)發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)
NVIDIA GPU助力SoundHound開(kāi)發(fā)語(yǔ)音AI市場(chǎng)
評(píng)論