国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用NVIDIA NeMo生成高質量的語音識別標簽

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-27 09:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

使用 NVIDIA NeMo 和 標簽工作室 中的自動語音識別( ASR )模型處理音頻數據時,可以節省時間并產生更準確的結果。

NVIDIA NeMo 提供了可重用的神經模塊,使得創建新的神經網絡架構變得容易,包括 ASR 的預構建模塊和現成模型。借助 NVIDIA NeMo 的強大功能,您可以從預訓練語音識別模型中獲得音頻轉錄。添加 labelstudio 及其開源數據標記功能,您可以進一步提高轉錄質量。

解決方案

poYBAGJomUSASBfSAAAy2POsRYU582.jpg

圖 1 使用 Label Studio 和 NeMo 注釋和更正轉錄本的 ASR 工作流。

按照本文中的步驟使用 Label Studio 設置 NVIDIA NeMo ASR ,以生成高質量的音頻轉錄本。

連接 NVIDIA NeMo 模型,在 Label Studio 中自動轉錄音頻文件。

設置音頻轉錄項目。

從 Label Studio 驗證和導出修訂的音頻轉錄本。

微調 NeMo ASR 模型與修改后的音頻轉錄從標簽工作室。

先決條件

開始之前,請確保您擁有以下資源:

音頻數據文件。 此音頻 MIG 可以是客戶服務電話、電話訂單、銷售對話的錄音,也可以是其他與人交談的錄音。音頻文件必須采用以下文件格式之一:

WAV

AIFF

MP3

AU

FLAC

已安裝 Label Studio 。 在本地計算機或云服務器上使用首選方法安裝 Label Studio 。有關更多信息,請參閱 Label Studio 文檔中的 Quickstart 。

NeMo 工具箱已安裝

免費音頻數據

如果您沒有任何音頻數據,可以使用示例數據集或歷史音頻數據集:

LJ 語音數據集 是非小說類書籍段落的公共域數據集。

Librispeech 還提供了一個 基于開放 SLR 的開源 ASR 語料庫 。

您可以使用許多其他 ASR 數據集。有關詳細信息,請參閱 數據集 – 簡介 。您還可以使用國會圖書館網站上的公共域錄音集,如 美國棒球運動員訪談錄 。

確定要轉錄的音頻后,就可以開始處理它了。

安裝 Label Studio ML 后端

安裝 Label Studio 后,請安裝 Label Studio 機器學習后端。從命令行運行以下命令:

git clone https://github.com/heartexlabs/label-studio-ml-backend 

設置環境:

cd label-studio-ml-backend

# Install label-studio-ml and its dependencies
pip install -U -e .

# Install the nemo example dependencies
pip install -r label_studio_ml/examples/requirements.txt

連接 NVIDIA NeMo 模型,在 Label Studio 中自動轉錄音頻文件

要使用預先訓練的 ASR 模型的預測對數據進行預標記,請在 Label Studio 中將 NeMo 工具箱設置為機器學習后端。 Label Studio 機器學習后端允許您使用預先訓練的模型來預標記數據。

Label Studio 包括使用 利用 NGC 云中的 NeMo 開發的預訓練 QuartzNet15x5 模型 的 一個例子 ,但是如果另一個模型更適合,您可以用您的數據設置一個不同的模型。有關更多信息,請參閱 NeMo 提供的 ASR 型號列表 。

在命令行中,將 NeMo 設置為機器學習后端,并使用該模型啟動一個新的 Label Studio 項目。

安裝 NeMo 工具箱 在 Docker 容器中或使用 pip 。

下載 NeMo ASR 模型。提供的 Label Studio 示例腳本從 NGC 云下載預先訓練的 QuartzNet 模型。要使用不同的模型,請從 NGC 下載該模型。

從命令行啟動 Label Studio 機器學習后端。

label-studio-ml init my_model --from label_studio_ml/examples/nemo/asr.py

啟動機器學習后端。默認情況下,模型在本地主機上以端口 9090 啟動。

label-studio-ml start my_model

用模型啟動 Label Studio 。

label-studio start my_project --ml-backends http://localhost:9090

設置音頻轉錄項目

啟動 Label Studio 后,導入音頻數據并設置正確的模板來配置標簽。 VZX19 是自動語音識別的最佳選擇,它使音頻數據的注釋變得容易。

打開 Label Studio ,導入數據,然后選擇模板。

選擇 Import 并以純文本或 JSON 文件的形式導入音頻數據,這些文件引用在線存儲(如 Amazon S3 )中托管的音頻文件的有效 url 。

2 從 Tasks 列表中,選擇 Settings 。

3 在 標簽界面 選項卡上,瀏覽模板并選擇 自動語音識別 模板。

4 選擇 Save 。

驗證并輸出模型預測

作為注釋器,檢查任務界面上音頻數據的任務并驗證。如有必要,糾正 NeMo 語音模型預測的轉錄本。

從 Label Studio 中的任務列表中,選擇 Label 。

對于每個音頻樣本,聆聽音頻并回顧 NeMo 模型產生的轉錄,作為預標記過程的一部分。

如果成績單中有任何單詞不正確,請更新。

保存對成績單的更改。選擇 Submit 提交成績單并查看下一個音頻樣本。

接下來,按照 NVIDIA NVIDIA 文檔中的 NeMo ASR 集合 所述,以 NeMo 模型所期望的正確格式從 Label Studio 導出完成的音頻轉錄本。

要導出完成的音頻,請執行以下操作:

從 Label Studio 中的任務列表中,選擇 Export 。

選擇名為 ASR_MANIFEST 的音頻轉錄 JSON 格式。

有關 Label Studio 中可用導出格式的詳細信息,請參閱 從 Label Studio 導出結果 。

使用高質量的成績單來微調您的 ML 模型

當您處理完音頻并調整完轉錄的文本后,剩下的是音頻轉錄本,您可以用來重新培訓 NeMo 中包含的 ASR 模型。 Label Studio 生成與 NeMo 培訓完全兼容的注釋。

要更新 QuartzNet 模型檢查點,您可以在幾行代碼中完成,從頭開始訓練模型,或者使用 PyTorch Lightning 。例子也可以在 NeMo Jupyter 筆記本中找到。

通過同時使用 Label Studio 和 NeMo ,您可以節省從頭開始處理每個音頻文件的時間 NeMo 可以立即為您提供高度準確的預測,而 Label Studio 可以幫助您實現完美的預測 今天就試試 !

關于作者

Nikolai Liubimov是Heartex的CTO。 完成博士學位后 他在CS擔任機器學習研究員,后來進入該行業,并花了10年的時間將深度學習技術應用于現實世界中的問題。 這項經驗為當前缺少哪些工具提供了寶貴的見解,從而創建了一家初創公司來幫助數據科學和機器學習工程團隊構建和改進其ML模型。

Sarah Moir是Heartex的產品內容和教育主管,為Heartex的數據注釋和標簽解決方案撰寫文檔,博客文章和教育教程。 薩拉(Sarah)在過去的八年中一直是數據和安全領域的技術作家,并且對數據分析,機器學習和編寫充滿熱情。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109743
  • 計算機
    +關注

    關注

    19

    文章

    7807

    瀏覽量

    93203
  • 服務器
    +關注

    關注

    14

    文章

    10253

    瀏覽量

    91493
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    聲智科技亮相2026海淀區經濟社會高質量發展大會

    近日,海淀區高質量發展大會隆重召開。聲智科技作為深耕聲學AI模型技術創新及AI全棧產品商業化落地的AI應用標桿企業受邀出席大會。聲智科技不僅致力于突破物理AI技術的“天花板“,更通過硬核終端的規模化產出,將技術勢能轉化為高質量發展的產值動能。
    的頭像 發表于 03-04 17:42 ?1411次閱讀

    鴻利智匯榮獲2025年度廣州花都高質量發展“蛟龍榜”科技創新企業獎

    日前,廣州市花都區召開高質量發展大會,認真落實全省、全市高質量發展大會部署要求,堅持以經濟建設為中心,奮力在“十五五”開局之年展現新作為、拼出新氣象。會上,花都區為2025年高質量發展企業頒發獎項,鴻利智匯集團股份有限公司作為科
    的頭像 發表于 03-04 14:09 ?171次閱讀

    廣電計量榮獲番禺區高質量發展企業服務先進集體

    2月26日,緊隨全省、全市“新春第一會”的腳步,廣州市番禺區高質量發展大會在龍沙港召開。大會深入貫徹落實省、市高質量發展大會部署要求,以“奮力實施第二個‘萬畝千億’產業攻城拔寨,工商并舉打造番禺先進
    的頭像 發表于 02-28 16:46 ?1661次閱讀

    廣汽集團召開2026年高質量發展大會

    2月26日,廣汽集團2026年高質量發展大會在番禺總部召開。會議全面傳達貫徹省市高質量發展大會精神,系統部署2026年高質量發展重點工作,動員全體干部員工以“開工即開戰、起步即沖刺”的奮斗姿態,奮力
    的頭像 發表于 02-28 14:34 ?458次閱讀

    聯合光電榮獲2025巢湖上市公司高質量發展大會科技創新獎

    12月7日,在2025巢湖上市公司高質量發展大會上,聯合光電憑借在光學科技領域的持續創新與硬核實力,榮獲大會頒發的“科技創新獎”。這一權威獎項,是對聯合光電以創新驅動高質量發展的高度認可。
    的頭像 發表于 12-09 09:16 ?718次閱讀

    廣電計量創新服務體系助力商業航天高質量發展

    近日,國家航天局正式印發《推進商業航天高質量安全發展行動計劃(2025—2027年)》(以下簡稱《行動計劃》),明確將商業航天納入國家航天發展總體布局,提出到2027年實現產業規模顯著壯大、創新活力
    的頭像 發表于 11-27 17:22 ?1299次閱讀

    PCBA工程師必看:高質量BOM的5個‘隱形規則’

    一站式PCBA加工廠家今天為大家講講PCBA加工中高質量BOM要求有哪些?PCBA加工中高質量BOM的5大核心要素。在PCBA加工中,高質量的物料清單(BOM)是保障生產零失誤的核心工具。它不
    的頭像 發表于 10-17 09:18 ?847次閱讀

    躍昉科技出席2025橫琴粵澳深度合作區企業高質量發展大會

    8月29日,橫琴粵澳深度合作區企業高質量發展大會暨“育苗培優”計劃啟動儀式在橫琴隆重舉行。
    的頭像 發表于 09-02 16:15 ?885次閱讀

    索尼重載設備的高質量遠程制作方案和應用(2)

    索尼的遠程制作可以被稱之為制作級的高質量遠程制作,或重載設備的高質量遠程制作,遠程設備結合常規系統設備,提供和本地制作類似的制作級高質量圖像,延續電視臺/制作公司的設備特點和優勢。
    的頭像 發表于 08-21 15:56 ?1226次閱讀
    索尼重載設備的<b class='flag-5'>高質量</b>遠程制作方案和應用(2)

    索尼重載設備的高質量遠程制作方案和應用(1)

    最近的各地體育活動中,索尼提供了多種產品和系統方案進行測試和使用,其中將攝像機用于轉播場地的集中式遠程制作方式是常用方式。索尼專業解決方案突出制作級質量的優勢,具有圖像高質量,低碼率,低延時特點,能提供不一樣的高質量遠程制作。
    的頭像 發表于 08-21 15:55 ?941次閱讀
    索尼重載設備的<b class='flag-5'>高質量</b>遠程制作方案和應用(1)

    大模型時代,如何推進高質量數據集建設?

    高質量數據集,即具備高價值、高密度、標準化特征的數據集合。 在AI領域,高質量數據集地位舉足輕重,如同原油經煉化成為汽油驅動汽車,海量原始數據需轉化為高質量數據集,才能助力大模型精準掌握數據特征
    的頭像 發表于 08-21 13:58 ?837次閱讀

    從芯片到主板,科技創新實現高質量發展

    數字化時代,科技的迅猛發展深刻影響著各個領域。從芯片到主板的集成,生動展現了科技創新如何成為推動高質量發展的核心動力。
    的頭像 發表于 07-26 16:26 ?835次閱讀

    新能源變革之路,要建在“高質量”的路基上

    高質量”是能源革命的前提與基座
    的頭像 發表于 06-24 11:42 ?2483次閱讀
    新能源變革之路,要建在“<b class='flag-5'>高質量</b>”的路基上

    淺析:數字經濟時代,高質量數據集對AI產業帶來哪些新的變化

    大模型技術不斷取得突破,其中大規模高質量訓練數據的投入,起到了關鍵作用,也進一步將?“以數據為中心的人工智能”?推向一個新階段。從早期簡單的圖像識別語音識別,到如今復雜的自然語言處理
    的頭像 發表于 05-09 15:10 ?1107次閱讀

    企業使用NVIDIA NeMo微服務構建AI智能體平臺

    已發布的 NeMo 微服務可與合作伙伴平臺集成,作為創建 AI 智能體的構建模塊,使用商業智能與強大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務。
    的頭像 發表于 04-27 15:05 ?1287次閱讀