国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

恩智浦如何在邊緣設備上部署LLM

NXP客棧 ? 來源:NXP客棧 ? 2024-11-29 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近來,與AI相關的周期性熱點幾乎都圍繞著大語言模型 (LLM) 和生成式AI模型,這樣的趨勢反映出這些話題近年來日益增強的影響力和普及程度。與大語言模型和生成式AI模型相關的應用涵蓋了廣泛的領域,從開放式聊天機器人到任務型助手。雖然LLM主要聚焦基于云和服務器端的應用,但人們對在嵌入式系統和邊緣設備中部署這些模型的興趣也在不斷增加。

嵌入式系統 (如家用電器、工業設備、汽車等設備中的微處理器) 需要在成本和功耗受限的情況下,適應有限的計算能力和內存可用性。這使得在邊緣設備上部署高精度和高性能的語言模型極具挑戰性。

在邊緣設備上部署LLM

在嵌入式解決方案中,利用LLM的一個關鍵領域是操作員與機器之間的自然對話交互,即人機界面 (HMI)。

嵌入式系統可以簡化各種輸入選項,如麥克風、攝像頭或其他傳感器,但大多數系統不會像個人電腦、筆記本電腦和手機那樣,配備完整的鍵盤與LLM模型進行交互。因此,嵌入式系統在使用音頻和視覺作為LLM輸入時,必須具備實用性。這需要一個自動語音識別 (ASR) 或圖像識別和分類的預處理模塊。

同樣,交互的輸出選項也有限。嵌入式解決方案能沒有屏幕,或者不方便用戶閱讀屏幕信息。因此,在生成式AI模型之后,需要一個后處理步驟,使用文本到語音 (TTS) 算法將模型輸出轉換為音頻。

恩智浦正在構建eIQ GenAI Flow,通過添加必要的預處理和后處理模塊,使其成為一個模塊化流程,從而使邊緣生成式AI更加實用。

生成式AI正在改變嵌入式應用。閱讀恩智浦關于檢索增強生成 (RAG) 的白皮書,了解這種方法如何簡化LLM的開發過程,點擊這里>>

通過LLM革新應用

通過集成基于LLM的語音識別、自然語言理解和文本生成功能,嵌入式設備能夠提供更直觀和對話式的用戶體驗。這包括響應語音命令的智能家居設備、通過自然語言控制的工業機械,以及能夠進行免提對話的汽車娛樂中控系統,以指導用戶或操作車內功能等。

LLM還在健康應用中的嵌入式預測分析和決策支持系統中發揮作用。設備可以嵌入使用特定領域數據訓練的語言模型,然后利用自然語言處理分析傳感器數據、識別模式并生成見解,同時在邊緣實時運行并保護患者隱私,無需將數據發送到云端。

應對生成式AI挑戰

在嵌入式環境中部署準確且功能強大的生成式AI模型面臨許多挑戰。需要優化模型的大小和內存使用,使LLM能夠適應目標硬件的資源限制。具有數十億個參數的模型需要數千兆字節的存儲空間,而在邊緣系統中,這可能會帶來高成本且難以實現。量化和修剪等模型優化技術不僅適用于卷積神經網絡,也適用于轉換器模型——這是生成式AI克服模型大小問題的重要方法。

像LLM這樣的生成式AI模型也有知識局限性。例如,它們的理解是有限的,通常會提供不一致的答案,也稱為“幻覺”(hallucination),而且它們的知識受限于訓練數據的時效性。訓練模型或通過再訓練來微調模型可以提高準確性和上下文感知,但這可能在數據收集和所需的訓練計算方面花費巨大。

幸運的是,有需求就有創新;通過檢索增強生成 (RAG) 可以解決這個問題。RAG方法使用特定上下文數據創建知識數據庫,LLM可以在運行時參考這些數據來準確回答查詢。

eIQ GenAI Flow將生成式AI和LLM的優勢以實用的方式應用于邊緣場景。通過將RAG整合到該流程中,我們為嵌入式設備提供特定領域的知識,而不會將用戶數據暴露給原始AI模型的訓練數據。這樣可以確保對LLM的任何更改都是私密的,并且僅在邊緣本地使用。

本文作者

Ali Ors,恩智浦半導體邊緣處理AI機器學習戰略技術主管。Ali專門負責領導各跨職能團隊,為機器學習和視覺處理領域提供創新產品和平臺。他目前在恩智浦負責全球AI機器學習戰略和技術工作。Ali曾在恩智浦汽車業務部負責ADAS和自主產品的AI戰略、戰略伙伴關系和平臺設計。加入恩智浦之前,Ali曾擔任CogniVue公司的工程副總裁,負責開發視覺SoC解決方案和認知處理器IP內核。Ali持有加拿大渥太華卡爾頓大學的工程學學位。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 嵌入式
    +關注

    關注

    5198

    文章

    20442

    瀏覽量

    333986
  • 恩智浦
    +關注

    關注

    14

    文章

    6095

    瀏覽量

    147154
  • LLM
    LLM
    +關注

    關注

    1

    文章

    346

    瀏覽量

    1329
  • 生成式AI
    +關注

    關注

    0

    文章

    538

    瀏覽量

    1085

原文標題:在嵌入式應用中部署生成式AI,恩智浦有個好方法!

文章出處:【微信號:NXP客棧,微信公眾號:NXP客棧】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    攜手COMPREDICT加速邊緣AI在汽車應用落地

    攜手COMPREDICT將邊緣AI帶入汽車應用領域,降低車輛物料清單 (BoM) 成本,助力汽車制造商與一級供應商加速邁向更智能、軟件驅動出行的轉型。
    的頭像 發表于 02-27 14:31 ?1235次閱讀
    <b class='flag-5'>恩</b>智<b class='flag-5'>浦</b>攜手COMPREDICT加速<b class='flag-5'>邊緣</b>AI在汽車應用落地

    與GE醫療在邊緣AI領域達成戰略合作

    半導體宣布與GE醫療達成合作,依托在安全高性能邊緣處理領域的長期技術積淀與GE醫療在醫療技術創新方面的深厚經驗,共同推動
    的頭像 發表于 01-13 11:16 ?3238次閱讀

    推出全新eIQ Agentic AI框架

    半導體宣布推出全新eIQ Agentic AI框架,進一步鞏固其在安全實時邊緣AI領域的領導地位。該工具支持在邊緣設備上直接實現自主智
    的頭像 發表于 01-13 11:15 ?1303次閱讀

    何在NVIDIA Jetson AGX Thor上部署1200億參數大模型

    上一期介紹了如何在 NVIDIA Jetson AGX Thor 上使用 Docker 部署 vLLM 推理服務,以及使用 Chatbox 作為前端調用 vLLM 運行的模型(上期文章鏈接)。本期
    的頭像 發表于 12-26 17:06 ?4814次閱讀
    如<b class='flag-5'>何在</b>NVIDIA Jetson AGX Thor<b class='flag-5'>上部署</b>1200億參數大模型

    迅為如何在RK3576上部署YOLOv5;基于RK3576構建智能門禁系統

    迅為如何在RK3576開發板上部署YOLOv5;基于RK3576構建智能門禁系統
    的頭像 發表于 11-25 14:06 ?1802次閱讀
    迅為如<b class='flag-5'>何在</b>RK3576<b class='flag-5'>上部署</b>YOLOv5;基于RK3576構建智能門禁系統

    完成兩筆重要收購

    日前,半導體宣布已完成對Aviva Links和Kinara的收購,進一步推進智能邊緣的汽車連接和人工智能創新。
    的頭像 發表于 11-04 09:36 ?1058次閱讀

    如何快速在云服務器上部署Web環境?

    如何快速在云服務器上部署Web環境
    的頭像 發表于 10-14 14:16 ?660次閱讀

    DeepSeek模型如何在云服務器上部署

    隨著大型語言模型(LLM)的應用日益普及,許多開發者和企業希望將像DeepSeek這樣的優秀模型部署到自己的云服務器上,以實現私有化、定制化服務并保障數據安全。本文將詳細闡述部署DeepSeek模型
    的頭像 發表于 10-13 16:52 ?935次閱讀

    產品如何賦能邊緣智能發展

    邊緣智能飛速發展,我們需要什么樣的技術引擎加速工業和物聯網創新應用的落地?日前,在深圳舉辦的elexcon深圳國際電子展暨嵌入式展,和IOTE 2025國際物聯網展兩大行業盛會上,與生態合作伙伴攜手,通過一系列創新方案的展
    的頭像 發表于 09-09 16:58 ?1983次閱讀

    何在基于Arm架構的邊緣AI設備上部署飛槳模型

    當 Arm 與領先的開源深度學習平臺強強聯合,會帶來什么?那就是推動創新的“火箭燃料”。Arm 攜手百度,利用雙方在高能效計算平臺與 AI 模型的技術積累,助力廣大開發者加快邊緣 AI 解決方案的開發和部署
    的頭像 發表于 09-06 14:07 ?1089次閱讀

    i.MX 95系列MPU如何賦能邊緣計算

    在本系列博文的第一部分,我探討了i.MX 95系列如何將新功能安全技術應用于工業環境、汽車領域及其他邊緣應用。在接下來的文章中,我將進一步闡述i.MX 95系列如何賦能邊緣計算,
    的頭像 發表于 07-30 11:08 ?2764次閱讀
    <b class='flag-5'>恩</b>智<b class='flag-5'>浦</b>i.MX 95系列MPU如何賦能<b class='flag-5'>邊緣</b>計算

    Arm方案 基于Arm架構的邊緣設備(樹莓派或 NVIDIA Jetson Nano)上部署PyTorch模型

    本文將為你展示如何在樹莓派或 NVIDIA Jetson Nano 等基于 Arm 架構的邊緣設備上部署 PyTorch 模型。
    的頭像 發表于 07-28 11:50 ?2872次閱讀

    何在魔搭社區使用TensorRT-LLM加速優化Qwen3系列模型推理部署

    TensorRT-LLM 作為 NVIDIA 專為 LLM 推理部署加速優化的開源庫,可幫助開發者快速利用最新 LLM 完成應用原型驗證與產品部署
    的頭像 發表于 07-04 14:38 ?2184次閱讀

    eIQ Time Series Studio簡介

    在當今時代,每個傳感器的微小變動和振動峰值都蘊含著重要信息,時間序列數據正成為智能邊緣應用的新前沿。然而,要充分利用這些數據,包括清理、建模和部署,往往需要深厚的專業知識和數周的反復試驗。eIQ
    的頭像 發表于 07-02 14:59 ?1756次閱讀

    【幸狐Omni3576邊緣計算套件試用體驗】DeepSeek 部署及測試

    【幸狐 Omni3576 邊緣計算套件測評】DeepSeek 部署及測試 本文介紹了幸狐 Omni3576 邊緣計算套件實現 DeepSeek 部署及測試的相關流程,包括模型介紹、
    發表于 03-21 19:31