国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TensorFlow再填新功能!谷歌宣布推出TensorFlow.Text

DPVg_AI_era ? 來源:lq ? 2019-06-15 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌發布TensorFlow優化新功能TF.Text庫,可對語言文本AI模型進行周期性預處理,大大節約了AI開發者對文本模型的訓練時間,簡化訓練流程。

TensorFlow再填新功能!

谷歌宣布推出TensorFlow.Text,這是一個利用TensorFlow對語言文本模型進行預處理的庫。TF官博第一時間發布了更新消息,并對TF.Text的新功能和特性進行了簡要介紹。

TensorFlow一直以來致力于為用戶提供更廣泛的選擇,幫助用戶利用圖像和視頻數據構建模型。但是,許多模型是以文本開頭的,從這些模型構建的語言模型需要進行一些預處理,才能將文本輸入到模型中。比如關于使用IMDB數據集的文本分類教程,就是從已經轉換為整數ID的文本數據開始入手的。

如果模型訓練和推理的時間不一樣,在訓練過程以外完成的預處理可能會和模型產生偏差,這就需要額外投入更多的時間和精力對預處理的過程進行協調。

TensorFlow本次推出的TF.Text就是為了解決這個問題,TF.Text是一個TensorFlow 2.0庫,可以使用PIP命令輕松安裝。它可以在基于文本的模型中定期執行這些預處理過程,并提供TensorFlow核心組件中并未提供的、關于語言建模的更多功能和操作。

其中最常見的功能就是文本的詞條化(tokenization)。詞條化是將字符串分解為token的過程。這些token可能是單詞、數字和標點符號,或是上述幾種元素的組合。

TF.Text的Tokenizer使用RaggedTensors,這是一種用于識別文本的新型張量。

三個新的Tokenizer,系統解決文本AI模型預訓練問題

TF.Text提供了三個新的tokenizer。其中最基本的是空白tokenizer,可以在ICU定義的空白字符(例如空格,制表符,換行符)上拆分UTF-8字符串。

tokenizer=tensorflow_text.WhitespaceTokenizer()tokens = tokenizer.tokenize(['everything not saved will be lost.', u'Sad?'.encode('UTF-8')])print(tokens.to_list())

[['everything', 'not', 'saved', 'will', 'be', 'lost.'], ['Sadxe2x98xb9']]

此次發布的初始版本還包括一個面向unicode腳本的tokenizer,可以根據Unicode腳本邊界拆分UTF-8字符串。值得注意的是,它和空白tokenizer很類似,最明顯的區別在于后者可以從標準文本(如USCRIPT_LATIN,USCRIPT_CYRILLIC等)中分割出標點符號。

tokenizer = tensorflow_text.UnicodeScriptTokenizer()tokens = tokenizer.tokenize(['everything not saved will be lost.', u'Sad?'.encode('UTF-8')])print(tokens.to_list())

[['everything', 'not', 'saved', 'will', 'be', 'lost', '.'], ['Sad', 'xe2x98xb9']]

TF.Text中提供的最后一個tokenizer是一個Wordpiece tokenizer。這是一個無監督的tokenizer,需要一個預先確定的詞匯表,進一步將token分成子詞(前綴和后綴)。Wordpiece常用于谷歌的BERT模型。

def_CreateTable(vocab,num_oov=1): init = tf.lookup.KeyValueTensorInitializer( vocab, tf.range(tf.size(vocab, out_type=tf.int64), dtype=tf.int64), key_dtype=tf.string, value_dtype=tf.int64) return tf.lookup.StaticVocabularyTable( init, num_oov, lookup_key_dtype=tf.string)vocab_table = _CreateTable(["great", "they", "the", "##'", "##re", "##est"])tokens = [["they're", "the", "greatest"]]tokenizer = tensorflow_text.WordpieceTokenizer( vocab_table, token_out_type=tf.string)result = tokenizer.tokenize(tokens)print(result.to_list())

[[['they', "##'", '##re'], ['the'], ['great', '##est']]]

每個Tokenizer都在UTF-8編碼的字符串上進行標記,并提供了將字節偏移量轉換為原始字符串的選項。調用者可以了解創建的token的原始字符串中的字節對齊。

此外,TF.Text庫還包括歸一化、n-gram和標記序列約束等功能。

新功能組件密集發布,TensorFlow大家庭日益完善

有關更深入的實例,可以查看Colab notebook內容,其中包含許多本文中未討論的新的可用操作的各種代碼段。未來計劃繼續提供更多新工具,讓使用TensorFlow構建語言模型變得更加方便。

今年上半年,谷歌陸續發布了多個基于TensorFlow的新功能和新組件。5月,谷歌發布TensorFlow Graphics,讓機器學習與圖形和3D模型的關系更加密切。今年3月,谷歌發布旨在增強隱私保護的終端設備機器學習方法TensorFlow Federated。此外,TensorFlow框架面向JavaScript和iOS開發者的版本TensorFlow.js和TensorFlow Swift也于今年春天發布。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111432
  • 模型
    +關注

    關注

    1

    文章

    3753

    瀏覽量

    52116
  • tensorflow
    +關注

    關注

    13

    文章

    334

    瀏覽量

    62193

原文標題:TensorFlow官宣新功能TF.Text:攻克語言AI模型預處理偏差難題

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    谷歌評論卡,碰一碰即可完成谷歌評論 #谷歌評論卡 #NFC標簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發布于 :2026年01月15日 17:02:00

    如何在TensorFlow Lite Micro中添加自定義操作符(1)

    相信大家在部署嵌入式端的AI應用時,一定使用過TensorFlow Lite Micro,以下簡稱TFLm。TFLm 是專為微控制器和嵌入式設備設計的輕量級機器學習推理框架,它通過模塊化的操作符系統
    的頭像 發表于 12-26 10:34 ?5348次閱讀

    VIAVI Xgig 5P16推出新功能,完善PCIe5.0測試需求

    VIAVI Xgig 5P16推出新功能,完善了PCIe5.0測試需求。Xgig 5P16分析儀/協議訓練器提供16通道全速數據捕獲和錯誤注入,可對PCIe協議進行詳細的功能和性能分析。
    的頭像 發表于 12-17 16:25 ?326次閱讀
    VIAVI Xgig 5P16<b class='flag-5'>推出</b>全<b class='flag-5'>新功能</b>,完善PCIe5.0測試需求

    Amazon Connect發布多項Agentic AI新功能 打造無縫客戶體驗

    亞馬遜云科技在2025 re:Invent全球大會上,宣布Amazon Connect推出多項Agentic AI新功能,覆蓋四大領域:可在語音與數字渠道自主執行操作的自動化AI Agent;可
    的頭像 發表于 12-05 15:51 ?469次閱讀

    芯原與谷歌聯合推出開源Coral NPU IP

    芯原股份近日宣布谷歌聯合推出面向始終在線、超低能耗端側大語言模型應用的Coral NPU IP。
    的頭像 發表于 11-13 11:24 ?607次閱讀
    芯原與<b class='flag-5'>谷歌</b>聯合<b class='flag-5'>推出</b>開源Coral NPU IP

    【上海晶珩睿莓1開發板試用體驗】將TensorFlow-Lite物體歸類(classify)的輸出圖片移植到LVGL9.3界面中

    既然調通了TensorFlow-Lite物體歸類(classify)和LVGL9.3代碼,那么把這兩個東西結合起來也是沒問題的,需要注意的是,TensorFlow-Lite是C++代碼,而
    發表于 09-21 00:39

    【上海晶珩睿莓1開發板試用體驗】TensorFlow-Lite物體歸類(classify)

    目前尚未得知睿莓1開發板上面有NPU或者DPU之類的額外處理器,因此使用樹莓派系列使用最廣泛的TensorFlow-Lite庫進行物體歸類,使用CPU運行代碼,因此占用的是CPU的算力。在
    發表于 09-12 22:43

    蔡司軟件 | ZEISS CALYPSO在航空航天行業的實用新功能

    蔡司軟件 | ZEISS CALYPSO在航空航天行業的實用新功能
    的頭像 發表于 08-08 15:37 ?866次閱讀
    蔡司軟件 | ZEISS CALYPSO在航空航天行業的實用<b class='flag-5'>新功能</b>

    API如何加速電商新功能上線

    ? 在電子商務領域,競爭日益激烈,用戶需求變化迅速。企業必須快速推出新功能,如個性化推薦、實時庫存更新或無縫支付體驗,以保持競爭力。傳統開發模式往往耗時費力,但通過應用編程接口(API),電商企業能
    的頭像 發表于 07-18 10:21 ?487次閱讀
    API如何加速電商<b class='flag-5'>新功能</b>上線

    無法將Tensorflow Lite模型轉換為OpenVINO?格式怎么處理?

    Tensorflow Lite 模型轉換為 OpenVINO? 格式。 遇到的錯誤: FrontEnd API failed with OpConversionFailure:No translator found for TFLite_Detection_PostProcess node.
    發表于 06-25 08:27

    【HarmonyOS 5】應用更新功能詳解

    與迭代需求的優選方案。這類彈窗主要用于向用戶推送新版本更新通知,而在引導用戶完成更新操作的實現層面,HarmonyOS 提供了完善的應用市場能力支撐,例如本文所介紹的 updateManager(更新功能
    發表于 06-22 18:44

    信捷電氣XDPPro V3.8.0版本的五大創新功能

    作為信捷XD、XL、XG系列PLC的編程軟件,XDPPro始終以工程師的需求為核心,聚焦編程效率、硬件配置與協作體驗,此次V3.8.0版本將推出五大創新功能,助您輕松應對復雜工程挑戰。
    的頭像 發表于 05-23 16:03 ?1767次閱讀
    信捷電氣XDPPro V3.8.0版本的五大創<b class='flag-5'>新功能</b>

    通孔電鍍孔工藝研究與優化

    為了提高高密度互連印制電路板的導電導熱性和可靠性,實現通孔與盲孔同時孔電鍍的目的,以某公司已有的電鍍盲孔工藝為參考,適當調整盲孔電鍍液各組分濃度,對通孔進行孔電鍍。
    的頭像 發表于 04-18 15:54 ?2264次閱讀
    通孔電鍍<b class='flag-5'>填</b>孔工藝研究與優化

    FlexBuild構建Debian 12,在“tflite_ethosu_delegate”上構建失敗了怎么解決?

    /components_lsdk2412/apps/ml/tflite/tensorflow/../third_party/absl/workspace.bzlCMake Warning
    發表于 04-01 06:53

    用樹莓派搞深度學習?TensorFlow啟動!

    介紹本頁面將指導您在搭載64位Bullseye操作系統的RaspberryPi4上安裝TensorFlowTensorFlow是一個專為深度學習開發的大型軟件庫,它消耗大量資源。您可以在
    的頭像 發表于 03-25 09:33 ?1212次閱讀
    用樹莓派搞深度學習?<b class='flag-5'>TensorFlow</b>啟動!