国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

浮點庫應用,你也有困惑嗎?

恩智浦MCU加油站 ? 來源:未知 ? 2023-12-21 08:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天小編想要給大家帶來的是最近在調試一個項目時候發現的怪事,同樣的函數庫在使用不同的IDE時,得到的運行結果竟然是不一致的。相信眼尖的讀者朋友已經從標題中猜出一二了,正是因為庫中依賴了浮點計算庫所導致的問題。那么就請和小編一起,探究下詳細的來龍去脈吧!

項目背景

首先再詳細描述以下項目背景:我們使用了一個由GCC工具鏈構建的函數庫,編譯器選項為-mfloat-abi=hard,即在編譯時,使能了硬件浮點單元指令加速。但在我們將該庫與Keil項目鏈接后,發現結果不正確。當然,我們最先懷疑的當然是庫編譯的有問題啦。但是奇怪的事情發生了,我當我們使用GCC工具鏈鏈接編譯相同的工程,并運行后,得到了正確的結果。那么可以基本確定,庫應該是沒有問題的。那么問題出在哪呢?

問題分析

由于小編所拿到的庫并不包含調試信息,只能通過一些技術手段進行破解。通過反匯編庫代碼,我們發現庫依賴了一些浮點計算庫的C函數,如sqrtf、expf等,為了簡便,讓我們稱之為xxf函數,由于GCC并沒有提供其具體實現,因此需要由庫的使用者鏈接這些函數,而經過進一步的debug,我們發現這些函數導致了錯誤的結果,換句話說,這些函數的返回值是錯的。

問題調試

那就有意思了,為了簡單起見,讓我們先編寫一段簡單的測試代碼來復現這個問題,代碼很簡單,我們直接定義一個開平方根的函數:

#include "math.h"

float calc_sqrt(float a){

return sqrtf(a);

}

使用gcc工具鏈對其進行編譯:

arm-none-eabi-gcc.exe -mcpu=cortex-m7 -mthumb -mfpu=fpv5-sp-d16 -mfloat-abi=hard test.c -fshort-wchar -c -o test.o

隨后,隨便找到一個Keil的測試工程,我們這里選擇一個Hello_World示例工程,將編譯出來的.o文件添加到工程中:

wKgZomWDjhGANp5cAABcyFsEcJc683.png

并在主程序中添加調用代碼:

float calc_sqrt(float a)

volatile float a = calc_sqrt(4.0f);

編譯鏈接下載程序,并讓程序停在函數調用處:

wKgZomWDjhKAUXnTAADNmNIH8Rw407.png

單步進入calc_sqrt函數內部,到這里,我們可以發現對這些函數的調用順序是正確的。通過將參數傳遞給S0(對于float)如下所示,S0中寸的就是待計算的數據4.0f:

wKgZomWDjhKAcUdQAAFHqs3OJMk254.png

wKgZomWDjhKAbZ7dAAA743Nmdr0045.png

看起來好像沒有問題,再進一步現在讓我們檢查由Keil鏈接的sqrtf函數的匯編實現:

wKgZomWDjhKAF50tAADszXvbpi8487.png

相信大家發現了奇怪的事情了,鏈接的sqrtf將S0中的值傳遞給S0,而此時R0的值其實為0,但正如之前所說,浮點值已經由庫的代碼傳遞給了S0。因此,由于S0中實際要計算的值被臨時替換了,就導致了一個錯誤的結果。

wKgZomWDjhKAFognAABSVmp7PxU258.png

這里要強調一下,如果在Keil中直接調用sqrtf時候,或是使用keil編譯器所編譯出來的.o文件,Keil運行時庫會使用“__hardfp_sqrtf”作為sqrtf的混淆名稱:

wKgZomWDjhKAZvr5AACqgxPX2Ic445.png

而因為我們所使用庫來自GCC工具鏈,因此Keil并不會對其進行替換,而是會將C庫中叫做sqrtf的函數直接鏈接進去,而這個函數的默認實現,是使用R0作為參數傳遞的寄存器。這也就導致,實際要被計算的數丟失,最終導致結果計算錯誤。

那么怎么解決這個問題,讓keil不去鏈接這個奇怪的sqrtf呢,這就要用到Keil的一個小技巧了:

float $Sub$$sqrtf(float a){

return __builtin_sqrtf(a);

}

這樣一來,調用sqrtf函數的地方,就會編程對$Sub$$sqrtf的調用:

wKgZomWDjhKAMFbbAAE1zkGftN4411.png

wKgZomWDjhOACcEzAAIb8mxu1DA400.png

而結果也變為正確的結果2.0了:

wKgZomWDjhOAJ6olAABTCNVByDY135.png

當然,大家可能會想啊,那我開了gcc優化之后,是不是就可以自動展開sqrtf了呢?讓我們來看看:

arm-none-eabi-gcc.exe -mcpu=cortex-m7 -mthumb -mfpu=fpv5-sp-d16 -mfloat-abi=hard test.c -fshort-wchar -c -o3 -o test.o

代碼并沒有變化:

wKgZomWDjhOAE65GAAEt3Qti-14440.png

結論

小編想用這個例子和大家說明下,在涉及到跨工具鏈開發時,一定要注意浮點庫的使用或依賴問題,由于不同編譯器對于浮點運算的實現可能有些許不同,會導致意想不到的奇怪問題出現。最好的方案,還是根據不同的工具鏈都構建一個專屬的庫來使用。

END

更多恩智浦AI-IoT市場和產品信息,邀您同時關注“NXP客棧”微信公眾號

wKgZomWDjhOACI5YAABCdkRE230322.jpg ? ? ?

NXP客棧


恩智浦致力于打造安全的連接和基礎設施解決方案,為智慧生活保駕護航。

長按二維碼,關注我們

恩智浦MCU加油站


這是由恩智浦官方運營的公眾號,著重為您推薦恩智浦MCU的產品信息、開發技巧、教程文檔、培訓課程等內容。

wKgZomWDjhOAHK_FAAATNlPH08Y075.jpg ?

長按二維碼,關注我們


原文標題:浮點庫應用,你也有困惑嗎?

文章出處:【微信公眾號:恩智浦MCU加油站】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • mcu
    mcu
    +關注

    關注

    147

    文章

    18925

    瀏覽量

    398204
  • 恩智浦
    +關注

    關注

    14

    文章

    6095

    瀏覽量

    147336

原文標題:浮點庫應用,你也有困惑嗎?

文章出處:【微信號:NXP_SMART_HARDWARE,微信公眾號:恩智浦MCU加油站】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    什么是KEIL的微(microlib)

    就是下面這個選項: Microlib是什么Microlib也是一個C語言的。它是為了小內存的嵌入式系統設計的,用于代替標準C語言,但是Microlib對標準C語言進行了裁剪和優化,因此并不
    發表于 12-10 06:27

    如何使用 ARM FPU 加速浮點計算?

    之前的文章:浮點數在計算機中的存儲 —— IEEE 754標準[1](可點擊閱讀原文查看)。 二、浮點支持軟件fplib 1. fplib介紹ARM Cortex-M處理器中計算浮點
    發表于 11-19 06:51

    浮點指令(三)

    浮點指令以及簡單解釋 fcvt.s.d fcvt.s.d rd, rs1, rs2//f[rd] = f32f64(f[rs1]) 雙精度向單精度浮點轉換(Floating-point
    發表于 10-24 13:38

    浮點指令(二:雙精度)

    浮點指令以及簡單解釋 fadd.d fadd.d rd, rs1, rs2//f [rd] = f [rs1] + f [rs2] 雙精度浮點加(Floating-point Add
    發表于 10-24 13:00

    浮點指令(一:單精度)

    浮點指令以及簡單解釋 fadd.s fadd.s rd, rs1, rs2//f [rd] = f [rs1] + f [rs2] 單精度浮點加(Floating-point Add
    發表于 10-24 11:42

    浮點指令(七:寄存器)

    UFunderflow NXinexact,不精確根據IEEE-754標準,浮點運算需要指定舍入模式(rounding mode),這有助于確定誤差范圍和編寫數值。最準確且最常見的舍入模式是舍入到最近的偶數(RNE
    發表于 10-24 08:28

    浮點指令擴展中部分問題的解決與分享

    經過數周的前期準備與研讀代碼,我們組終于正式開始對浮點指令進行擴展并不出意外地遇到了一些小問題,本篇文章針對這些問題作出解決方法的分享。 一. 在e203_exu_decode中,發現變量
    發表于 10-24 08:14

    浮點舍入模式介紹(六)

    浮點舍入模式 為什么要舍入? 因為單精度浮點數只取23位尾數(除去隱藏位),而一些運算不可避免的得到的尾數會超過23位,因此需要考慮舍入。 根據 IEEE-754 標準, 浮點數運算需要指定舍入
    發表于 10-24 07:57

    (九)浮點乘法指令設計

    浮點乘法算法 設a = {sa,ea,fa},b = {sb,eb,fb}為兩個IEEE754單精度浮點數,試計算c = {sc,ec,fc} = a b。c的絕對值|c| = |a||b
    發表于 10-24 07:11

    Whetstone代碼涉及的浮點指令匯編分析

    對benchmark中的whetstone進行代碼分析,通過反匯編統計所出現的浮點指令,共有26種,如下 特點是只涉及單精度的浮點指令,并且存在有浮點Load/Store的壓縮指令,還有一些偽代碼不過不影響
    發表于 10-22 08:11

    浮點運算單元的設計和優化

    浮點運算單元的設計和優化可以從以下幾個方面入手: 1.浮點寄存器設計:為了實現浮點運算指令子集(RV32F或者RV32D),需要添加一組專用的浮點寄存器組,總共需要32個通用
    發表于 10-22 07:04

    risc-v中浮點運算單元的使用及其設計考慮

    RISC-V浮點運算單元(floating-point unit,簡稱FPU)是一種專門用于執行浮點運算的硬件加速器,其作用是提高浮點運算速度,在科學計算、圖像處理和機器學習等應用領域有著廣泛
    發表于 10-21 14:46

    RISCV F擴展簡介——浮點寄存器

    寄存器之間傳輸數據。同時也有一些指令用于整數寄存器和浮點寄存器之間的直接數據交互。 上圖為浮點寄存器,浮點寄存器與通用整數寄存器基本一致,唯一的區別在于其f0寄存器不需要硬件接0.
    發表于 10-21 08:50

    gcc工具鏈無法匯編硬件浮點指令fsqrt問題

    團隊在項目推進過程中發現,Linux環境下,math中的sqrt()函數無論是在浮點數的gcc工具鏈中還是整數的gcc工具鏈中,綜合的結果都是以整數指令來模擬。 若果想要進一步地節約時間,我們
    發表于 10-20 06:19

    HAL和標準會選擇哪種

    HAL和標準會選擇哪種
    發表于 03-10 06:25