国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

“一億”是“一千萬”的十倍嗎?顯然不是

CAE學習之家 ? 來源:恩宇科技 ? 作者:CAE學習之家 ? 2021-10-28 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

-----1億是1千萬的10倍?-----

早期筆者使用矩量法求解線性方程組,在不使用快速多級方法,自由度達到3萬時,臺式機上已經無法求解出,8G的機器內存不夠用。對于滿秩矩陣的線性方程組,常規求解方法時間復雜度為n^3(n的3次方)。

對于自由度1千萬以下稀疏矩陣的求解,好的臺式機基本能應付,而當自由度達到1億的時候,簡單的將硬件乘以10倍完全不能滿足要求。因為計算的空間復雜度,時間復雜度并不是線性,通常是NlogN,N^2或者更高。當自由度達到1億時,不僅需要對硬件核心部件CPU,內存擴容,而且在磁盤陣列,I/O,并發計算,GPU,網絡,帶寬等方面都提出了更苛刻的要求。

算法方面看,減少網格密度,在物理量梯度大的地方加密,無變化的地方將網格變稀疏,可以有效減少計算量;另外優化求解算法本身,使其更加易于并行化計算。

從目前來看,計算機硬件計算能力的更新速度,跟不上指數級求解規模的增加速度。這也是量子力學發展的最大推動力!

-----------------

針對該問題,本文稍微展開一下。

這里的1億,主要指仿真中最終求解線性方程組的自由度個數,就是剛度矩陣的規模,即在方程Kx=b中,K的規模為1億*1億的方陣。

從硬件角度看,性能瓶頸首先在內存。目前臺式機的內存普遍在64G以下。對于1千萬的稀疏矩陣,存儲勉強夠用,加上計算,一般都不夠用,在windows系統上如果內存不夠用,會啟用虛擬內存,也就是用頁面交換把硬盤當內存使用,頻繁讀寫磁盤,這時候性能會大大降低。而對于1億自由度的矩陣,可能剛度矩陣組裝都不夠用。對于一億自由度的矩陣,首先要保證內存能夠存儲,一般的方法是使用具有超大內存的工作站服務器。

內存問題解決后,再就是CPU性能。前面講過,通常矩陣計算的空間復雜度,時間復雜度并不是線性,而是NlogN,N^2或者更高。使用單核單線程,耗費的時間是條曲線上升趨勢。雖然稀疏矩陣采用了CSR等方法壓縮數據,但自由度的平方數據仍然還是海量數據。現在的CPU普遍多核多個邏輯線程。這也要求在進行迭代法求解方程組時,合理的進行矩陣分解,參考一篇文章入門仿真軟件性能優化,采用分治的方法適應硬件的需求。

這里需要注意的是單核CPU的性能以及CPU的數量。根據實際情況進行分治!

在滿足了單機CPU運行之后,再就是集群分布式計算。采用多臺計算設備,比如刀片等專業服務器,超算等等,這里需要考量的是負載均衡和網絡帶寬,即保證單臺設備的利用率和整體進度保持一致。對于超大量的計算,最好能軟件實現動態規劃,對于頻繁交換數據的計算,要注意網絡帶寬的瓶頸。

再從軟件方面來看,根據筆者的研發經驗,相當一部分仿真的性能問題可以通過軟件以及改進算法解決。在前處理中,盡量避免軟件中高頻操作,大數據拷貝,大量細小數據操作等。如果必須有,對操作進行采樣性能評估,保證在可接受范圍內。在求解線性方程組前,提取矩陣特征,盡可能在最細度上根據矩陣特征,同時結合模型和業務的特點,選取最合適的求解方法。

其實目前對于數值計算方法而言,其算法都是公開透明的,商業軟件之間真正較量的是業務模型的準確性,算法的穩定性以及效率。而這也恰恰是每個軟件可以改進和提升的地方

2004年,ANSYS解出了1億自由度的模型,2008年,ANSYS解出了10億自由度的模型。即使現在來看,我們認為自由度超過1千萬的模型是個大模型,所以1億自由度的模型仍然可以認為是超大模型,且只能在超大的服務器上運行,可以想象,隨著硬件的提升和算法的改進,實際應用中會有越來越多的超1億自由度的模型求解。

回到開始的問題,“一億”是“一千萬”的十倍嗎?顯然不是。

最后還是以業內的一句話作為結束語:

“如果你的仿真還沒有受到硬件的限制,那說明你的仿真還沒有入門”。

編輯:fqj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • CAE技術
    +關注

    關注

    0

    文章

    9

    瀏覽量

    7103
  • 數值計算
    +關注

    關注

    3

    文章

    5

    瀏覽量

    6966
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    百億營收、單季利潤暴增十倍!存儲行業驚現“印鈔機”?

    電子發燒友網報道(文/莫婷婷)2025年,全球半導體產業迎來強勁增長,其中存儲賽道表現尤為亮眼。受益于人工智能(AI)算力需求爆發、服務器內存升級、端側智能設備普及以及存儲價格觸底回升等多重因素,國產存儲產業鏈企業普遍實現業績大幅增長或顯著減虧。 ? 就在近期,佰維存儲、瀾起科技、德明利、恒爍股份等四家代表性企業陸續發布2025年年度業績預告。電子發燒友網對其進行統計,可以看到佰維存儲和德明利在2025年迎來了百億營收,其
    的頭像 發表于 01-25 04:26 ?9277次閱讀
    百億營收、單季利潤暴增<b class='flag-5'>十倍</b>!存儲行業驚現“印鈔機”?

    施耐德電氣揭秘弘昇年實現業務規模十倍跨越的成長密碼

    作為系統集成商的優秀代表,弘昇與施耐德電氣已攜手合作余年,從2014年簽約額僅三百萬人民幣的初創企業,到2023年整體銷售額突破億元大關,實現業務規模十倍跨越,2024年更保持營業額翻倍的強勁
    的頭像 發表于 01-24 16:51 ?2068次閱讀

    匯川技術朱興明亮相2026中國智能制造企業家生態峰會

    “創業很難,二次創業更難?!薄暗蛢r競爭等于慢性自殺?!薄盎盍Ρ冉涷炛匾?b class='flag-5'>十倍?!痹?026年1月16日的中國智能制造企業家生態峰會上,私董會聯盟會長、匯川技術董事長兼總裁朱興明拋出一系列硬核觀點。
    的頭像 發表于 01-21 11:54 ?706次閱讀

    NVIDIA Grace Blackwell平臺實現MoE模型性能十倍提升

    如今,幾乎任一前沿模型的內部結構都采用混合專家 (MoE) 模型架構,這種架構旨在模擬人腦的高效運作機制。
    的頭像 發表于 12-13 09:23 ?893次閱讀
    NVIDIA Grace Blackwell平臺實現MoE模型性能<b class='flag-5'>十倍</b>提升

    壹連科技CCS產品全球累計出貨量突破一億

    近日,壹連科技自主研發生產的CCS電芯連接組件全球累計出貨量正式突破100,000,000片!一億片不僅僅是一個數字,它是市場與客戶的信任見證,是壹連人用智慧和汗水鑄就的里程碑,更是壹連科技賦能新能源產業的生動注腳。
    的頭像 發表于 11-18 09:59 ?678次閱讀

    為什么FPU在MCU中很重要呢?

    性能飛躍: 這是最主要的原因。與軟件模擬相比,FPU 執行浮點運算的速度可以快幾十倍甚至上百。 單周期操作: 許多基本的浮點運算(如加、乘)可以在一個或幾個時鐘周期內完成,而軟件模擬可能需要數
    發表于 11-18 07:05

    三坐標高效測量壓縮機渦旋盤精度解決方案

    Mizar Silver676三坐標測量機及CP500S連續掃描測頭的完整測量方案,優勢在于精準采集+智能分析的全鏈路適配。連續掃描測頭實現勻速滑動采集,相比傳統觸發式測頭,數據密度提升十倍以上
    發表于 11-13 14:06

    10G網速不是夢!5G-A如何“榨干”毫米波,跑出比5G快10的速度?

    6G網絡的發展奠定了堅實基礎。作為5G向6G過渡的關鍵技術,5G-A通過多載波聚合、毫米波擴展、時隙結構優化、1024QAM調制等創新技術,實現了網絡能力的十倍質變,為未來智能生活和產業數字化升級提供了強大的網絡支撐。 什么是5G-A?它在通信技術演進中的位置 5G-A,全稱為
    的頭像 發表于 09-16 16:34 ?1743次閱讀

    地平線余凱稱輔助駕駛的底層邏輯正在改寫

    從大模型黑馬DeepSeek,到春晚出圈的宇樹機器人,人工智能撬動的科技創新引領又一輪產業革命。這印證了“生產力決定生產關系”的底層邏輯,當科技動能觸發的“十倍生產力”涌現,行業格局必將引發重塑。
    的頭像 發表于 06-03 13:59 ?773次閱讀

    AD8429無法放大成理想的倍數,如何解決?

    增益公式為G=1+6KΩ/R1 ,R1設置為650Ω時,電壓放大十倍還是比較理想的,但改為60.5時輸出電壓為15.546mV,放大了77.7,不是理想的100,請問如何解決?請大
    發表于 04-24 07:45

    MAX1978為什么測試誤差放大五十倍的DIFOUT點會在直流偏置的基礎上疊加一個交流信號?

    你好,ADI,最近我們在使用MAX1978這款芯片的時候遇到一些問題如下: 測試環境為: +5V供電,開關頻率選擇1M,采用內部參考源1.5V,進行TEC控溫實驗, 問題為:為什么測試誤差放大五十倍的DIFOUT 點會在直流偏置的基礎上疊加一個交流信號,這個是由于我PID控制沒有控穩造成的嗎?
    發表于 04-18 06:57

    一文詳解Ceph分布式存儲

    傳統的IDE的IO值是100次/秒,SATA固態磁盤500次/秒,固態硬盤達到2000-4000次/秒。即使磁盤的IO能力再大數十倍,也不夠抗住網站訪問高峰期數十萬、數百萬甚至上億用戶的同時訪問,這同時還要受到主機網絡IO能力的限制。
    的頭像 發表于 04-03 14:13 ?1977次閱讀
    一文詳解Ceph分布式存儲

    AI天氣預報系統速度提升數十倍

    行業資訊
    電子發燒友網官方
    發布于 :2025年03月25日 11:59:33

    OpenAI重磅推出升級版AI模型o1-pro 價格翻十倍

    行業芯事行業資訊
    電子發燒友網官方
    發布于 :2025年03月21日 13:35:26