作者:一博科技高速先生周偉
陽(yáng)春三月,春暖花開(kāi),草長(zhǎng)鶯飛,處處透著生機(jī)和浪漫,也是一年中最美好的時(shí)光,可是由于疫情,很多人的生活、工作等節(jié)奏和安排也都被打亂了,雪上加霜的是,攻城獅豹哥還遇到了一件尷尬的事情,之前設(shè)計(jì)的一個(gè)項(xiàng)目在研發(fā)打樣階段調(diào)試一切正常,這次重新生產(chǎn)貼片了幾百片小批量的,結(jié)果卻發(fā)現(xiàn)有一些不良,關(guān)鍵是還沒(méi)有找到解決辦法,天天被客戶(hù)催著找問(wèn)題,真是一個(gè)頭兩個(gè)大。
問(wèn)題主要如下群聊內(nèi)容所示:

初始反饋的信息可以總結(jié)一下就是:前面做了多次小批量一站式的試產(chǎn),都沒(méi)有出現(xiàn)過(guò)問(wèn)題,本次在我司生產(chǎn)完測(cè)試沒(méi)有問(wèn)題,拉到客戶(hù)端測(cè)試就有時(shí)好時(shí)壞的現(xiàn)象,主要問(wèn)題是CPU在啟動(dòng)過(guò)程中DDR初始化失敗,還沒(méi)有找到解決方案,導(dǎo)致整機(jī)生產(chǎn)發(fā)貨嚴(yán)重脫離計(jì)劃節(jié)點(diǎn),也就是整個(gè)項(xiàng)目的交期延遲了。
客戶(hù)問(wèn)題無(wú)小事,這是我們的服務(wù)宗旨。我們立即和客戶(hù)一起成立了項(xiàng)目攻關(guān)組,大家分頭行動(dòng),從自己的專(zhuān)業(yè)角度去提供各自的一些解決問(wèn)題的方法。在焊接領(lǐng)域,客戶(hù)提出了虛焊的可能,同時(shí)也說(shuō)到重新焊接了CPU芯片的板子后面狀態(tài)就正常了,所以首先安排一些啟動(dòng)異常的板子拿去焊接廠用3D X-ray看看是否有虛焊的可能,焊接廠反饋回來(lái)的部分結(jié)果如下所示。

深圳和珠海工廠的3D x-ray檢測(cè)結(jié)果出來(lái)了,都沒(méi)有發(fā)現(xiàn)焊接問(wèn)題,CT掃描非常耗時(shí),深圳昨天寄過(guò)去的板子建議就不要照了,沒(méi)有多大意義;
附件為珠海工廠3D x-ray檢測(cè)設(shè)備檢測(cè)結(jié)果如附件,沒(méi)有發(fā)現(xiàn)錫球不規(guī)則、無(wú)枕頭效應(yīng)、無(wú)大小錫球等問(wèn)題。
術(shù)業(yè)有專(zhuān)攻,雖然看不懂3D X-ray的結(jié)果,但從圖片來(lái)看,肉眼基本看不出太大的差別,作為門(mén)外漢的我看到的就是焊球基本一樣,顆粒飽滿(mǎn)均勻,沒(méi)有出現(xiàn)某單個(gè)球有明顯的不規(guī)則缺陷,可以初步排除這個(gè)板子虛焊的可能。這也是我們工廠的大利(sha)器,焊接質(zhì)量好不好一照便知。雖然照了3D,但我們還是又對(duì)調(diào)了好板子上的芯片并重新進(jìn)行了焊接測(cè)試,問(wèn)題還是沒(méi)有解決。
焊接排除的同時(shí),我們也在同步對(duì)PCB制板進(jìn)行排除驗(yàn)證,制板的檢驗(yàn),除了切片等破壞性測(cè)試外,和信號(hào)電氣相關(guān)的就是看阻抗是否滿(mǎn)足制板要求,這個(gè)可以通過(guò)實(shí)測(cè)線路阻抗來(lái)驗(yàn)證,于是該我們的67GHz網(wǎng)分上場(chǎng)了。板子到了我們的高速實(shí)驗(yàn)室,我們馬上就進(jìn)行了DDR4信號(hào)部分的阻抗測(cè)試,如下是DDR4單線部分設(shè)計(jì)的阻抗要求。

部分實(shí)際測(cè)試的阻抗如下圖所示。

數(shù)據(jù)信號(hào)阻抗要求39±5ohm,實(shí)測(cè)阻抗在36~40ohm,阻抗?jié)M足要求。

地址控制信號(hào)阻抗要求36±5ohm,實(shí)測(cè)主干段線路阻抗在35.6ohm左右,阻抗?jié)M足要求。
從阻抗實(shí)測(cè)的結(jié)果來(lái)看,基本可以排除PCB制板的問(wèn)題,所以這個(gè)時(shí)候從信號(hào)完整性的角度開(kāi)始了我們常規(guī)性套路的排查。
首先就是了解一下問(wèn)題發(fā)生的情況,看看哪些現(xiàn)象可能是信號(hào)完整性造成的,比如降頻是否工作,一般DDRx降頻能工作的,基本就可以排除焊接、硬件原理方面的問(wèn)題,然后集中精力從PCB設(shè)計(jì)、電源噪聲、信號(hào)質(zhì)量及軟件配置等方面看看是不是系統(tǒng)時(shí)序裕量不足造成的問(wèn)題。
此時(shí)出來(lái)了兩個(gè)小插曲,一個(gè)是客戶(hù)反饋本次顆粒換了另一個(gè)型號(hào)的料號(hào),封裝上有一點(diǎn)小小的改動(dòng),但引腳什么的都沒(méi)有變化,這是本次和上次硬件上唯一的區(qū)別;另一個(gè)就比較詭異了,客戶(hù)反饋之前不行的,裝個(gè)散熱片按壓下又好了,反向按壓下又不好了(這個(gè)感覺(jué)有點(diǎn)像靈異事件,其實(shí)我們也經(jīng)常聽(tīng)其他客戶(hù)提到過(guò)),這導(dǎo)致我們定位問(wèn)題變得又撲朔迷離了。
新的反饋導(dǎo)致我們有了新的方向和初步的結(jié)論,就是調(diào)換之前的顆粒重新焊接再測(cè)試下,如果問(wèn)題解決那就萬(wàn)事大吉。
另一方面我們還想按照我們的常規(guī)套路降頻再?lài)L試(掙扎)一下,客戶(hù)也非常的配合,但接下來(lái)的結(jié)論又把問(wèn)題引到了一個(gè)新的方向。
降頻的方案說(shuō)明有效果,之前出問(wèn)題的現(xiàn)象重復(fù)多次不再?gòu)?fù)現(xiàn),這個(gè)就可以果斷排除硬件原理、虛焊的可能,剩下的還是要從系統(tǒng)的時(shí)序裕量不足上去排除。另外之前吊詭的按壓現(xiàn)象也只是偶然的成功現(xiàn)象,不足以作為解決問(wèn)題的方向,所以只能算是查找問(wèn)題過(guò)程中的一個(gè)小插曲,進(jìn)一步排除了虛焊的可能,也進(jìn)一步說(shuō)明了我們套路上一開(kāi)始的思路是對(duì)的,只是中間方向太多,客戶(hù)也沒(méi)閑著,比我們更著急,所以各項(xiàng)工作都是相互并行在走。
系統(tǒng)時(shí)序裕量不足,這個(gè)確實(shí)是可以通過(guò)仿真和實(shí)測(cè)對(duì)比的手段去定位,于是找到壓死駱駝最后一根稻草的任務(wù)又落在了我們身上。
對(duì)于這種有實(shí)物的板子,我們的套路一般是先通過(guò)示波器測(cè)到板子上實(shí)際的信號(hào),然后將實(shí)測(cè)的波形數(shù)據(jù)導(dǎo)入到仿真軟件中和仿真結(jié)果進(jìn)行對(duì)比,如果在同樣的位置上仿真和測(cè)試波形一致,那么就基本可以確定芯片的模型是比較準(zhǔn)確的,然后就可以通過(guò)仿真看到芯片內(nèi)部真實(shí)的接收波形,從而根據(jù)波形好壞來(lái)定位問(wèn)題。而目前的板子由于DDR4顆粒是正反貼片,除了焊接DDR4 interposer夾具我們沒(méi)法通過(guò)常規(guī)的手段來(lái)測(cè)試,但時(shí)間寶貴,最后我們退而求其次,在時(shí)鐘信號(hào)的端接電阻處進(jìn)行了測(cè)試,一般時(shí)鐘信號(hào)不需要任何其他的命令,只要系統(tǒng)可以跑起來(lái)就一直會(huì)有波形,所以我們可以先在時(shí)鐘的端接電阻上測(cè)試到信號(hào),然后在同樣的位置上進(jìn)行仿真對(duì)比,仿真和實(shí)測(cè)的部分對(duì)比結(jié)果如下圖所示。

信號(hào)波形本身的質(zhì)量還不錯(cuò),從波形來(lái)看,兩者上升沿和下降沿基本可以完全對(duì)齊,除了幅度上有一些小的差異外,其他基本都是可以對(duì)上的,所以這個(gè)也可以反映出芯片的模型是可信的,仿真的結(jié)果可信,可以進(jìn)行下一步全面的信號(hào)及時(shí)序仿真排除了。
就在我們準(zhǔn)備大展拳腳開(kāi)始仿真的時(shí)候,客戶(hù)突然說(shuō)問(wèn)題找到了,原來(lái)還真是軟件配置的問(wèn)題,由于更換DDR4顆粒后實(shí)際參數(shù)發(fā)生了變化,而配置軟件還是按照之前的參數(shù)在控制,導(dǎo)致系統(tǒng)參數(shù)比較臨界,產(chǎn)生了部分系統(tǒng)不穩(wěn)定現(xiàn)象,最終更新了軟件的配置參數(shù),問(wèn)題得到解決。
問(wèn)題兜兜轉(zhuǎn)轉(zhuǎn),沒(méi)想到竟然以這種意想不到的結(jié)果結(jié)束,真是幸福來(lái)得太快就像龍卷風(fēng),我竟有點(diǎn)措手不及的感覺(jué),我們的工程師豹哥就是被太多這種摸不著頭腦的“幸福”搞禿的。
所幸問(wèn)題最終定位了,豹哥也松了口氣,雖然一波三折沒(méi)有直接定位到問(wèn)題,但大家積極配合的態(tài)度還是充分得到了客戶(hù)的認(rèn)可。從這個(gè)案例里面豹哥也得出了一些調(diào)試的套路,總結(jié)如下也和各位吃瓜粉絲們一起分享:
1、對(duì)于大多數(shù)信號(hào)問(wèn)題,可以先降頻試試,如果降到了最低還是沒(méi)有任何改善,通常就需要從其他方面如硬件原理、軟件、制板或焊接等去找問(wèn)題了,如果降頻有改善,那就和信號(hào)本身有關(guān),可以從信號(hào)質(zhì)量、電源、時(shí)序及軟件配置等方面去找問(wèn)題;
2、工欲善其事,必先利其器。在本次查找問(wèn)題過(guò)程中,我們先后動(dòng)用了3D X-ray、CT掃描(掃描比較慢,文章沒(méi)有秀出來(lái))、BGA返修臺(tái)、67GHz ZVA矢量網(wǎng)絡(luò)分析儀、59GHz示波器、仿真工具等,這好比對(duì)待一個(gè)重癥患者,各種儀器齊上陣,最終通過(guò)先進(jìn)的儀器來(lái)查出病癥,對(duì)癥下藥。要想在PCB這個(gè)行業(yè)有所突破,沒(méi)有這幾把刷子也只能是徒勞。記得有位前輩戲謔過(guò),以前在調(diào)試前都是要先去旁邊的廟里拜一拜,也間接說(shuō)明調(diào)試確實(shí)不是那么容易的事,只能說(shuō)坑(套路)太多。
審核編輯:符乾江
-
網(wǎng)絡(luò)分析儀
+關(guān)注
關(guān)注
9文章
775瀏覽量
31351 -
DDR4
+關(guān)注
關(guān)注
12文章
347瀏覽量
43110
發(fā)布評(píng)論請(qǐng)先 登錄
PCB板上PIN DELAY單位錯(cuò)了,DDR4跑不起來(lái),真的嗎?
DDRX SDRAM中的預(yù)取技術(shù)說(shuō)明
真不敢信,PCB板上就挪動(dòng)了一個(gè)電阻,DDR3竟神奇變好了
真不敢信,PCB板上就挪動(dòng)了一個(gè)電阻,DDR3竟神奇變好了
福晞軟件調(diào)試工具介紹之工程添加Debugware IP(1)
CW32L010F8U6跑器件實(shí)例,功耗遠(yuǎn)起實(shí)例標(biāo)明的電流,是什么原因?
【EASY EAI】基于瑞芯微RV1126B 的串口調(diào)試說(shuō)明
E30M6203-5G網(wǎng)關(guān)通訊遠(yuǎn)程調(diào)試工具說(shuō)明書(shū)
PCB過(guò)孔STUB對(duì)DDRX地址信號(hào)的影響
醫(yī)療推桿電源電壓波動(dòng)(突變)調(diào)試實(shí)例
硬件調(diào)試:JLink 驅(qū)動(dòng)配置與調(diào)試技巧
調(diào)試變頻器詳細(xì)說(shuō)明
IMP-3402微機(jī)發(fā)電機(jī)保護(hù)測(cè)控裝置調(diào)試說(shuō)明書(shū)
前端調(diào)試實(shí)踐
關(guān)于DDRX調(diào)試的實(shí)例說(shuō)明
評(píng)論