從社群媒體到自動駕駛汽車和家用電器,人工智慧(AI)和機器學習(ML)得運算在大眾的生活中比以往伴隨更大得角色。 已達 1000 億美元得 AI 和 ML 市場預計在 2030年之前長到20倍的 2兆美元。 而推動這龐大市場的技術是促進高頻寬和低延遲資料傳輸通道的 PCI Express® (PCIe®) 5.0 架構。
PCIe 5.0 於 2019 年 5 月發布,提供前版 PCIe 4.0 的兩倍資料傳輸能量。 這使得圖形適配器卡、網路介面卡 (NIC)、儲存加速器設備、固態硬碟 (SSD) 甚至是圖形處理單元 (GPU)等 PCIe 週邊裝置展示更高層次的技術表現。
至於為什麼 PCIe 5.0 對 ML 和 AI 應用如此關鍵,我們先得知道下一代技術應用得要求:
可透過低延遲、不歸零的實體層承載更多協議,使 CPU 能夠隨著 AI 和 ML 設備的激增跟上日益激增的資料量。
目前,多數的處理器和主機板都支援第4代 PCIe。 該標準在 2017 年首次發佈時具有劃時代的意義。 然而,許多用戶開始遇到表現上的瓶頸。 例如,採用 M.2 NVMe 外型的固態硬碟只能在四條頻道上實現 8GB/s 的持續資料傳輸。 而 PCIe 5.0 SSD 的速度則翻了一番,達到 16GB/s,32 通道裝置的頻寬為 128GB/s。
PCIe 時代 | 頻寬 | 千兆傳輸 | 奈奎斯特(Nyquist)頻率 |
PCIe 1.0 x16 | 8GB/s | 2.5GT/s | 1.25GHz |
PCIe 2.0 x16 | 16GB/s | 5GT/s | 2.5GHz |
PCIe 3.0 x16 | 32GB/s | 8GT/s | 4GHz |
PCIe 4.0 x16 | 64GB/s | 16GT/s | 8GHz |
PCIe 5.0 x16 | 128GB/s | 32GT/s | 16GHz |
AMD 的 AM5 和 Intel 的 LGA 1700 主機板等產品已經開始支援 PCIe 5.0,預計在近期將有更多新產品推出市場。 但要注意的是,只有在連線的兩端都支援 PCIe 5.0 的情況下才能實現更高的資料傳輸速度。 從理論上講,與 PCIe Gen4 主機板配對的 PCIe 5.0 SSD 能夠以最大 Gen4 頻寬(16GT/s)運作。 因此,它能夠在 x16 鏈路寬度上以 64GB/s 的速度傳輸資料。
不可否認的是,PCIe 5.0 是開發更快設備的必要條件。 但它的存在本身並不能提高 GPU 或 SSD 的效能,尤其是已經有足夠頻寬的裝置。 事實上,儘管 PCIe 5.0 標準已發布四年,目前在市場上流通的 PCIe 5.0 設備並不多。
不過,PCIe 5.0 肯定會在順序讀寫以及傳輸速度兩方面的提高發揮關鍵作用,尤其是在傳輸較大文件的應用中。 Crucial T700 和 SEAgate FireCuda 540 等第 5 代固態硬碟已經比第 4 代固態硬碟有了顯著的改進。 PCIe 第 5 代固態硬碟也開始浮出水面,不過在 PCIe 5.0 真正成為主流之前,還需要有更多經濟實惠的組件。
升級到 PCIe 5.0 的主要障礙在於成本。 在大多數情況下,想要相容 PCIe 5.0 設備,主機板、CPU 甚至是記憶體都需要升級。 不同的主機板對 PCIe 5.0 的支援程度也不同。 因此,對使用者來說,想要以低成本的方式升級並不簡單。 此外,市面上較新的 PCIe 5 代固態硬碟需要散熱片,甚至是像 Corsair MP700 Pro 固態硬碟的主動冷卻解決方案。 雖然散熱片案例上是可選項,但硬體維護還是不可忽略的考慮因素。
考慮到目前市場中最優秀的主機板也不算是 100% PCIe 5.0,領域圈內者都認為 PCIe 6.0 將在 PCIe 5.0 成為標準的時期發布,導致消費者不斷落後於最新技術規範。
PCIe 6.0 的發布日期到此尚未確定,但可以肯定的是,它將在 2025 年或 2026 年之間發布。 這意味著 AM5 主機板除了最後一個晶片組以外不會受被 PCIe 6.0 影響。
通道插入損耗(IL)造成的訊號衰減是 PCIe 5.0 技術系統設計的最大挑戰。 最初的 PAM-4 方法用於速度超過 30 GT/s 的資料傳輸標準。
雖然 PAM 有助於將訊號的奈奎斯特(Nyquist)頻率降低到資料傳輸的四分之一,但其代價是 9.5 dB 的訊號雜訊比(SNR)。 PCIe 5.0 架構的不再使用 PAM-4 而是繼續使用非歸零(NRZ)訊號方案,即訊號的奈奎斯特頻率為資料速率的二分之一。
PCIe 5.0 規範中有應對挑戰的指導原則。 它對訊號在傳輸過程中的削弱程度設定了限制(32 GT/s 時為 36 dB),誤碼率 (BER) 小於 10-12。 為了解決訊號減弱或衰減問題,PCIe 5.0 對參考接收器進行定義,以確保連續時間線性均衡器 (CTLE) 模型包括一個 -15 dB 的 ADC(可調直流增益)。 而 16 GT/s 的參考接收器僅設定為 -12 dB。
當資料傳輸速率達到 32GT/s,誤差頻率會越來越高,尤其是 DFE 電路在接收器的整體均衡中扮演關鍵的角色。 PCIe 5.0 架構中的預編碼有助於抵銷此風險。 在發送器側啟用預編碼,在接收器側啟用解碼,將大大降低突發錯誤的風險,並保證 PCIe 5.0 規範 32 GT/s 連結的穩健性。
PCIe 4.0 和 PCIe 5.0 架構的插入損耗預算分別為 16 GT/s 和 32 GT/s。 扣除 CPU 封裝的 9 dB 後,剩餘的預算分為 AIC 的 9.5 dB、CEM 連接器的 1.5 dB 和系統底板的 16dB。
除了插入損耗預算,工程師在設計 PCIe 5.0 時還需要考慮以下因素:
在正常的情況下,硬體工程師和系統設計師會留出大約 10-20% 的整體頻道插入損耗預算,即 36 分貝預算中約 4-7 分貝。 隨著人工智慧和 ML 需求的增加,預計會出現更多的系統拓撲。 因此,工程師必須熟悉 PCB 材料和 PCIe 5.0 重定時器,以確保順利升級到 PCIe 5.0 架構。
想要把新一代的AI 和 ML 技術產品設計技巧瞭如指掌,就趕快聯絡 GRL,借助我們經驗豐富的專家智慧以及先進的測試設施。 以確保您的產品符合不斷改變的市場要求。