摘要:2程序執行模型多核處理器設計的首要問題是選擇程序執行模型。程序執行模型的適用性決定多核處理器能否以最低的代價提供較高的性能。程序執行模型是編譯器設計人員與系統實現人員之間的接口。編譯器設計人員決定如何將一種高級語言程序按一種程序執行模型轉換成一種目標機器語言程序;系統實現人員則決定該程序執行模型在具
2 程序執行模型
多核處理器設計的首要問題是選擇程序執行模型。程序執行模型的適用性決定多核處理器能否以最低的代價提供較高的性能。程序執行模型是編譯器設計人員與系統實現人員之間的接口。編譯器設計人員決定如何將一種高級語言程序按一種程序執行模型轉換成一種目標機器語言程序; 系統實現人員則決定該程序執行模型在具體目標機器上的有效實現。當目標機器是多核體系結構時,產生的問題是: 多核體系結構如何支持重要的程序執行模型?是否有其他的程序執行模型更適于多核的體系結構?這些程序執行模型能多大程度上滿足應用的需要并為用戶所接受?
3 Cache設計: 多級Cache設計與一致性問題
處理器和主存間的速度差距對CMP來說是個突出的矛盾,因此必須使用多級Cache來緩解。目前有共享一級Cache的CMP、共享二級Cache的CMP以及共享主存的CMP。通常,CMP采用共享二級Cache的CMP結構,即每個處理器核心擁有私有的一級Cache,且所有處理器核心共享二級Cache。
Cache自身的體系結構設計也直接關系到系統整體性能。但是在CMP結構中,共享Cache或獨有Cache孰優孰劣、需不需要在一塊芯片上建立多級Cache,以及建立幾級Cache等等,由于對整個芯片的尺寸、功耗、布局、性能以及運行效率等都有很大的影響,因而這些都是需要認真研究和探討的問題。
另一方面,多級Cache又引發一致性問題。采用何種Cache一致性模型和機制都將對CMP整體性能產生重要影響。在傳統多處理器系統結構中廣泛采用的Cache一致性模型有: 順序一致性模型、弱一致性模型、釋放一致性模型等。與之相關的Cache一致性機制主要有總線的偵聽協議和基于目錄的目錄協議。目前的CMP系統大多采用基于總線的偵聽協議。
4 核間通信技術
CMP處理器的各CPU核心執行的程序之間有時需要進行數據共享與同步,因此其硬件結構必須支持核間通信。高效的通信機制是CMP處理器高性能的重要保障,目前比較主流的片上高效通信機制有兩種,一種是基于總線共享的Cache結構,一種是基于片上的互連結構。
總線共享Cache結構是指每個CPU內核擁有共享的二級或三級Cache,用于保存比較常用的數據,并通過連接核心的總線進行通信。這種系統的優點是結構簡單,通信速度高,缺點是基于總線的結構可擴展性較差。
基于片上互連的結構是指每個CPU核心具有獨立的處理單元和Cache,各個CPU核心通過交叉開關或片上網絡等方式連接在一起。各個CPU核心間通過消息通信。這種結構的優點是可擴展性好,數據帶寬有保證; 缺點是硬件結構復雜,且軟件改動較大。
通信工程師備考資料免費領取
去領取
專注在線職業教育25年