日韩经典人妻系列免费视频 ,精品自拍视频在线看

　　這是一本強調(diào)從實踐中學(xué)理念的計算機體系結(jié)構(gòu)的教材。作者結(jié)合自身從事國產(chǎn)龍芯高性能通用處理器研制的實踐，以準確精練、生動活潑的語言，將計算機體系結(jié)構(gòu)的知識深入淺出地傳授給讀者。　　全書共13章，第1～4章從計算機體系結(jié)構(gòu)的研究內(nèi)容和發(fā)展趨勢、二進制和邏輯電路、指令系統(tǒng)結(jié)構(gòu)等方面介紹計算機體系結(jié)構(gòu)的基礎(chǔ)內(nèi)容。第5～7章從靜態(tài)流水線、動態(tài)流水線、多發(fā)射數(shù)據(jù)通路等方面介紹指令流水線結(jié)構(gòu)。第8～11章從轉(zhuǎn)移預(yù)測、功能部件、高速緩存、存儲管理等方面介紹處理器的模塊級結(jié)構(gòu)。第12章介紹多處理器結(jié)構(gòu)。第13章主要介紹作者在龍芯處理器設(shè)計過程中的經(jīng)驗教訓(xùn)。　　本書適合作為高等學(xué)校計算機專業(yè)的高年級本科生、研究生的教材，也可以作為相關(guān)工程技術(shù)人員的學(xué)習(xí)參考書。

　　2002年初，我剛開始龍芯處理器的研制沒多久，中科院計算技術(shù)研究所負責研究生教育的徐志偉老師就找我說有沒有可能在計算技術(shù)研究所開設(shè)一門計算機系統(tǒng)結(jié)構(gòu)方面的“大課程”。他進一步解釋說，在國外很好的學(xué)校經(jīng)常有這樣的課程，讓學(xué)生每天都忙得“死去活來”，熬夜到凌晨兩三點才能完成作業(yè)，但從中還“真正能學(xué)到東西”。我便欣然應(yīng)允。

　　我從2002年秋季開始給計算技術(shù)研究所博士生開設(shè)“處理器設(shè)計”課程，講課后才知道給學(xué)生上課比做研究難。一方面是因為授課比做研究在內(nèi)容上要求更加全面系統(tǒng)，尤其是講體系結(jié)構(gòu)課程，除了體系結(jié)構(gòu)本身外，還需要對操作系統(tǒng)、編譯器原理、晶體管原理和基本工藝流程等相關(guān)領(lǐng)域的知識融會貫通；另一方面做研究時很多內(nèi)容只要宏觀了解就可以了，但授課就必須對其搞清楚，不清楚就不敢講或者講起來不生動。例如，在龍芯處理器設(shè)計時我安排了專門的人負責浮點模塊，因為自己對于IEEE的浮點數(shù)據(jù)格式標準只是大致了解，但要給學(xué)生講自己就得搞清楚；又如，在講TLB時，就得搞清楚操作系統(tǒng)的存儲管理，否則越講學(xué)生就越糊涂�；谏鲜鲈�，這門課程幾乎花掉了我前3年的所有業(yè)余時間，每一講都至少需要花一周的時間做準備，而且每一年都要對講義做大幅度調(diào)整，成為一個沉重的負擔。經(jīng)過3年的積累，課程的章節(jié)框架才基本定型。

　　在此基礎(chǔ)上，2005年開始在中國科學(xué)院研究生院同時針對碩士和博士講授“高性能計算機系統(tǒng)結(jié)構(gòu)”課程。碩士和博士課程的主要區(qū)別在于作業(yè)和考試內(nèi)容不同。由于要針對碩士講授，因此在基礎(chǔ)性方面又做了補充和加強，并根據(jù)授課的實際需要每年再對各章的內(nèi)容進行了調(diào)整和完善。到2008年，準備根據(jù)講課的內(nèi)容出版一部教材，因此對2008年的講授進行了錄音整理。為了增加教材的可讀性和趣味性，在整理教材時保持了第一人稱的形式，同時盡量做到句子及內(nèi)容的簡潔和嚴謹。

　　本教材具有如下幾個特點。

　　一是基礎(chǔ)性，在快速變化的體系結(jié)構(gòu)學(xué)科中總結(jié)出其中不變的原理性東西。計算機體系結(jié)構(gòu)發(fā)展得很快，不斷有新的內(nèi)容出現(xiàn)，但幾十年來積淀下來的東西并不多。關(guān)鍵是要發(fā)現(xiàn)快速變化中不變的原理性的東西，如果掌握了這些原理，就能以不變應(yīng)萬變。因此，在教材編寫時“不趕時髦”且“不跟風”，把計算機體系結(jié)構(gòu)在幾十年的發(fā)展過程中形成的里程碑的工作講透，重點介紹具體結(jié)構(gòu)背后的原理和思路。

　　二是系統(tǒng)性，做到對體系結(jié)構(gòu)、基礎(chǔ)軟件、電路和器件的融會貫通。根據(jù)我自己從事處理器設(shè)計的經(jīng)驗，一個體系結(jié)構(gòu)的設(shè)計者就像一個帶兵打仗的將領(lǐng)，結(jié)構(gòu)設(shè)計就是“排兵布陣”。更重要的是要“上知天文，下知地理”。所謂“上知天文”，指的是在結(jié)構(gòu)設(shè)計過程中要充分地了解與處理器聯(lián)系緊密的操作系統(tǒng)、編譯器以及應(yīng)用程序的原理和行為；所謂“下知地理”，指的是在做結(jié)構(gòu)設(shè)計時要充分考慮到所設(shè)計的模塊和功能部件的電路和版圖結(jié)構(gòu)。要做到一以貫之。例如在打字時，要很清楚地知道從按鍵盤到屏幕上出現(xiàn)一個字的過程中應(yīng)用程序、操作系統(tǒng)、硬件、芯片、晶體管等的完整的交互行為。

　　三是實踐性，做“在硅上工作（work on silicon）”的設(shè)計。在龍芯處理器的研發(fā)中深刻感覺到，計算機體系結(jié)構(gòu)是實踐性很強的學(xué)科。因此，在本教材的內(nèi)容中充分結(jié)合了龍芯處理器研發(fā)過程中獲得的體驗，強調(diào)要做work on silicon的設(shè)計，而不要停留在work on paper的設(shè)計上。本教材的最后一章“實踐是最好的課堂”，通過龍芯研制過程中發(fā)生的10個故事來進一步強調(diào)學(xué)習(xí)計算機體系結(jié)構(gòu)設(shè)計實踐的重要性。此外，在教材的習(xí)題部分安排了不少需要學(xué)生動手實踐的內(nèi)容。這些習(xí)題是對內(nèi)容的延伸，需要學(xué)生在領(lǐng)會教材內(nèi)容的精神之后進行發(fā)揮。

　　由于體系結(jié)構(gòu)這門學(xué)科發(fā)展迅速，涉及面廣，因此本教材中難免有不當和疏漏之處，敬請批評指正。同時我也意識到，以活潑生動的形式編寫教材是一種大膽的嘗試，需要面臨很多挑戰(zhàn)。因此，非常歡迎使用本教材的教師和學(xué)生對本教材提出寶貴意見。

　　胡偉武2017年暑期前言計算機體系結(jié)構(gòu)（第2版）

　　第5章靜態(tài)流水線前4章分別介紹了計算機系統(tǒng)結(jié)構(gòu)的基本概念、二進制和邏輯電路以及指令系統(tǒng)結(jié)構(gòu)。有了這些基礎(chǔ)，這一章以一個簡單的CPU為例介紹CPU的流水線設(shè)計，后面2章再介紹比較復(fù)雜的流水線和多發(fā)射結(jié)構(gòu)。
　　我們從MIPS指令集揀選部分代表性的指令作為簡單CPU需要實現(xiàn)的指令集，其中指令及其編碼列舉在表5.1中，指令的具體含義及指令集的其他定義請參看本書的第4章。
　　表5.1簡單CPU指令和指令編碼t第5章靜態(tài)流水線計算機體系結(jié)構(gòu)（第2版）5.1數(shù)據(jù)通路設(shè)計基于指令系統(tǒng)的定義，先設(shè)計這個簡單CPU的數(shù)據(jù)通路，其主要模塊包括一個指令存儲器、一個數(shù)據(jù)存儲器、一個通用寄存器堆、一個指令寄存器（IR）和一個程序計數(shù)器（PC），如圖5.1所示。
　　圖5.1主要數(shù)據(jù)通路CPU工作時，首先用PC作為地址去指令存儲器中取指令。PC的值是怎么來的呢？有兩種情況，第一種是執(zhí)行完一條指令順序執(zhí)行時，下一條指令的PC（Next PC，NPC）的值是PC+4，因為指令占4個字節(jié)；第二種是執(zhí)行轉(zhuǎn)移指令時NPC值是延遲槽PC+offset。因為延遲槽指令總是需要執(zhí)行的，所以當前指令是跳轉(zhuǎn)的轉(zhuǎn)移指令時并不能立即修改PC為跳轉(zhuǎn)目標，只能是延遲槽指令在CPU里時才能修改。這樣，生成NPC的部分有一個2選1邏輯根據(jù)轉(zhuǎn)移指令跳轉(zhuǎn)是否成功來選擇offset值和4，選擇之后再由一個加法器跟PC的值相加，并送到PC中。然后，根據(jù)這個PC的值到指令存儲器取指，指令取出來以后放到指令寄存器IR中。IR中的指令包含操作碼（op）和功能碼（func），目標寄存器號（rd），兩個源寄存器號（rs、rt），還有立即數(shù)/偏移量（imm）,其中立即數(shù)/偏移量有16位，與rd和func域有部分重疊。
　　通用寄存器堆、運算部件和存儲器的通路由IR中的域統(tǒng)一控制。通用寄存器的內(nèi)部電路結(jié)構(gòu)如圖5.2所示，其讀地址RA1通過控制一個32選1邏輯從32組寄存器中選出一組將其值輸出至RD1，同樣的RA2控制另一個32選1邏輯從32組寄存器中選出另一組將其值輸出至RD2；當發(fā)生寫操作時，寫地址WA1通過譯碼器得到各組的選擇信號再與上全局寫使能WE1形成每一組寄存器的寫使能，用來控制將寫入數(shù)據(jù)WD1寫入到相應(yīng)的寄存器組中。IR的rs域連接到通用寄存器堆的讀端口1的地址輸入，從中選出一個將其值送到ALU的其中一端；IR的rt域連接到通用寄存器堆的讀端口2的地址輸入，從中也選出一個值來，并和符號擴展后的立即數(shù)/偏移量2選1后送到ALU的另外一端。這是因為ADDIU、LW和SW指令不用寄存器讀出的值作為第二個源操作數(shù)進行運算，而是用指令中的立即數(shù)/偏移量進行運算。轉(zhuǎn)移指令也用到立即數(shù)/偏移量，但僅在計算NPC時使用，這里我們使用獨立的加法器進行NPC的計算。ALU完成計算操作之后要把算術(shù)運算或邏輯運算的結(jié)果寫回到通用寄存器堆里去，具體寫回到哪個寄存器由指令中的rd或rt域來控制，目標連接到通用寄存器堆的寫端口1的地址輸入，進而選中一個寄存器并打開其寫使能。對于LW指令來說，其目標寄存器號來自于指令的rt域而非其他指令的rd域，所以需要通過一個2選1邏輯選擇出目標寄存器號。訪存指令LW和SW把ALU的運算結(jié)果作為訪存地址。LW從數(shù)據(jù)存儲器中把值取出，然后寫回到目標寄存器去，所以寫入通用寄存器堆的數(shù)據(jù)也需要通過一個2選1邏輯從ALU運算結(jié)果和數(shù)據(jù)存儲器讀出結(jié)果之間選擇。SW將寄存器堆中讀出的值寫入到數(shù)據(jù)存儲器中。
　　圖5.2寄存器堆電路結(jié)構(gòu)上述描述實現(xiàn)了這個CPU中的主要數(shù)據(jù)通路，并涵蓋了指令系統(tǒng)中定義的所有指令，但沒有描述這個通路的控制邏輯部分。下面我們一步一步地往里加?xùn)|西。
　　5.2控制邏輯設(shè)計實現(xiàn)了CPU的數(shù)據(jù)通路之后，下面先添加CPU的控制邏輯�？刂七壿嫺鶕�(jù)指令的要求控制數(shù)據(jù)在數(shù)據(jù)通路中流動。
　　從上述數(shù)據(jù)通路可以看出，為了讓數(shù)據(jù)根據(jù)指令的要求在數(shù)據(jù)通路中正確地流動，需要對以下通路進行控制：計算PC的加法器是否需要看轉(zhuǎn)移跳轉(zhuǎn)情況決定是加4還是加offset（C1）；是選擇寄存器的值還是選擇立即數(shù)作為ALU的第二個源操作數(shù)（C2）；ALU做什么運算(ALUOp)；運算結(jié)果是把ALU的運算結(jié)果寫回，還是把從數(shù)據(jù)存儲器讀出來的結(jié)果寫回（C3）；目的寄存器號是來自指令的rd域還是rt域（C4）；什么情況下使能通用寄存器堆的寫使能（C5），因為有一些指令是不寫寄存器的，例如SW指令和轉(zhuǎn)移指令；什么情況下使能數(shù)據(jù)存儲的寫使能（C6）。
　　根據(jù)指令的功能和數(shù)據(jù)通路的情況，表5.2給出了CPU中控制邏輯的真值表，其中X表示是0或1無所謂。
　　……

你還可能感興趣

我要評論