Przypomnijmy, że statyczne komórek pamięci na podstawie etapów tranzystor, który może zawierać do 10 tranzystorów. Od tranzystor przełączający z jednego stanu do drugiego jest nieznaczne, a następnie z dużą prędkością pamięci statycznej.
Cache jest mała ilość i jest umieszczona bezpośrednio na układ procesora. Jego prędkość jest znacznie wyższa niż w dynamicznej pamięci (moduły RAM), ale niższe niż są rejestry ogólnego przeznaczenia (Ron) CPU.
Po raz pierwszy był na 386 cache komputerów i znajduje się na płycie głównej. Płyta 386 DX miał pojemność pamięci podręcznej od 64 do 256 KB. 486-ty przetwórcy już cache znajduje się na chipie procesora, ale pamięć podręczna na płycie głównej został zapisany. System cache Pamięć stała dwupoziomowy, on-chip stał się znanypamięć podręczna pierwszego poziomu (L1), a na płycie -Drugi poziom pamięci podręcznej (L2). Z biegiem czasu, pamięć podręczna drugiego poziomu "przeniósł się" on-chip procesora. Pierwszy zrobił procesora AMD K6-III (L1 = 64 KB, L2 = 256 Kb).
Obecność dwóch poziomów pamięci podręcznej wymagać ustanowienia mechanizmu ich oddziaływania ze sobą. Istnieją dwie możliwości wymiany informacji pomiędzy pierwszym i pamięci podręcznej drugiego poziomu, lub jak mówią, dwa cache architektury: inclusive i ekskluzywne.
Inclusive cache
Inclusive obejmuje powielania architektury informacji przechowywanych w L1 i L2.
System działa w następujący sposób. Podczas kopiowania danych z pamięci podręcznej RAM jest w dwóch egzemplarzach, jeden egzemplarz przechowywany jest w L2, kolejną kopię - w L1. Gdy L1 jest całkowicie wypełniona, informacje otrzymuje zasady usuwania najbardziej "stare dane" -LRU (Najsłabiej Ostatnio używany). Podobnie dzieje się z pamięci podręcznej drugiego poziomu, ale ponieważ kwota więcej i jest przechowywany tam dłużej.
Po przeczytaniu informacji z pamięci podręcznej procesora, to pochodzi z L1. Jeśli wymagane informacje w pamięci podręcznej pierwszego poziomu tam, że jest poszukiwany w L2. Jeśli potrzebujesz informacji w pamięci podręcznej drugiego poziomu znajduje, to jest powielany w L1 (zasada LRU), a następnie przekazywane do procesora. Jeśli potrzebujesz informacji, nie znalazł się w pamięci podręcznej i drugiego poziomu, to jest odczytywany z pamięci RAM, system opisany powyżej.
Inclusive architektura jest używana w systemach, w których różnica w objętości cache pierwszego i drugiego poziomu wysokiego. Na przykład, procesor Pentium 3 (Coppermine): L1 = 16 KB, L2 = 256 Kb; Pentium 4: L1 = 16 KB, L2 = 1024 Kb. W takich systemach, powielane niewielka część pamięci podręcznej drugiego poziomu, jest to całkiem rozsądna cena dla ułatwienia mechanizmu włącznie.
Ekskluzywna pamięć podręczna
Ekskluzywny cache obejmuje unikalne informacje przechowywane w L1 i L2.
Podczas odczytu danych z pamięci do pamięci podręcznej - informacje natychmiast wszedł w L1. Gdy L1 jest pełna, to zasada informacje LRU przeniesione z L1 do L2.
Jeśli czytasz procesor informacji z L1 żądanej informacji znajduje, jest wyszukiwany w L2. Jeśli potrzebujesz informacji zawartych w L2, wówczas zasada cache LRU pierwszy i drugi poziom dzielą linie (większość linii "stare" z L1 umieszczone w L2, a na jego miejscu jest napisane w wierszu L2). Jeśli potrzebujesz informacji, nie znaleziono i L2, jest odwołanie się do systemu RAM opisanej powyżej.
Exclusive architecture stosuje się w instalacjach, w których różnica pomiędzy pierwszym a drugim poziomie pamięci podręcznej jest stosunkowo mała. Na przykład, Athlon XP: L1 = 64 Kb L2 = 256 Kb. W ekskluzywnym architektury pamięci podręcznej używany bardziej efektywnie, ale systemu wyłącznego mechanizm jest znacznie trudniejsze.
Interakcje pamięci podręcznej RAM
Od cache jest bardzo szybki, jest umieszczona w informacji pamięci podręcznej, który jest często określoną procesor - co przyspiesza jej pracy. Informacje zawarte w pamięci RAM jest umieszczone w buforze, a następnie obraca się procesor. Istnieje kilka systemów interakcji między cache i pamięci głównej.
Pamięć podręczna z bezpośrednim mapowania. Najprostszy wariant oddziaływania podręcznej pamięci RAM. RAM jest podzielona na segmenty (strony), poziom głośności w całej objętości bufora (np, objętość 64 KB pamięci podręcznej i pamięć podzielona jest na stronach 64 KB). Interakcja podręcznej RAM, jedna strona jest umieszczona w pamięci podręcznej RAM, zaczynając od zera adres (czyli z pamięci podręcznej począwszy). W interakcji reoperacji, następna strona jest nałożony na istniejący - czyli w rzeczywistości, stare dane zostaną zastąpione przez prąd.
Korzyści: Łatwy panel Organizacja, minimalne przeszukiwanie.
Wady: nieefektywne wykorzystanie całej objętości bufora - nie jest konieczne, aby dane zajmie całą objętość pamięci podręcznej, mogą mieć i 10%, ale następny fragment danych eliminuje poprzedni, więc tak naprawdę cache znacznie mniejszej objętości.
Wybieranie-skojarzeniowa pamięć podręczna. Wszystkie objętości cache jest podzielony na kilka równych segmentów wielokrotne dviytsi w całym zakresie (2, 4, 8). Na przykład, 64 KB cache można podzielić na:
Segment 2 z 32 KB każdego;
Segment 4 do 16 kB każda;
8 segmentów i 8 KB.
Pentium 3 i 4, 8-kanałowy Struktura pamięci podręcznej (cache jest podzielone na 8 segmentów); Athlon Thunderbird - 16-kanałowy.
W takim układzie, RAM jest podzielony na poziomie strony, w odniesieniu do jednego segmentu pamięci podręcznej (cache) jeden bank. Strona RAM są zapisywane w pierwszej pamięci podręcznej banku; następna strona - w drugim banku pamięci podręcznej i tak dalej, aż wszystkie banki pamięci podręcznej są wypełnione. Dalsze informacje znajdują się w buforze zapisu w banku, która nie została wykorzystana najdłuższy (zawiera większość "starych" informacji).
Korzyści: zwiększa wydajność całego wielkości cache - większe banki pamięci podręcznej (powyżej skojarzeń), wyższą sprawność.
Wady: bardziej skomplikowane zarządzanie pamięci podręcznej; Dodatkowy czas analizy informacji.
Skojarzeniowa pamięć podręczna. To ograniczenie przypadku poprzedniej opcji, jeśli wielkość banku cache jest równa jednej linii pamięci podręcznej (akcja ma nigdzie). Tak więc każda linia RAM mogą być przechowywane w dowolnym cache lokalizacji.
Tablica pamięci podręcznej bagażu składa się z wierszy o równej długości. Wydajność tego przewodu jest równa wielkości schytыvaemoho opakowania RAM 1 cyklu (np Pentium 3 - 32 bajtów, Pentium 4 - 64 bajtów). Linia jest ładowany do pamięci podręcznej, a tylko w pełni wyodrębnione.
Korzyści: maksymalne wykorzystanie przestrzeni w pamięci podręcznej.
Wady: Największą stratą czasu wyszukiwania informacji.
