User mode VS Kernel mode

Een van de meest interessante en meest gebruikte concepten in de x86 architectuur is Protected mode en de ondersteuning daarvan in 4 modi (aka ringen):

Het was een uitdagend idee om te begrijpen en ik zal proberen het in dit bericht zo duidelijk mogelijk uit te leggen. We zullen de volgende concepten behandelen:

GDT, LDT, IDT.
Virtual memory translation.
ASLR en Kernel ASLR (KASLR).

Laten we beginnen met de basis, elke computer heeft op zijn minst (hopelijk) de volgende componenten: CPU, Schijf en RAM. Elk van deze componenten heeft een sleutelrol in de stroom van het systeem. De CPU voert de commando’s en operaties uit op het geheugen (RAM), het RAM bevat de data die we gebruiken en maakt snelle en betrouwbare toegang ertoe mogelijk, de schijf bevat persistente data die we nodig hebben om te blijven bestaan, zelfs na opnieuw opstarten of afsluiten. Ik ga hier van uit omdat, ook al is dit de basis, het belangrijk is om dit in gedachten te houden en terwijl je door dit artikel leest jezelf af te vragen over welke component we het op dat moment hebben.

Het besturingssysteem is de software die dit alles orkestreert, en ook degene die een snelle, gemakkelijke, consistente en efficiënte interface mogelijk maakt om toegang te krijgen tot al zijn mogelijkheden – waarvan sommige toegang geven tot die hardware, en andere het gemak en de prestaties verhogen.

Zoals elke goede software werkt het OS in lagen, de kernel is de eerste laag en – naar mijn mening – de meest belangrijke. Om het belang van de kernel te begrijpen, moeten we eerst zijn acties en uitdagingen begrijpen, dus laten we eens kijken naar enkele van zijn verantwoordelijkheden:

Handelen van systeemaanroepen (dezelfde interface waar we het over hadden).
Bronnen toewijzen (RAM, CPU, en nog veel meer) aan de processen/threads in de hand.
Beveiligen van de uitgevoerde operaties.
Tussenpersoon tussen de hardware en de software.

Vele van deze acties worden uitgevoerd met de genereuze hulp van de processor, in het geval van x86, Protected mode is de modus die ons in staat stelt om de kracht (instructieset) van de momenteel draaiende uitvoeringscontext te beperken.

Laten we aannemen dat we twee werelden hebben – de wereld van de gebruiker en de wereld van de supervisor. Op elk gegeven moment kun je maar in een van die werelden zijn. Als je in de wereld van de gebruiker bent, zie je de wereld zoals de opzichter wil dat je hem ziet. Laten we eens kijken wat ik daarmee bedoel:

Laten we zeggen dat je een proces bent. Een proces is een container van een of meer threads. Een thread is een uitvoeringscontext, het is de logische eenheid waarvan de machine-instructies worden uitgevoerd. Dit betekent dat wanneer de thread aan het uitvoeren is, laten we zeggen, lezen van het geheugenadres 0x808080, het feitelijk verwijst naar het virtuele adres 0x808080 van het huidige proces. Zoals je kunt raden, zal de inhoud van het adres verschillend zijn tussen twee processen. Nu is de virtuele adresruimte op procesniveau, wat betekent dat alle threads van hetzelfde proces dezelfde adresruimte hebben en toegang hebben tot hetzelfde virtuele geheugen. Om een voorbeeld te geven van een bron die zich op threadniveau bevindt, laten we de beroemde stack gebruiken.

Dus ik heb een thread die de volgende code uitvoert:

Zoals u kunt zien hadden alle threads hetzelfde stacksegment omdat ze dezelfde virtuele adresruimte hebben. De stack pointer voor elke thread is anders omdat elke thread zijn eigen stack heeft om zijn waarden in op te slaan.

Noot over het stack segment – Ik zal meer uitleggen over segment registers in de GDT/LDT sectie – voor nu geloof me op mijn woord.

Dus waarom is dit belangrijk? Op elk willekeurig moment kan de processor de thread bevriezen en de controle aan een andere thread geven. Als onderdeel van de kernel is de scheduler degene die de CPU toewijst aan de op dat moment bestaande (en “gereed” zijnde) threads. Om de threads betrouwbaar en efficiënt te laten werken, is het essentieel dat elke thread zijn eigen stack heeft, waarin hij zijn relevante waarden kan opslaan (lokale variabelen en retouradressen bijvoorbeeld).

Om zijn threads te beheren, houdt het besturingssysteem voor elke thread een speciale structuur bij, genaamd TCB (Thread Control Block), in die structuur slaat het – onder andere – de context van die thread en zijn status op (running / ready / etc…). De context bevat – opnieuw – onder andere, de CPU-registers waarden:

EBP -> Basisadres van de stack, elke functie gebruikt dit adres als het basisadres van waaruit het offset om lokale variabelen en parameters te openen.
ESP -> De huidige pointer naar de laatste waarde (eerste naar pop) op de stack.
General purpose registers -> EAX, EBX, enz…
Flags register.
C3 -> bevatten de locatie van de page directory (wordt later besproken).
EIP – De volgende instructie die wordt uitgevoerd.

Naast threads moet het besturingssysteem nog een heleboel andere dingen bijhouden, waaronder processen. Voor processen bewaart het OS de PCB (Process Control Block) structuur, we zeiden dat er voor elk proces een geïsoleerde adresruimte is. Laten we nu eens aannemen dat er een tabel is die elk virtueel adres aan een fysiek adres koppelt en dat die tabel in het PCB is opgeslagen, het OS is verantwoordelijk voor het bijwerken van die tabel en houdt die bijgewerkt tot de juiste toestand van het fysieke geheugen. Elke keer als de scheduler de uitvoering naar een bepaalde thread schakelt, wordt de tabel die is opgeslagen voor het eigen proces van die thread toegepast op de CPU, zodat hij in staat is om de virtuele adressen correct te vertalen.

Dat is genoeg voor de concepten, laten we begrijpen hoe het werkelijk wordt gedaan. Laten we daarvoor eens naar de wereld kijken vanuit het perspectief van de processor:

Global Descriptor Table

We weten allemaal dat de processor registers heeft die hem helpen berekeningen te maken, sommige registers meer dan andere (;)). Door het ontwerp ondersteunt de x86 meerdere modi, maar de belangrijkste zijn gebruiker en supervisor, de CPU heeft een speciaal register genaamd gdtr (Global Descriptor Table Register) dat het adres bevat van een zeer belangrijke tabel. die tabel wijst elk virtueel adres toe aan de overeenkomstige modus van de processor, het bevat ook de permissies voor dat adres (READ | WRITE | EXECUTE). uiteraard kan dat register alleen worden gewijzigd vanuit de supervisor-modus. Als deel van de uitvoering van de processor, controleert hij welke instructie de volgende is om uit te voeren (en op welk adres die is), hij controleert dat adres met de GDT en op die manier weet hij of het een geldige instructie is, gebaseerd op de gewenste modus (komt overeen met de huidige modus van de CPU en de modus in de GDT) en permissies (indien niet uitvoerbaar – ongeldig). Een voorbeeld is ‘lgdtr’ de instructie die waarde laadt in het gdtr register en deze kan alleen worden uitgevoerd vanuit de bewaakte modus zoals vermeld. Het belangrijkste punt om hier te benadrukken is dat elke bescherming over de geheugen operaties (uitvoeren van instructie / schrijven naar ongeldige plaats / lezen van ongeldige plaats) wordt gedaan door de GDT en LDT (komt hierna) op het niveau van de processor met behulp van deze structuren die werden gebouwd door het OS.

Zo ziet de inhoud van een invoer in GDT / LDT eruit:

http://wiki.osdev.org/Global_Descriptor_Table