The register allocator/fr
│
English (en) │
français (fr) │
Retour au contenu FPC internals
Introduction
L'unité principale pour l'allocation de registre est rgobj.pas. La classe principale pour l'allocation de registre TRgObj qui se trouve dans rgobj.pas.
L'allocateur de registre fournit des registres imaginaires pour les instructions en assembleur pendant la génération de code. Ensuite il calcule les registres réels pour remplacer les imaginaires.
L'allocateur de registre de FPC utilise la coloration de registre pour déterminer les registres réels. Il utilise aussi une technique de débordement (spilling) de registre - quand il n'y a pas assez de registres, il utilise la mémoire.
Comment utiliser l'allocateur de registre
Ce sujet décrit comment utiliser l'allocateur de registre pendant la génération de code. Décrit comme une boîte noire avec des méthodes publiques que vous pouvez appeler pour faire le travail.
Création de l'allocateur de registre
La première étape consiste à créer l'allocateur de registre avnt de pouvoir utiliser ses fonctionnalités.
Le générateur de code de bas niveau créée plusieurs instances de la classe TRgObj. Normalement, cela se produit dans :
tcg.init_register_allocators
Et les instances sont normalement libérées dans :
tcg.done_register_allocators
Chaque instance TRgObj alloue des registres d'un certain type. Par exemple, un type de registre définit les registres entiers. Un autre définit les registres en virgule flottante (FPU). C'est pourquoi nous avons quelques instances TRgObj, une pour chaque type de registre que la CPU supporte.
Ils sont créés quand la génération de code d'une routine spécifique commence. Le générateur de code travaille au niveau sous-routines. L'allocateur de registre alloue aussi les registrer pour une méthode, procédure ou fonction spécifique.
Utilisation des registres dans la génération de code
Pour allouer un registre, utilisez la méthode suivante :
TRgObj.getRegister
à partir de l'instance appropriée d'allocateur de registre (en fonction du type de registre) pour obtenir le registre d'une instruction assembleur. De cette façon, un registre imaginaire est alloué et peut être utilisé après cela dans une instruction d'assembleur spécifique.
Le générateur de code l'appelle dans les fonctions suivantes :
tcg.GetIntRegister tcg.GetAddressRegister tcg.GetFPURegister tcg.GetMMRegister
En outre, les méthodes suivantes :
TRgObj.getCpuRegister TRgObj.ungetCpuRegister TRgObj.allocCpuRegisters TRgObj.deallocCpuRegisters
allouent ou libèrent un ou plusieurs registres réels (pas les imaginaires !). Ceci est généralement utilisé pour les instructions qui demandent un registre spécifique (par exemple SHL/SHR/SAR on x86, qui utilisent toujours ECX). C'est aussi utilisé quand on fait un appel de fonction pour indiquer que certains registres (ce qui dépend de la convention d'appel) peuvent être détruits par l'appel de fonction.
Après l'allocation du registre, nous pouvons l'utiliser dans des insrtructions assembleur. Pour chaque instruction qu'il génère, le générateur de code notifie l'allocateur de registre. Il passe l'instruction, ainsi que le registre imaginaire comme paramètres à la méthode suivante.
TRgObj.add_reg_instruction(instr, r, cg.executionweight);
Mais pour l'instruction MOV, une méthode spécifique est utilisée
TRgObj.add_move_instruction(instr:Taicpu);
Un poids est également fourni pour déterminer quel registre doit être débordé (spilled) et lequel il est préférable d'utiliser un vrai registre CPU.
Générer les registres réels
A la fin, quand tous les instruction assembleur sont générées, nous appelons
do_register_allocation(list: TAsmList; headerTai: TAi)
Il calcule les registres réels pour les imaginaires.
Des instructions peuvent utiliser seulement certain types de registres. Ainsi, l'allocateur de registre ne peut pas choisir tous les registres CPU. Pour ces instructions, nous notifions l'allocateur de registre en appelant la méthode
TRgObj.add_Edge
Ces interférences sont construites pendant l'allocation de registre. Chaque descendant qui veut ajouter des interférences surcharge la méthode
procedure TRgObj.add_cpu_interferences(p: TAi); virtual;
Nous avons des descendants de TRgObj pour les différents types de processeurs. Ils appellent add_edge dans add_cpu_interferences selon l'architecture CPU particulière. C'est utilisé pour les processeurs ARM, x86 etc.
Dans la méthode tcgprocinfo.generate_code, qui se trouve dans l'unité psub.pas, est implémentée la création d'allocateurs de registre, l'obtention des registres, la génération de registres réels. Cette méthode occupe une place centrale dans la génération de code qui l'allocation de registre. Dans celle-ci, vous pouvez trouver un appel à hlcg.init_register_allocators pour créer les allocateurs de registre. Faites appel à cg.do_register_allocation(aktproccode,headertai); - pour faire l'allocation effective et aussi à hlcg.done_register_allocators; pour les libérer les allocateurs.
Conseil
Vous pouvez compiler votre projet en utilisant le commutateur -sr. Cela permettra de conserver les noms de registre imaginaire dans le fichier .s généré.
Hiérarchie des appels pour les méthodes publiques
Public
constructor
destructor
do_register_allocation - level 1 is ordered by calling
insert_regalloc_info_all
generate_interference_graph
add_edges_used(1, 2) get_alias add_edge
add_edge ibitmap.s
prepare_colouring
make_work_list ri_coalesced
sort_simplify_worklist
colour_registers
simplify ri_coalesced
decrement_degree ri_coalesced
coalesce get_alias simplifyworklist.add(v); ibitmap
conservative ri_coalesced
adjacent_ok ri_coalesced ibitmap
add_worklist simplifyworklist.add(u);
combine ibitmap, add_edge
enable_moves
decrement_degree ri_coalesced simplifyworklist.add(m)
add_edge ibitmap.s
freeze
freeze_moves(, 2) get_alias(3)
select_spill
freeze_moves(, 2) get_alias(3)
assign_colours(, 2) get_alias
epilogue_colouring Destroys the objects used during the coloring - worklist_moves, active_moves, frozen_moves, coalesced_moves, constrained_moves, reginfo.movelist
spill_registers
clear_interferences ibitmap.s
instr_spill_register get_alias
getregisterinline
add_edges_used(2, 2) get_alias
add_edge ibitmap.s
ungetregisterinline
get_spill_subreg
do_spill_replace
do_spill_read
do_spill_written
translate_registers
assign_colours(, 2) get_alias
getregister
add_move_instruction
add_to_movelist
combine ri_coalesced(s)
enable_moves
decrement_degree ri_coalesced
-----------------------------------------
Properties
live_range_direction
set_live_range_direction
live_start
get_live_start
set_live_start
live_end
get_live_end
set_live_end
Classe TRgObj
Description
Classe principale pour l'allocation de registre dans FPC
Méthodes publiques
Méthodes protégées
Méthodes privées
Registres imaginaires
Stockage des registres imaginaires
TRgObj stockent les registres imaginaires dans une liste de structure TRegInfo.
Vie d'un registre imaginaire
La vie d'un registre imaginaire commence quand il est utilisé la première fois pas une instruction assembleur. Lorsqu'il apparaît pour la première fois dans une instruction assembleur dans la liste assembleur pour la routine spécifique. Et finit quand il est utilisé pour la dernière fois dans une instruction assembleur. Dans la structure TRegInfo pour le registre imaginaire particulier, il y a deux champs pour la vie du registre.
- live_start: TAi; indique quelle est l'instruction assembleur où le registre est utilisé pour la première fois.
- live_end: TAi; indique quelle est l'instruction assembleur où le registre est utilisé pour la dernière fois.
Interférences
Interférences
Hiérarchie d'appel:
generate_interference_graph add_edges_used(1, 2) get_alias add_edge add_edge ibitmap.s
generate_interference_graph
Cette méthode itère sur la liste assembleur. Recherchant l'instruction reg_alloc avec le bon regType.
Pendant cette itération, nous gardons tout registre en vie dans la liste - live_registers. S'il est alloué, elle ajoute le superregistre à live_registers S'il est désalloué, elle le retire de live_registers.
Après l'ajout ou le retrait dans live_registers, elle appelle add_edges_used.
add_edges_used
Itère sur tout live_registers et appelle add_edge Itère tous les live_register et appelle add_edge, elle obtient l'alias du live_register actuel et le super registre qui est à la méthode.
add_edge
Quand nous ajoutons un bord, nous gardons l'information sur deux endroits. L'un est dans le interferenceBitmap. Et l'autre dans la adjList de l'information de registre dans:
reginfo[u].adjList.add(v);
reginfo[v].adjList.add(u);
ibitmap[v, u] := true;
ibitmap[u, v] := true;
Dans la relation entre ces deux registres, il n'y a pas de dépendance. Il n'y a pas de primaire , ils sont égaux dedans.
Dans reginfo, vous accédez à l'information par un index et dans la Bitmap vous faites pareil. C'est à peu près la même chose en vitesse.
Interférences travaillent avec les super registres.
Arrière-plan
Groupement des instructions
Un regard plus abstrait sur les instructions CPU nous montre que nous avons principalement peu de sortes d'instructions.
- Le premier groupe contient des instructions qui modifient quelques données.
Ces données restent à la même place mais sont modifiées. Vous n'avez pas non plus besoin de données supplémentaires pour effectuer le changement. Quelques instructions de ce groupe sont INC, DEC, CLC, CLD
- Le second groupe sont des instructions qui déplacent les données d'un endroit à un autre.
Telle que MOV, LAHF, POP, PUSH, LEA
- Le troisième groupe d'instructions sont celles qui comparent les données et ne font aucune modification, il suffit de les contrôler.
De telles instructions sont TEST, COMPARE
- Le quatrième groupe d'instructions sont celles qui changent le flot d'exécution des instructions, telles que JMP, JCC, JCXZ,
- Le cinquième groupe sont les instructions qui changent des données basées sur d'autres données comme ADD
Un autre regroupement d'instructions pourrait être par la version de la CPU où l'instruction apparaît en premier.
Encore un autre groupement pourrait être basé sur les registres qui peuvent être utilisés dans l'instruction.
Certaines instructions peuvent utiliser seulement des registres spécifiques pour l'adresse - mov ax, [bx + si + 1000]. Vous pouvez choisir seulement entre par exemple ces registres - BP, BX, SI et DI. Certaines instructions peuvent utiliser seulement des registres, d'autres des adresses, d'autres encore les deux.
Certains registres ont des sous-registres, d'autres non.
Données dans les instructions
Presque toutes les instructions opèrent sur des données. Aussi elles utilisent de la données pour réaliser l'opération. La donnée peut être dans les registres CPU, la mémoire ou dans les drapeaux de la CPU.
Programmation utilisant les instructions
Les instructions sont indépendantes l'une de l'autre. Pourtant, quand un programme est créé, il y a des dépendances logiques que le programmeur introduit. Un programmeur veut que des modifiées soient apportées à certaines données. Ce qui peut être réalisé par un peu d'instructions exécutées les unes après les autres. Et à la fin, les données voulues seront produites. Mais la donnée n'est pas exactement un registre CPU ou une adresse mémoire. Les données sont quelque chose dont le programmeur se soucie. Par exemple, nous avons une donnée qui vaut 1000 au départ. Nous pouvons la placée dans un registre CPU que nous voulons pour y ajouter 200. Nous pouvons utilmiser une instruction assembleur ADD mais ensuite nous pouvons déplacer la valeur que nous avons atteinte dans un autre registre. Et alors l'incrémenter de 300 à la fin, nous aurons la valeur recherchée 1500. Mais nous utilisons deux registres pour une seule donnée, ce que nous n'avons pas besoin normalement. Nous pouvons le faire en en utilisant un seul. Parce que nous devons déplacer les données vers le deuxième registre quelque part au milieu. Et cela est une intruction supplémentaire. Cependant, plusieurs données sont traitées en parallèle. Et parfois nous utilisons ce déplacement supplémentaire , seulement pour accélerer les exécutions sur d'autres données. Ceci est normalement nécessaire lorsque des données sont produites pour calculer la troisième. Ce n'est pas très important pour l'allocateur de registre, c'est plus destiné au générateur de code. Le générateur de code pourrait décider où ajouter des instructions supplémentaires, pour accélérer d'autres exécutions. Il semble que l'allocateur de registre ne devrait pas s'en soucier. Mais il est bon d'y penser.
Lignes directrices de la conception objet
Dans l'implémentation actuelle, l'obtention des registres et l'attribution sont mélangées. Ils partagent également les mêmes structures, la même classe. Mais les données pour chacun d'entre eux sont utilisées sur des phases complètement différentes. Les mélanger ensemble apporte plus de code en un seul endroit. De plus, il devient difficile de les séparer lorsque vous travaillez dessus. Ils peuvent être facilement divisés sans perte de vitesse. Différents types d'allocations de registre peuvent également être utilisés. L'obtention des registres et le réglage des poids, ainsi que la vie ... peuvent être en un seul endroit. Mais à la fin, différents allocateurs peuvent traiter ces données. Il est difficile de développer davantage l'attribution du registre car de nombreuses phases et la logique ont été réunies en un seul endroit.
Dans la méthode
TRgObj.colour_registers
, une approche différente peut être effectuée.
La saisie de différents états peut être implémentée. Vérifiez plutôt les décomptes de toutes les listes. Ce sera plus rapide. Code clair. Facile à déboguer. Facile à développer davantage.
Des améliorations peuvent être apportées aux poids des instructions. Ou de la manière dont l'allocateur décide quel registre déverser et lequel non.