Scanner/Tokenizer/fr

From Free Pascal wiki
Jump to navigationJump to search

English (en) français (fr)

Retour au contenu FPC internals

Scanner/Tokenizer

Le scanner et tokenizer est utilisé pour construire un flux d'entrée de jetons qui alimentera l'analyseur. C'est lors de cette étape que les prétraitement (preprocessing) est réalisé, que toutes les directives du compilateur qui sont lues modifient l'état interne des variables du compilateur, et que tous les caractères illégaux trouvés dans le flux d'entrée provoquent une erreur.

Infos sur comment les macros fonctionnent : Macro internals.

Architecture

L'architecture générale du scanner est montrée dans la figure suivante: http://www.pjh2.de/fpc/CompilerInternalsFigure02.png

Plusieurs types peuvent être lus depuis le flux d'entrée, une chaîne, traitée par readstring, une valeur numérique, traitée par readnumeric, des commentaires, des directives du préprocesseur et du compilateur.

Flux d'entrée

(dernière mise à jour pour fpc version 1.0.x)

Les données d'entrée sont manimpulées via la manière générale de traitement des E/S dans le compilateur. C'est à dire qu'il y a un hook qui peut être surchargé dans comphook.pas (do_openinputfile), au cas où une autre méthode serait voulue.

Le hook par défaut utilise un flux DOS non tamponné contenu dans files.pas.

Préprocesseur

(dernière mise à jour pour fpc version 1.0.x)

L'analyseur lexical résoud toutes les directives du préprocesseur et donne uniquement à l'analyseur syntaxique la partie visible du code (telle que celle qui est inclue dans les directives conditionnelles). es commutateurs et les directives du compilateur sont également enregistrés dans des variables globales dans le préprocesseur, par conséquent, cette partie est complètement indépendante de l'analyseur.

Compilation conditionnelle (scandir.inc, scanner.pas)

(dernière mise à jour pour fpc version 1.0.x)

La compilation conditionnelle est manipulée via une pile du préprocesseur, ou chaque directive est placée sur la pile, et dépilée quand elle est résolue. L'implémentation actuelle de la pile est une liste chaînée des éléments de directive du préprocesseur.

Commutateurs du compiler (scandir.inc, switches.pas)

(dernière mise à jour pour fpc version 1.0.x)

Les commutateurs du compilateur sont gérés via une table de recherche (lookup table) qui fait l'objet d'une recherche linéaire. Ensuite, une autre table de recherche s'occupe de définir les indicateurs de bits et les variables appropriés dans les commutateurs pour ce processus de compilation.

Interface de l'analyseur

(dernière mise à jour pour fpc version 1.0.x)

L'analyseur sémantique ne reçoit que des jetons en entrée, où un jeton est une énumération qui indique le type du jeton, soit un mot réservé, un caractère spécial, un opérateur, une constante numérique, une chaîne ou un identificateur.

La résolution d'une chaîne en un jeton est faite à travers une référence qui recherche la chaîne dans une table pour trouver le jeton correspondant grâce à un algorithme de recherche binaire à travers cette table de chaîne.

Dans le cas des identificateurs et les constantes (y compris les valeurs numériques), la valeur est retournée dans le variable chaîne pattern, avec la valeur de retour appropriée du jeton (les valeurs numériques sont aussi retournées comme des chaînes non converties avec un préfix spécial inclus). Dans le cas des opérateurs et des mots réservés, seul le jeton lui-même doit être considéré comme préservé. La chaîne d'entrée lue est supposée perdue

Par conséquent, l'interface avec l'analyseur est avec la routine readtoken () et la variable pattern.

Routines

ReadToken

Déclaration: procedure ReadToken;
Description: Définit la variable globale de jeton par le dernier jeton lu, et définit la variable pattern de manière appropriée (si nécessaire)

Variables

Token

Déclaration: var Token: TToken;
Description: Contient le dernier jeton lu lors du dernier appel à la routine ReadToken
Voir aussi: ReadToken

Pattern

Déclaration: var Pattern: String;
Description: Contient la chaîne du dernier modèle lu après la dernier appel à ReadToken
Voir aussi: ReadToken

Interface du parseur d'assembleur

(last updated for fpc version 1.0.x)

The inline assembler parser is completely separate from the pascal parser, therefore its scanning process is also completely independent. The scanner only takes care of the preprocessor part and comments, all the rest is passed character per character to the assembler parser via the AsmGetChar() scanner routine.

Routines

AsmGetChar

Declaration: function AsmGetChar: Char;
Description: Returns the next character in the input stream.


Prochain chapitre: L'arbre d'analyse