SPÉCIFICATIONS MARC 21
JEUX DE CARACTÈRES - Tableaux des codes

Le présent document renferme les répertoires de caractères MARC 21 qui fournissent les codes de caractères MARC-8 et UCS/Unicode.

Seuls les caractères qui peuvent être utilisés dans les notices MARC 21 ainsi que leurs valeurs respectives sont inclus dans les tableaux. Tous les codes qui ne sont pas utilisés sont réservés afin d'être définis ultérieurement dans le système MARC 21.

Les correspondances relatives aux jeux de caractères MARC-8 et Unicode en versions XML ou délimité sont disponibles pour les applications logicielles. Ces tableaux ne sont pas disponibles en français. Les liens renvoient à des tableaux qui emploient les noms de caractères anglais.


Les chiffres, les signes de ponctuation et les symboles qu'on retrouve aux positions ASCII 21-3F, 5B, 5D (hex) et qui figurent également, en tout ou en partie, parmi les jeux de caractères MARC-8 pour ce qui est des alphabets hébreu, cyrillique et arabe sont appliqués à un seul jeu de caractères dans le système UCS/Unicode. L'application ne peut être parfaitement réversible dans chaque situation, mais il est peu probable que les échecs se produisent avec de vraies données, et la signification est préservée même lorsqu'on ne conserve pas l'encodage précis. On a considéré que cette application était préférable à l'utilisation des valeurs réservées à des fins personnelles pour ce qui est des caractères qui apparaissent en double.

En plus d'appliquer les codes de caractères, la conversion des données MARC-8 en UCS/Unicode peut nécessiter les opérations supplémentaires suivantes :

  • réordonnancement des signes sans espacement et des caractères de base afin que le caractère de base précède les caractères combinateurs;
  • la réordonnance de l'ordre visuel à l'ordre logique des chiffres pour les nombres à caractères multiples des jeux de caractères Hébreux ou Arabe..

Lorsqu'on convertit des données du système UCS/Unicode à MARC-8, on doit déplacer les signes sans espacement afin qu'ils précèdent les caractères de base. Comme il n'existe aucun chiffre hébreu codé de manière distincte dans le système UCS/Unicode, tous les nombres à plusieurs chiffres seront convertis en encodages latins de base (ASCII) et devraient maintenir un ordre logique comparable à ceux du système MARC-8. Ils ne nécessitent donc aucune conversion spéciale. Les nombres à plusieurs chiffres « hindi » seront convertis en chiffres « hindi » dans le jeu de caractères arabe MARC-8. L'ordre logique des chiffres du système d'encodage UCS/Unicode peut être maintenu ou, lorsqu'une exécution favorise un ordre visuel pour ces chiffres, une conversion spéciale peut être requise.


Chaque tableau est suivi de la liste des valeurs des codes pour les systèmes MARC-8 et UCS/Unicode. La première colonne de chaque liste renferme le code MARC à 8 bits (en hex), la seconde colonne contient le code UCS/Unicode à 16 bits (en hex) et la troisième colonne indique les noms des caractères : nom MARC/nom UCS. Si le nom MARC est le même que le nom UCS, ou s'il est semblable à ce dernier, seul le nom UCS apparaît.



MARC 21 en version anglaise sur le site de la Bibliothèque du Congrès