SPÉCIFICATIONS MARC 21
JEUX DE CARACTÈRES - Caractères de l'Asie orientale
NOTE : Veuillez noter que cette section comporte plus de 200 pages de codes.
Mappages de caractères EACC à UCS / Unicode
Le présent document contient des liens menant à 15 738 mappages de caractères appartenant au jeu de caractères codés de l'Asie de l'est, East Asian Character Code for Bibliographic Use (ANSI/NISO Z39.64 « EACC ») avec des caractères figurant dans le jeu universel de caractères codés (UCS)/Unicode. En raison du grand nombre de caractères représentant des idéogrammes de l'Asie orientale, le nom précis de chaque caractère n'est pas fourni dans tous les cas. Le tableau est fondé sur une consolidation de 13 groupes de mappages de caractères du EACC avec des caractères UCS/Unicode effectuée en décembre 2001 par la Library of Congress.
Les codes de caractères sont associés à une numération hexadécimale. Chaque caractère est présenté dans une rangée distincte de la table de mappage à laquelle il appartient. Les colonnes de chaque table de mappage renferment les données suivantes :
- Colonne 1 : code EACC de 3 octets (24 bits) (numération hexadécimale);
- Colonne 2 : code UCS/Unicode de 16 bits (numération hexadécimale);
- Colonne 3 : équivalent UTF-8 (numération hexadécimale) des codes de caractères UCS;
- Colonne 4 : représentation du caractère (lorsque possible);
- Colonne 5 : nom du caractère ou type (dans les cas où le caractère n'a pas de nom précis).
Dans certaines tables, des encodages de rechange sont insérés dans deux colonnes supplémentaires ajoutées après la colonne 5. Les codes UCS/Unicode de rechange ne sont fournis que lorsqu'un caractère MARC-8 a dû être mappé avec un caractère de la Private Use Area (PUA) d'Unicode, et un mappage de rechange avec geta est indiqué.
Dans chacune des tables de caractères est-asiatiques, les caractères sont classés selon l'ordre des codes de caractères EACC.
Révisé le 6 février 2002 pour ajouter le caractère japonais katakana correspondant à ZO (EACC=69253E, U+30BE) et pour corriger le code EACC correspondant à un idéogramme chinois existant.
Révisé le 24 juillet 2002 pour ajouter dix caractères de la version J du EACC qui n'ont jamais été publiés dans ANSI/NISO Z39.64 mais qui ont été intégrés aux systèmes des bibliothèques utilisant le format MARC :
- EACC=213647; U+5537
- EACC=233F62; U+9123
- EACC=273C67; U+E9D8
- EACC=3F377B; U+E9D9
- EACC=455564; U+6FDB
- EACC=455E60; U+95EB
- EACC=455F35; U+9668
- EACC=4B3C2B; U+E9C7
- EACC=4B4444; U+E9C8
- EACC=707771; U+9EE2
Révisé le 6 février 2003 pour ajouter des mappages de rechange ne faisant pas partie de la PUA correspondant à 75 idéogrammes est-asiatiques qui sont mappés avec des caractères Unicode de la Private Use Area.
Révisé le 8 juin 2004 pour effectuer les changements suivants :
- Fournir de nouveaux mappages de rechange pour 4 caractères de la version J qui étaient auparavant mappés avec geta (U+3013), soit EACC 273C67, 3F377B, 4B3C2B et 4B4444;
- Corriger le mappage de rechange pour EACC 2D552E;
- Retirer EACC 4B3850 de la PUA étant donné qu'un mappage direct a été déterminé, soit U=5861;
- Corriger une faute de frappe dans le mappage de rechange pour EACC 217559, 222A34 et 223339.
Révisé le 2 septembre 2004 pour effectuer les modifications suivantes :
- Retirer EACC 6F773C de la PUA et l'intégrer au mappage de EACC 6F5658 : U+C717;
- Retirer EACC 6F7625 de la PUA et le mapper avec U+318D;
- Retirer EACC 217559, 222A34 et 223339 de la PUA et les mapper avec U+212C4, U+2251B et U+22C4D, respectivement. Les caractères sont mappés avec des caractères Unicode figurant dans l'ensemble B de Unicode CJK, qui ne fait pas partie du Basic Multilingual Plane (BMP);
- Retirer tous les caractères PUA auxquels correspond un mappage de rechange (qui ne sont pas mappés avec geta) entre la PUA et les encodages de rechange (consulter le document : Modifications aux mappages Unicode s'appliquant aux caractères en format MARC 21 qui appartenaient antérieurement à la Private Use Area (PUA))
- Annuler le mappage des caractères EACC ci-après, qui étaient mappés avec des idéogrammes de compatibilité Unicode CJK, pour les mapper avec leurs équivalents canoniques Unicode figurant parmi les idéogrammes unifiés CJK : EACC 4B333E, 4B7421, 4B4B3E, 4B5F58, 214339, 215F71, 215061 et 215C32 (les mappages Unicode précédents étaient F92E, F9A9, F9AD, F9B2, FA12, FA1C, FA1D et FA25, respectivement).
MARC 21 en version anglaise sur le site de la Bibliothèque du Congrès