SPÉCIFICATIONS MARC 21
STRUCTURE DES NOTICES
Le format MARC 21 est la mise en œuvre de la norme nationale américaine, Information Interchange Format (ANSI Z39.2) et de la norme internationale équivalente, Format pour l'échange d'information (ISO 2709). Ces normes précisent les exigences d'un format d'échange général qui pourra comprendre des données décrivant toutes les formes de documents qui peuvent se prêter à la description bibliographique ainsi que des données connexes telles que des données d'autorité, de classification, de renseignements communautaires et de fonds. Les normes présentent une structure générale des notices. Elles ne précisent toutefois pas le contenu des notices et elles n'attribuent pas non plus, en général, de signification aux étiquettes, aux indicateurs et aux identificateurs d'éléments de données, car ce sont des mises en œuvre particulières des normes qui précisent ces éléments. Voici donc la description de la structure des notices MARC 21, qui indique les choix particuliers de la mise en œuvre des normes par les formats MARC 21.
STRUCTURE GÉNÉRALE DE NOTICE
La structure générale d'une notice est représentée schématiquement ci-dessous.
- Structure d'une notice MARC 21
Guide |
Répertoire |
TZ |
Zone_du_numéro_de_contrôle |
TZ |
-
Zone_de_contrôle |
TZ |
... |
Zone_de_contrôle |
TZ |
-
Zone_de_données |
TZ |
... |
Zone_de_données |
TZ |
TN |
Au début de chaque notice, il y a le guide, qui constitue une zone de longueur fixe contenant de l'information aux fins de traitement de la notice.
Puis, c'est le répertoire, soit un index servant à localiser les zones de longueur variable (les zones de contrôle et les zones de données) dans la notice. Les zones qui suivent le répertoire sont toutes de longueur variable.
La première zone de longueur variable, c'est celle contenant le numéro de contrôle, qui renferme une chaîne de caractères graphiques ASCII et qui est associée de façon unique à la notice par l'organisation qui la transmet. La zone du numéro de contrôle est suivie du reste des zones de contrôle, c'est-à-dire des zones qui contiennent de l'information utile ou requise pour traiter la notice. Viennent ensuite les zones de données qui contiennent des données générales.
Un terminateur de zone (TZ), soit le caractère de contrôle ASCII 1E(hexadécimal), sert à marquer la fin du répertoire et de chaque zone de longueur variable dans la notice.
Quant au terminateur de notice (TN), soit le caractère de contrôle ASCII 1D(hexadécimal), il constitue le dernier caractère d'une notice et est placé après le terminateur de la dernière zone de données. Ces éléments de la notice sont décrits plus en détail dans les sections ci-dessous.
Le Guide est la première zone, de longueur fixe de 24 octets (soit les positions de caractère 0-23), de la notice. Il faut entrer uniquement des caractères graphiques ASCII dans le guide. La structure du guide, telle qu'elle est définie dans le format MARC 21, est représentée schématiquement ci-dessous. Les chiffres indiquent les positions de caractère occupées par chaque partie du guide.
- Structure du guide des notices MARC 21
Longueur de l'enregistrement |
Statut de la notice |
Type de notice |
Définition par application particulière |
00-04 |
05 |
06 |
07-08 |
-
Système de codage des caractères |
Compte des indicateurs |
Longueur du code de sous-zones |
09 |
10 |
11 |
-
Adresse de base des données |
Définition par l'application |
Clé d'enregistrement |
12-16 |
17-19 |
20-23 |
- Longueur de l'enregistrement (positions de caractère 00-04)
- Ces positions contiennent une chaîne numérique ASCII à cinq caractères qui est égale à la longueur de l'ensemble de la notice, y compris cette position et le terminateur de la notice. La chaîne numérique à cinq caractères est justifiée à droite, et les positions vides renferment des zéros (remplir de zéros). Une notice peut comprendre au plus 99999 octets.
- Statut de la notice (position de caractère 05)
- Cette position contient un caractère graphique ASCII qui indique le lien de la notice à un fichier (p. ex., nouvelle notice, notice changée ou corrigée, etc.).
- Type de notice (position de caractère 06)
- Cette position renferme un caractère graphique ASCII qui précise les caractéristiques de la notice et en définit les éléments.
- Définition par une application particulière (positions de caractère 07-08)
- Les normes ANSI Z39.2 et ISO 2709 réservent les positions de caractère 07-08 pour définir une application particulière. Ces positions de caractère ont été définies au besoin dans les formats MARC 21. Il faut entrer uniquement des caractères graphiques ASCII. Toute position non définie renferme un blanc.
- Niveau bibliographique (notice bibliographique, position de caractère 07)
- Cette position contient un caractère graphique ASCII qui fournit également de l'information sur les éléments et les caractéristiques de la notice.
- Genre de données (notice de renseignements communautaires, position de caractère 07)
- Cette position renferme un caractère graphique ASCII qui donne aussi de l'information sur les éléments et les caractéristiques de la notice.
- Type de contrôle (notice bibliographique, position de caractère 08)
- Cette position contient un caractère graphique ASCII qui fournit également de l'information sur les éléments et les caractéristiques de la notice.
- Système de codage des caractères (position de caractère
- Cette position contient un code qui identifie le système de codage des caractères utilisé dans une notice.
- Compte des indicateurs (position de caractère 10)
- Cette position renferme un caractère numérique ASCII précisant le nombre d'indicateurs contenus dans chaque zone de données de longueur variable. Dans les notices MARC 21, la position du compte des indicateurs renferme toujours le chiffre 2.
- Longueur du code de sous-zone (position de caractère 11)
- Cette position renferme un caractère numérique ASCII qui précise la longueur totale du délimiteur et de l'identificateur d'élément utilisé dans la notice. Dans les notices MARC 21, la longueur du code de sous-zone est toujours fixée à 2. Dans les normes ANSI Z39.2 et ISO 2709, le terme « longueur de l'identificateur » sert à désigner cet élément de données.
- Adresse de base des données (positions de caractère 12-16)
- Ces positions renferment cinq caractères numériques ASCII qui indiquent la première position de caractère de la première zone de longueur variable dans la notice. L'adresse de base des données est égale à la longueur du guide et du répertoire, y compris le terminateur de zone à la fin du répertoire. La chaîne numérique est justifiée à droite, et les positions vides renferment des zéros (remplir de zéros).
- Définition par une application particulière (positions de caractè 17-19)
- Les normes ANSI Z39.2 et ISO 2709 réservent les positions de caractère 17-19 pour définir une application particulière. Ces positions de caractère ont été définies au besoin dans les formats MARC 21. Il faut entrer uniquement des caractères graphiques ASCII. Toute position non définie renferme un blanc.
- Clé d'enregistrement (positions de caractère 20-23)
- Ces positions renferment quatre chiffres, soit des caractères numériques ASCII, pour préciser la structure des entrées dans le répertoire.
- Longueur du segment « longueur de zone » (position de caractère 20)
- Cette position indique la longueur de ce segment dans chaque entrée du répertoire; dans les notices MARC 21, cette position renferme toujours le chiffre 4.
- Longueur du segment « position du caractère de départ » (position de caractère 21)
- Cette position précise la longueur de ce segment dans chaque entrée du répertoire; dans les notices MARC 21, cette position renferme toujours le chiffre 5.
- Longueur de la partie dépendante de l'application (position de caractère 22)
- Cette position de caractère donne des précisions sur cette partie dans chaque entrée du répertoire; dans les notices MARC 21, une entrée du répertoire ne contient pas de partie dépendante de l'application. Par conséquent, cette position de caractère renferme toujours le chiffre 0.
- Non défini (position de caractère 23)
- Cette position de caractère n'est pas définie et contient donc toujours le chiffre 0.
- Structure d'une clé d'enregistrement dans les notices MARC 21
Longueur du segment « longueur de zone » |
Longueur du segment « position du caractère de départ » |
Longueur de la partie dépendante de l'application |
Non défini |
20 |
21 |
22 |
23 |
Une entrée au répertoire dans le format MARC 21 contient une étiquette, le segment « longueur de la zone » et la position du caractère de départ de la zone. Le répertoire commence à la position de caractère 24 de la notice et se termine par un caractère terminateur de zone. D'une longueur variable, il comprend une série de zones de longueur fixe qui sont appelées « entrées ». Une entrée est associée à chaque zone de longueur variable (que ce soit une zone de contrôle ou de données) dans la notice. Chaque entrée au répertoire renferme 12 positions de caractère; la structure de chaque entrée, telle qu'elle est définie dans le format MARC 21, est représentée schématiquement ci-dessous. Les nombres indiquent les positions de caractère occupées par les parties de l'entrée.
- Structure d'une entrée au répertoire dans les notices MARC 21
Étiquette |
Longueur de la zone |
Position du caractère de départ |
00-02 |
03-06 |
07-11 |
- Étiquette (positions de caractère 00-02)
- Ces positions renferment trois caractères numériques ou caractères alphabétiques ASCII (en majuscules ou en minuscules, mais non une combinaison des deux) qui identifient une zone de longueur variable associée. Dans les formats MARC 21, on utilise seulement des étiquettes renfermant des caractères numériques. L'étiquette d'une zone de longueur variable est stockée uniquement dans l'entrée au répertoire et ne figure pas dans la zone de longueur variable.
- Longueur de la zone (positions de caractère 03-06)
- Ces positions renferment quatre caractères numériques ASCII qui précisent la longueur, exprimée en nombres décimaux, de la zone variable à laquelle l'entrée correspond. Cette longueur comprend les indicateurs, les codes de sous-zones, les données et le terminateur de zone associés à la zone. S'il y a moins de quatre chiffres pour indiquer la longueur de la zone, il faut justifier le nombre à droite et entrer des zéros dans les positions vides (remplir de zéros). Étant donné que dans le format MARC 21 le segment longueur de zone de l'entrée comprend quatre caractères, une zone peut donc comprendre tout au plus 9999 octets.
- Position du caractère de départ (positions de caractère 07-11)
- Ces positions contiennent cinq caractères numériques ASCII qui précisent la position du premier caractère, exprimée en nombres décimaux, de la zone de longueur variable à laquelle l'entrée correspond selon l'adresse de base des données de la notice. S'il y a moins de cinq chiffres pour indiquer la longueur de ce segment, il faut justifier le nombre à droite et entrer des zéros dans les positions vides (remplir de zéros).
- Ordre des entrées
- Les entrées du répertoire des zones de contrôle précèdent les entrées des zones de données. Les entrées des zones de contrôle sont organisées par ordre numérique ascendant selon l'étiquette. Les entrées des zones de données sont organisées par ordre ascendant selon le premier caractère de l'étiquette, en commençant par les caractères numériques puis les caractères alphabétiques. Il faut se reporter aux zones de longueur variable ci-dessous pour consulter les exigences sur l'ordre des zones auxquelles les entrées au répertoire correspondent.
ZONES DE LONGUEUR VARIABLE
Les zones de longueur variable, soit des zones de contrôle et des zones de données, sont placées après le guide et le répertoire dans la notice. Les zones de contrôle précèdent les zones de données et sont organisées dans la même séquence que celle des entrées correspondantes dans le répertoire. La séquence selon laquelle les zones de données sont stockées dans la notice n'est pas nécessairement la même que celle de leurs entrées correspondantes dans le répertoire.
- Zones de contrôle
- Dans les formats MARC 21, les deux premières positions de caractère des étiquettes des zones de contrôle contiennent des zéros. Les zones de contrôle renferment des données et un terminateur de zone; elles ne contiennent pas d'indicateurs ni de codes de sous-zones. L'étiquette 001 est attribuée à la zone de numéro de contrôle qui renferme le numéro de contrôle de la notice. Chaque notice possède une seule zone de numéro de contrôle (possédant l'étiquette 001), qui doit être placée à l'adresse de base des données.
- Zones de données
- Dans les formats MARC 21, les zones de données possèdent des étiquettes dont les deux premières positions renferment des caractères numériques ASCII autres que des zéros. Ces zones contiennent des indicateurs et des codes de sous-zones ainsi que des données et un terminateur de zone. Il n'y a aucune restriction quant au nombre, à la longueur ou au contenu des zones de données autres que les restrictions indiquées ou implicites, p. ex. les restrictions découlant d'une restriction limitant la longueur totale de la notice. La structure de la zone de données est représentée schématiquement ci-dessous.
- Structure d'une zone de données de longueur variable dans des notices MARC 21
Indicateur_1 |
Indicateur_2 |
Délimiteur |
Identificateur d'élement de données_1 |
-
Élément de données_1 |
... |
Délimiteur |
Identificateur d'élement de données_n |
-
- Indicateurs
- Il s'agit des deux premiers caractères dans chaque zone de données de longueur variable. Les indicateurs précèdent donc tout code de sous-zone (soit le délimiteur et l'identificateur d'élément de données) qui pourrait s'y trouver. Chaque indicateur est représenté par un caractère, et chaque zone de donnée dans la notice comprend deux indicateurs, même si les indicateurs ne possèdent pas de valeurs définies. Les indicateurs fournissent de l'information complémentaire au sujet de la zone et ils sont définis individuellement pour chaque zone. On interprète les valeurs des indicateurs séparément, c'est-à-dire qu'on a attribué une signification propre à chacun des indicateurs sans tenir compte de l'autre. Les valeurs des indicateurs peuvent être des caractères ASCII numériques ou alphabétiques en minuscules, ou un blanc. Un blanc est utilisé dans une position d'indicateur non définie, mais il peut aussi avoir une signification dans une position d'indicateur définie. On a réservé le caractère numérique « 9 » aux fins de définition locale d'un indicateur.
- Codes de sous-zones
- Ces codes identifient chaque élément de données dans une zone et précèdent les éléments de données qu'ils identifient. Chaque zone de données contient au moins un code de sous-zone. Le code de sous-zone contient un délimiteur (le caractère ASCII 1F (hexadécimal)) suivi d'un identificateur d'élément de données. Les identificateurs d'éléments de données définis dans le format MARC 21 peuvent être représentés par des caractères ASCII numériques ou alphabétiques en minuscules. En général, les identificateurs représentés par des caractères numériques sont définis pour des données utilisées dans le traitement de la zone ou pour des données codées nécessaires à l'interprétation de la zone. Les identificateurs représentés par des caractères alphabétiques sont définis pour les divers éléments qui constituent le contenu en information de la zone. Le caractère « 9 » et les symboles graphiques ASCII suivants sont réservés à la définition locale d'identificateurs d'éléments de données :
! " # $ % & ' ( ) * + , - . / : ; < = > ? { } _ ^ ` ~ [ ] \
Une zone de données peut contenir plus d'un élément de données, selon la définition de la zone. Le dernier caractère dans une zone de données est le terminateur de zone, qui suit le dernier élément de données dans la zone.
Les notices MARC 21 sont codées à l'aide de caractères de diverses longueurs. Dans la présente section sur la structure des notices, on présente les types de caractères qui peuvent composer les éléments, soit des caractères ASCII (des caractères numériques, alphabétiques en minuscules, alphabétiques en majuscules, des symboles graphiques, des caractères de contrôle, le caractère ESPACE et des caractères graphiques) ou des caractères MARC 21. La section sur les jeux de caractères définit le répertoire et le codage de chaque sous-ensemble de caractères.
MARC 21 en version anglaise sur le site de la Bibliothèque du Congrès