CODES DE LANGUE
Renseignements généraux
Cette liste de langues a été mise à jour en avril 2024 pour harmoniser les termes français avec la liste anglaise des langues tirée de la MARC Code List for Languages (Library of Congress). Les versions précédentes de cette liste sur MARC21.ca étaient tirées de l'ancien format CANMARC. Dans CANMARC, afin d'obtenir une plus grande spécificité pour les ouvrages canadiens, les codes trouvés dans la liste des langues de la Library of Congress ont été mis à jour pour le contexte canadien. À l'époque, la traduction des nouveaux termes et la vérification des termes existants ont été effectuées par la Direction de la terminologie et des services linguistiques, Langues officielles et traduction, du Secrétariat d'État du Canada. Ces codes désignaient spécifiquement les langues autochtones du Canada.
CARACTÉRISTIQUES DES CODES DE LANGUE
La liste ne recense que les langues écrites du monde ancien et moderne (p. ex., le latin). S'il advient qu'une langue orale s'écrit en deux jeux de caractères différents, chaque jeu de caractères se voit assigner un code spécifique: p. ex., le serbe et le croate constituent une même langue orale mais le premier s'écrit en caractères cyrilliques et l'autre en caractères romains.
On assigne de préférence des codes aux grands groupes de langues (p. ex., "paa" - papoue-australienne, langue (autre) ou "nic" - nigéro-kordofanienne, langue (autre) plutôt qu'à chaque langue mineure individuelle qui serait peu pratique. Ainsi la langue "kewa" n'a pas un code propre mais est incluse dans le groupe papou-australien (paa). Également, une forme ancienne ou vieillie d'une langue qui n'a pas de code unique se voit assigner le code du groupe majeur auquel elle appartient plutôt que le code de la forme moderne. Ainsi, le vieux suédois, langue morte, se voit assigner le code "gem" du groupe des langues "germanique, langues (autre)" plutôt que le code "swe" du suédois.
Les dialectes, à quelques exceptions près (p. ex., tchi, un dialecte d'Akan, a reçu son propre code "twi"), se voient assigner un code de groupe. Toutefois, si la liste comprend le dialecte d'une langue ainsi que la langue elle-même, le dialecte se voit assigner le même code que celui de la langue à laquelle il appartient, qui peut être un code de groupe ou un code unique. Par exemple, le code "map" pour le groupe austronésien est assigné à la langue sambali et au bolinao, un dialecte du Sambali; d'autre part, aja, qui est un dialecte de Ehoue, utilise le code "ewe" qui a été spécifiquement assigné à la langue éwé.
Critères pour l'assignation de codes
Dans la plupart des cas, on utilise des codes mnémoniques à trois lettres correspondant aux trois premières lettres de la forme anglaise du nom de la langue. Parfois, il a fallu faire exception à cette règle à cause de lettres initiales redondantes, p. ex., arabe et araméen. Dans le cas de formes modernes et anciennes de certaines langues, il faut bâtir le code à partir des lettres initiales du nom de chaque forme, par exemple "gmh" pour allemand, moyen haut (ca. 1050-1500) (German, Middle High (ca. 1050-1500)) et "goh" pour allemand, vieux haut (ca. 750-1050) (German, Old High (ca. 750-1050)).
On utilise le code "mul" pour "plurilingue" lorsque deux ou plusieurs langues sont associées à un ouvrage unique et qu'il ne serait pas réaliste d'utiliser des codes pour toutes les langues.
On utilise aussi le code "und" "indéterminé" pour permettre la codification de langues qu'on ne peut préciser.
On retrouve dans la liste un grand nombre de renvois pour venir en aide à l'utilisateur, au besoin:
par exemple,
- à partir d'une variante d'épellation d'un nom de langue,
p. ex., biluchi VOIR baloutchi, denka VOIR dinka, pakkhto VOIR pushto, tajik VOIR tadjik;
- d'une forme plus ancienne à une forme plus récente d'un nom de langue, p. ex., moyen-perse (pehlevi) VOIR pehlevi;
- d'une forme moins connue et moins utilisée d'un nom de langue à une forme mieux connue et plus populaire, p. ex., castillan VOIR espagnol, judéo-allemand VOIR yiddish;
- des noms de langues mineures au nom de leur groupe de langues approprié, p. ex., abénaquis Voir algonquiennes, langues, bella coola Voir salish, langues, iai Voir austronésienne, langue (autre).
Liste alphabétique par noms
Le nom de la langue figure dans la colonne "Langue" suivi du code correspondant dans la colonne "Code". Toutes les variantes de noms de langues apparaissent sur des lignes distinctes sous le nom de la langue, la première variante précédée du symbole "X" (utilisé pour):
égyptien egy
X démotique
X hiératique
X hiéroglyphe (égyptien)
De la même façon, le nom d'une langue sans code unique mais à laquelle on assigne un code de groupe apparaît sur la première ligne, suivi du nom du groupe de langues avec son code, sur les lignes suivantes.
Par exemple,
Chewa
Code collectif assigné
nyanja nya
X cewa
La disposition est la même pour le nom d'un groupe de langues, sauf qu'après les variantes du nom, s'il y en a, le nom du groupe de langues est suivi de la liste des langues individuelles assignées à ce code de groupe:
wakash, langues wak
Code collectif pour :
bella bella
haisla
heiltsuk
kwakiutl
nitinat
nootka
Les variantes de noms pour chaque entrée acceptée apparaissent également dans leur position alphabétique respective, suivies du renvoi "VOIR" à l'entrée acceptée; cependant, le code de langue n'est pas mentionné.
bamana
VOIR bambara
bohémien
VOIR tchèque
Liste alphabétique par codes
Dans la partie II, le code de langue dans la colonne "Code" est immédiatement suivi du nom accepté de la langue, dans la colonne "Langue"; les langues auxquelles on a assigné un code de groupe, et les rappels ou les renvois ne sont pas inclus dans cette liste:
arc araméen
bai dialectes bamilékés
MARC 21 en version anglaise sur le site de la Library of Congress