Janvier 1997 - n°14
IMGT- ImMunoGeneTics database, la base de données internationale en immunogénétique
Unique au monde, elle est localisée sur le campus CNRS
route de Mende à Montpelliér. Initiée et coordonnée
par Marie-Paule LEFRANC, Professeur à l'Université Montpellier
11 et responsable du Laboratoire d'lmmunoGénétique Moléculaire,
IMGT, base de données intégrée, comprend deux bases de
données:
LIGM - DB (Laboratoire d'lmmunoGénétique Moléculaire
Data Base) contient les informations sur les gènes des immunoglobulines
(Ig) et des récepteurs T (TcR), séquences nucléotidiques
et protéiques annotées et tables d'alignement,
MHC / HLA - DB répertorie les documents sur les gènes codant
les molécules du Complexe Majeur d'Histocompatibilité (CMH) appelées
Human Leucocyte Antigens (HLA) chez l'homme.
Depuis plusieurs années, les scientifiques se sont impliqués
dans le séquençage de l'ADN codant les molécules du système
immunitaire et plus de 19000séquences ont déjà été
déterminées. La génétique de ces molécules
est particulièrement complexe et les bases de données généralistes
comme EMBL ou GENBANK ne sont pas en mesure d'expertiser et d'annoter de fac,on
adéquate les séquences correspondantes.
" En 1989, alors que notre équipe avait identifié de nombreux
gènes, nous nous sommes rendus compte que les bases de données
existantes n'étaient pas appropriées. Nous avons donc eu la volonté
de créer une base de données spécialiste" confirme
Marie-Paule LEFRANC.
Un important travail préparatoire
" Un très gros travail d'analyse des données a été
effectué avant la création de la base. Il a fallu établir
une description standardisée des séquences d'lg et de TcR valable
pour toutes les espèces de vertébrés. Tous les mots clés
nécessaires pour une recherche efficace des séquences /g et TcR
ont été répertoriés et organisés selon une
structure hiérarchique. De même, les chercheurs ont été
conduits à délimiter avec précision les motifs structuraux
et fonctionnels des /g et des TcR. Une nomenclature spécifique a été
définie pour chacun de ces motifs" nous explique Mme M.-R LEFRANC.
IMGT:
la référence en immunogénétique
Depuis juillet 1995, IMGT est accessible sur INTERNET Son objectif principal
est de permettre un accès commun et convivial à toutes les données
concernant les Ig, les TcR et les molécules du CMH, qu'il s'agisse de
séquences nucléotidiques et protéiques, d'amorces nuclétidiques
, de cartes physiques ou de données génétiques.
Toutes ces informations sont disponibles par de multiples critères de
recherche:
taxonomie, type de récepteur, fonctionnalité....
sources telles que gène, clone....
mots-clés standardisés....
Iabels caractéristiques des séquences,
numéro d'accès, mnémonique, définition, longueur
des séquences,
rétérences bibliographiques.
En novembre 1996, IMGT contenait près de 19 000 séquences d'lg et de TcR de 78 espèces. 7000 de ces séquences sont complètement annotées, ce travail d'annotation est considérable et occupe à lui seul quatre annotateurs à plein temps. Au total, une dizaine de personnes sur Montpellier assure le développement de la base de donnces dont Véronique GIUDICELLI, responsable bioinformatique et Denys CHAUME, responsable informatique, ingénieur CNRS au CNUSC (Centre National Universitaire Sud de Calcul). Le projet IMGT est financé par les programmes de la Communauté Européenne BIOMED 1 et BIOTECHNOLOGY, le Centre National de la Recherche Scientifique, et le Ministère de l'Education Nationale, de l'Enseignement Supérieur et de la Recherche. Des subventions ont été accordées par le Groupement de Recherche et d'Etudes sur les Génomes (décision d'aide GREG n°13/94), la Région Languedoc-Roussillon, I'Association pour la Recherche sur le Cancer et l'Association de Recherche sur la Polyarthrite.
De nombreux experts français et européens collaborent au développement d'lMGT, on peut citer: le CNUSC, le Laboratoire de physique mathématique et théorique (ESA 5032 CNRS) de Montpellier, I'lnstitut Fund, tous deux situés en Angleterre, I'lnstitut fur Genetik en Aliemagne, le Biomedical Primate Research Centre aux Pays-Bas et la société privée EUROGENTEC en Belgique.
Développement de références
croisées entre IMGT et les autres bases de données.
IMGT est conçue pour permettre un accès commun à toutes
les donnces immunogénétiques. Cette approche est basée
sur une collaboration très étroite avec EMBL-EBI pour les séquences
nucléotidiques, avec SWISS-PROT pour les séquences protéiques,
et avec IGD pour l'interface conviviale des données cartographiques et
génétiques. D'autres références croisées
seront établies prochainement entre IMGT et d'autres bases de données
internationales (trop nombreuses pour être citées ici).
IMGT est la première, et à ce jour, la seule
base de données intégrée internationale en immunogénétique.
Près de 5000 sites du monde entier se sont déjà connectés
sur cette nouvelle base de données développée avec brio
par Marie-Paule LEFRANC et ses collaborateurs.
Cette base destinée aux chercheurs et aux cliniciens a d'importances
implications en recherche médicale (pour relier les séquences
à certaines pathologies comme le SIDA, les leucémies, les maladies
autoimmunes...), en développement thérapeutique (ingénierie
des anticorps, greffes...) et pour l'étude de la diversité des
génomes et de leur évolution puisque 78 espèces (du poisson
à l'homme) sont représentées.
QU'EST CE QUE L'lMMUNOGENETlQUE ?
Le système immunitaire a pour fonction de protéger les individus
contre les virus, les microorganismes pathogènes, les parasites et les
cellules tumorales reconnues comme étrangères. Les réponses
immunitaires découlent de la capacité de l'organisme à
reconnaïtre ces antigènes (Ag) étrangers afin de les neutraliser
et les éliminer. Trois types de molécules sont impliqués
dans la reconnaissance des Ag: les immunoglobulines (Ig) ou anticorps (Ac),
les récepteurs T (TcR) à la surface des cellules T et les molécules
du Complexe Majeur d'Histocompatibilité (CMH) appelées chez l'homme
Human Leucocyte Antigens (HLA). L'immunogénétique consiste en
l'étude de l'ADN codant ces molécules du système immunitaire.
V CROCHET