MetaNetX - La construction d'un modèle automatisé et l'annotation génomique de réseaux métaboliques à grande échelle

À l'heure actuelle, les réseaux métaboliques sont suffisamment bien caractérisés et il est possible de construire et d'analyser des modèles de leur comportement à l'échelle du génome entier. Cela non pas grâce à de grands ensembles de données exhaustives – les informations disponibles sont encore loin d'être complètes et la plupart des paramètres cinétiques demeurent inconnus, même dans les organismes les mieux étudiés.

La modélisation de réseaux entiers est devenue possible essentiellement grâce aux nouvelles méthodes computationnelles impliquant l'identification et la définition mathématique de contraintes liées aux lois physique, aux conditions environnementales et à la régulation cellulaire. Cependant, même pour levure de boulanger Saccharomyces cerevisiae pourtant étudiée de façon intensive, les modèles de réseaux les plus perfectionnés ne tiennent compte que d'environ 1'200 des quelques 2'200 gènes métaboliques prédits et seulement environ 70 % des réactions simulées sont fonctionnelles.

La situation est bien pire encore pour les organismes plus évolués – à ce jour, en l'occurrence, il n'existe d'ailleurs aucun modèle de plante à l'échelle du génome entier. La formalisation des contraintes est ce qui distingue les bases de connaissances de réseaux des reconstitutions de réseaux formelles qui représentent de façon consistante l'information génomique, la biochimie des réactions et la thermodynamique tout en reliant cette information à la physiologie cellulaire. Cette intégration permet d'établir des prédictions quantitatives et qualitatives vérifiables par l'expérience et de clore le cycle d'investigation de biologie systémique.

Au cours de la dernière décennie, les modèles de réseaux métaboliques à l'échelle du génome – principalement pour les microorganismes – ont conduits à des applications réussies dans de nombreux domaines. Par la caractérisation et la prédiction du comportement et de la structure des réseaux, les modèles intégrant les contraintes ouvrent la voie vers l'un des objectifs fondamentaux de la biologie systémique: la modélisation informatique d'une cellule entière. Or les reconstitutions négligent les données dynamiques, bien que celle-ci soit l'une des étapes initiales essentielles à tout effort de modélisation systémique à grande échelle quel qu'il soit. Leur disponibilité, leur qualité et l'étendue de leur couverture sont donc critiques pour l'ensemble des recherches en biologie systémique liées au métabolisme.

Le projet de développement technologique MetaNetX vise la mise au point de méthodes computationnelles intégrées et d'outils pour la simulation automatisée de réseaux métaboliques à l'échelle du génome entier, y compris la prédiction de réactions et de voies nouvelles et la mise à profit de cette information pour l'annotation génomique détaillée. Les technologies de reconstitution actuelles sont fortement limitées, notamment en ce qui concerne l'étendue de la couverture et la précision de la définition des réseaux; il existe en outre un potentiel inexploité pour le développement de l'annotation de l'information génétique et l'élucidation de nouvelles voies et de nouvelles fonctions métaboliques. En l'occurrence, il y a un besoin manifeste de méthodes permettant l'évaluation, la simulation et la validation.

Actuellement, les plus grands défis posés au développement de modèles sont les réactions et les métabolites inconnus ainsi que la nécessité de validation des entrées de données. Nous estimons que pour surmonter les limitations technologiques actuelles, il faut une intégration étroite du développement de méthodes d'annotation génomique, de la caractérisation systématique de réactions biochimiques potentielles et du développement de méthodes computationnelles de reconstitution et de validation de réseaux. Cependant et en particulier, la mise à profit des potentiels liés à l'annotation du génome et aux prédictions de fonctions exige une coordination sans précédent des approches informatiques et expérimentales.

Alors, une évaluation dans le contexte du réseau des voies biochimiques possibles d'un point de vue structurel et thermodynamique permettra d'établir les prédictions de nouvelles réactions et métabolites vérifiables par voie expérimentale. Deux champs d'applications de cette technologie: des itérations incluant des analyses expérimentales et des vérifications d'hypothèses visant la reconstitution de haute qualité, à l'échelle du génome, du métabolisme de la levure en train de bourgeonner avec une emphase placée sur la périphérie du réseau, ainsi qu'une première reconstitution du métabolisme plus complexe de la plante Arabidopsis thaliana.