Apertus: un modÃ¨le de langage multilingue, ouvert et transparent

Melissa Anchisi / EPFL; Florian Meyer ETH Zurich; CSCS

Apertus: un modÃ¨le de langage multilingue, ouvert et transparent

Apertus est le premier modÃ¨le de langage de grande ampleur, multilingue et open source dÃ©veloppÃ© en Suisse. - 2025 EPFL/ETH Zurich/CSCS/molinari design

Lâ€™EPFL, lâ€™ETH Zurich et le Centre national suisse de calcul scientifique (CSCS) ont annoncÃ© aujourdâ€™hui la sortie dâ€™Apertus, le premier modÃ¨le de langage de grande ampleur, multilingue et open source dÃ©veloppÃ© en Suisse. Il reprÃ©sente une Ã©tape majeure pour la transparence et la diversitÃ© dans lâ€™intelligence artificielle gÃ©nÃ©rative.

En juillet dernier, lâ€™EPFL, lâ€™ETH Zurich et le CSCS avaient annoncÃ© leur collaboration sur le dÃ©veloppement dâ€™un grand modÃ¨le de langage (LLM). Aujourdâ€™hui, ce projet se concrÃ©tise : le premier LLM multilingue, ouvert et Ã grande Ã©chelle conÃ§u en Suisse est dÃ©sormais disponible et constitue une base pour les dÃ©veloppeurs et organisations souhaitant concevoir des applications dâ€™IA telles que des chatbots, des systÃ¨mes de traduction ou des outils pÃ©dagogiques.

Le nom Apertus, â€” Â«ouvertÂ» en latin â€” reflÃ¨te la spÃ©cificitÃ© du modÃ¨le: son architecture, ses poids (ou paramÃ¨tres), ses donnÃ©es dâ€™entraÃ®nement et sa mÃ©thodologie sont entiÃ¨rement documentÃ©s et librement accessibles, ce qui le distingue de nombreux autres modÃ¨les.

Chercheuses et chercheurs en IA, professionnelles, professionnels et passionnÃ©es et passionnÃ©s peuvent Ã prÃ©sent accÃ©der au modÃ¨le via un partenaire de dÃ©ploiement tel que Swisscom, ou le tÃ©lÃ©charger depuis Hugging Face, une plateforme dÃ©diÃ©e aux modÃ¨les et applications dâ€™IA, et lâ€™intÃ©grer dans leurs propres projets. Apertus est disponible gratuitement en deux tailles: 8 milliards et 70 milliards de paramÃ¨tres, le plus petit Ã©tant plus adaptÃ© Ã une utilisation individuelle. Les deux modÃ¨les sont distribuÃ©s sous licence Apache 2.0, une licence de logiciel libre permettant son utilisation dans lâ€™enseignement, la recherche, ainsi que pour des applications commerciales et sociÃ©tales variÃ©es.

Un modÃ¨le de langage entiÃ¨rement open source

En tant que LLM pleinement ouvert, Apertus permet Ã la communautÃ© scientifique et professionnelle dâ€™explorer en profondeur sa conception et son fonctionnement, et de lâ€™adapter Ã des besoins spÃ©cifiques. Contrairement Ã dâ€™autres modÃ¨les qui ne partagent quâ€™une partie de leurs composants, Apertus mise sur une ouverture totale.

Â«Avec cette publication, nous voulons offrir un modÃ¨le de rÃ©fÃ©rence pour le dÃ©veloppement dâ€™une IA de confiance, souveraine et inclusiveÂ», dÃ©clare Martin Jaggi, professeur en apprentissage automatique Ã lâ€™EPFL et membre du comitÃ© de pilotage de lâ€™initiative Swiss AI. Le modÃ¨le sera rÃ©guliÃ¨rement mis Ã jour par une Ã©quipe de dÃ©veloppement composÃ©e dâ€™ingÃ©nieures et ingÃ©nieurs spÃ©cialisÃ©s et de nombreux chercheurs et chercheuses de lâ€™EPFL et de lâ€™ETH Zurich.

Un moteur dâ€™innovation

Avec cette approche ouverte, lâ€™EPFL, lâ€™ETH Zurich et le CSCS sâ€™engagent dans une nouvelle voie. Â«Apertus ne suit pas le schÃ©ma classique de transfert technologique de la recherche vers lâ€™industrie. Nous le considÃ©rons plutÃ´t comme un catalyseur dâ€™innovation et un moyen de renforcer les compÃ©tences en IA dans la recherche, la sociÃ©tÃ© et lâ€™Ã©conomieÂ», explique Thomas Schulthess, directeur du CSCS et professeur Ã lâ€™ETH Zurich.

Apertus a Ã©tÃ© entraÃ®nÃ© sur 15 000 milliards de tokens (mots ou parties de mots) issus de plus de 1000 langues. Avec environ 40% de sources non-anglophones, le modÃ¨le intÃ¨gre des langues gÃ©nÃ©ralement peu reprÃ©sentÃ©es dans les LLM, comme le suisse allemand, le romanche, et bien dâ€™autres encore.

Â«Apertus est conÃ§u pour le bien commun. Il fait partie des rares LLM de cette envergure Ã Ãªtre totalement open source, et il est le premier Ã intÃ©grer, dÃ¨s sa conception, des principes fondamentaux comme le multilinguisme, la transparence et la conformitÃ© rÃ©glementaireÂ», souligne Imanol Schlag, responsable technique du projet LLM et chercheur senior Ã lâ€™ETH Zurich.

Â«Swisscom est fier dâ€™Ãªtre parmi les premiers Ã dÃ©ployer ce modÃ¨le de pointe sur sa plateforme souveraine dâ€™IA suisse. En tant que partenaire stratÃ©gique de lâ€™initiative Swiss AI, nous soutenons lâ€™accÃ¨s Ã Apertus lors des Swiss {ai} Weeks. Cela illustre notre engagement envers un Ã©cosystÃ¨me dâ€™IA sÃ»r et responsable, au service de lâ€™intÃ©rÃªt public et de la souverainetÃ© numÃ©rique de la SuisseÂ», ajoute Daniel Dobos, directeur de la recherche chez Swisscom.

AccessibilitÃ©

Le tÃ©lÃ©chargement et la configuration du modÃ¨le sont simples pour les professionnelles et professionnels et pour les utilisateurs et utilisatrices expÃ©rimentÃ©s. Toutefois, lâ€™utilisation pratique du modÃ¨le requiert des composants additionnels tels que des serveurs, une infrastructure cloud ou des interfaces utilisateur spÃ©cifiques. Les hackathons des prochaines Swiss {ai} Weeks offriront la premiÃ¨re opportunitÃ© aux dÃ©veloppeurs et dÃ©veloppeuses dâ€™expÃ©rimenter directement Apertus, de tester ses capacitÃ©s et de fournir un retour pour amÃ©liorer ses futures versions. Swisscom mettra Ã disposition une interface dÃ©diÃ©e pour les participants, facilitant l'interaction avec le modÃ¨le. DÃ¨s aujourdâ€™hui, les clients professionnels de Swisscom peuvent accÃ©der Ã Apertus via leur plateforme souveraine Swiss AI.

En outre, pour les personnes en dehors de la Suisse, la Public AI Inference Utility rendra Apertus accessible dans le cadre dâ€™un mouvement mondial pour une IA publique. â€œApertus est actuellement le modÃ¨le dâ€™IA publique de rÃ©fÃ©rence: un modÃ¨le construit par des institutions publiques, pour lâ€™intÃ©rÃªt gÃ©nÃ©ral. Câ€™est la meilleure preuve Ã ce jour qu'une IA peut devenir une vÃ©ritable infrastructure publique, au mÃªme titre que les routes, lâ€™eau ou lâ€™Ã©lectricitÃ©.â€ dÃ©clare Joshua Tan, responsable de la Public AI Inference Utility.

Transparence et conformitÃ©

La transparence est au cÅ“ur dâ€™Apertus, garantissant la reproductibilitÃ© complÃ¨te du processus dâ€™entraÃ®nement. En complÃ©ment des modÃ¨les, lâ€™Ã©quipe de recherche publie toute une gamme de ressources: documentation complÃ¨te, code source du processus dâ€™entraÃ®nement et des ensembles de donnÃ©es utilisÃ©s, poids du modÃ¨le incluant des checkpoints intermÃ©diaires â€” le tout sous licence Apache 2.0, qui permet aussi un usage commercial. Les conditions gÃ©nÃ©rales sont disponibles sur Hugging Face.

Apertus a Ã©tÃ© dÃ©veloppÃ© en tenant dÃ»ment compte des lois suisses sur la protection des donnÃ©es, des droits dâ€™auteur, ainsi que des obligations de transparence du rÃ¨glement europÃ©en sur lâ€™IA (Loi sur l'IA de l'UE). Un soin particulier a Ã©tÃ© accordÃ© Ã lâ€™intÃ©gritÃ© des donnÃ©es et au respect des normes Ã©thiques: le corpus dâ€™entraÃ®nement repose uniquement sur des donnÃ©es publiquement accessibles et a Ã©tÃ© filtrÃ© rÃ©troactivement pour respecter les demandes dâ€™exclusion lisibles par machine, supprimer les donnÃ©es personnelles et Ã©liminer les contenus indÃ©sirables avant lâ€™entraÃ®nement.

Un point de dÃ©part

Â«Apertus dÃ©montre quâ€™une IA gÃ©nÃ©rative peut Ãªtre Ã la fois puissante et ouverteÂ», affirme Antoine Bosselut, directeur du Laboratoire de traitement du langage naturel Ã lâ€™EPFL et co-responsable de lâ€™Initiative Swiss AI. Â«Le lancement dâ€™Apertus ne marque pas une Ã©tape finale, mais bien le dÃ©but dâ€™un engagement Ã long terme pour une infrastructure dâ€™IA ouverte, de confiance et souveraine, pour le bien commun mondial. Nous avons hÃ¢te de voir les dÃ©veloppeurs et dÃ©veloppeuses interagir avec le modÃ¨le lors des hackathons des Swiss {ai} Weeks. Leur crÃ©ativitÃ© et leurs retours nous aideront Ã amÃ©liorer les futures gÃ©nÃ©rations du modÃ¨le.Â»

Les prochaines versions visent Ã Ã©tendre la famille de modÃ¨les, Ã amÃ©liorer leur efficacitÃ©, et Ã dÃ©velopper des variantes spÃ©cifiques Ã certains domaines comme le droit, la santÃ© ou lâ€™Ã©ducation. Elles intÃ©greront aussi des capacitÃ©s de recherche dâ€™informations, permettant lâ€™accÃ¨s Ã des donnÃ©es actualisÃ©es tout en garantissant la transparence et le respect des normes rÃ©glementaires.

Ã€ propos dâ€™Apertus et de lâ€™Initiative Swiss AI
Apertus a Ã©tÃ© dÃ©veloppÃ© dans le cadre de lâ€™Initiative Swiss AI, menÃ©e par lâ€™EPFL et lâ€™ETH Zurich. Il rÃ©sulte dâ€™un effort collaboratif rÃ©unissant chercheurs, ingÃ©nieurs et Ã©tudiants de toute la Suisse, avec le soutien technique du Centre national suisse de calcul scientifique (CSCS) qui dispose dâ€™une infrastructure de premier plan en matiÃ¨re de puissance de calcul. Cette expertise collective, issue de plusieurs institutions et disciplines, a rendu le dÃ©veloppement dâ€™Apertus possible.

Financement et partenariats stratÃ©giques
Le dÃ©veloppement de ce modÃ¨le linguistique de grande ampleur, ainsi que la recherche sur les modÃ¨les de fondation spÃ©cifiques Ã certains domaines, est financÃ© par le Conseil des EPF, lâ€™organe de direction stratÃ©gique du Domaine des EPF (comprenant lâ€™ETH Zurich, lâ€™EPFL, le WSL, le PSI, lâ€™Empa et lâ€™Eawag). Ce financement est complÃ©tÃ© par la contribution de partenaires stratÃ©giques, notamment Swisscom, premier fournisseur de tÃ©lÃ©communications de Suisse.

A propos de Swiss {ai} Weeks
Les Swiss {ai} Weeks sont une initiative collaborative visant Ã transformer les avancÃ©es de la recherche suisse en IA en un impact concret pour la sociÃ©tÃ© et lâ€™Ã©conomie. Par le biais de hackathons, dâ€™Ã©vÃ©nements dâ€™experts, de rencontres publiques et dâ€™incubation de startups, elles rassemblent chercheurs, dÃ©veloppeurs, entrepreneurs et citoyens autour dâ€™un objectif commun : promouvoir une IA Ã©thique, ouverte et digne de confiance. Au cÅ“ur de cette initiative se trouve le premier grand modÃ¨le de langage open source suisse â€” dÃ©veloppÃ© dans lâ€™esprit des valeurs suisses : transparence, responsabilitÃ© et multilinguisme. Les Swiss {ai} Weeks insufflent ainsi un Ã©lan collectif en faveur dâ€™applications dâ€™IA responsables â€” dÃ©centralisÃ©es, pratiques et orientÃ©es vers le bien commun. Lâ€™initiative est portÃ©e par le EPFL AI Center, lâ€™ETH AI Center, Swisscom, Impact Hub Switzerland, Kickstart Innovation, Panter et Wildcard Media.

02.09.25

Mots-clÃ©s

apprentissage automatique Centre IA EPFL IA intelligence artificielle

ActualitÃ©s

Abonnement

Recevez un e-mail Ã chaque publication

Partager sur