Apertus: un modèle de langage multilingue, ouvert et transparent

Apertus est le premier modèle de langage de grande ampleur, multilingue et open source développé en Suisse. - 2025 EPFL/ETH Zurich/CSCS/molinari design
LâEPFL, lâETH Zurich et le Centre national suisse de calcul scientifique (CSCS) ont annoncé aujourdâhui la sortie dâApertus, le premier modèle de langage de grande ampleur, multilingue et open source développé en Suisse. Il représente une étape majeure pour la transparence et la diversité dans lâintelligence artificielle générative.
En juillet dernier, lâEPFL, lâETH Zurich et le CSCS avaient annoncé leur collaboration sur le développement dâun grand modèle de langage (LLM). Aujourdâhui, ce projet se concrétise : le premier LLM multilingue, ouvert et à grande échelle conçu en Suisse est désormais disponible et constitue une base pour les développeurs et organisations souhaitant concevoir des applications dâIA telles que des chatbots, des systèmes de traduction ou des outils pédagogiques.
Le nom Apertus, â «ouvert» en latin â reflète la spécificité du modèle: son architecture, ses poids (ou paramètres), ses données dâentraînement et sa méthodologie sont entièrement documentés et librement accessibles, ce qui le distingue de nombreux autres modèles.
Chercheuses et chercheurs en IA, professionnelles, professionnels et passionnées et passionnés peuvent à présent accéder au modèle via un partenaire de déploiement tel que Swisscom, ou le télécharger depuis Hugging Face, une plateforme dédiée aux modèles et applications dâIA, et lâintégrer dans leurs propres projets. Apertus est disponible gratuitement en deux tailles: 8 milliards et 70 milliards de paramètres, le plus petit étant plus adapté à une utilisation individuelle. Les deux modèles sont distribués sous licence Apache 2.0, une licence de logiciel libre permettant son utilisation dans lâenseignement, la recherche, ainsi que pour des applications commerciales et sociétales variées.
Un modèle de langage entièrement open source
En tant que LLM pleinement ouvert, Apertus permet à la communauté scientifique et professionnelle dâexplorer en profondeur sa conception et son fonctionnement, et de lâadapter à des besoins spécifiques. Contrairement à dâautres modèles qui ne partagent quâune partie de leurs composants, Apertus mise sur une ouverture totale.
«Avec cette publication, nous voulons offrir un modèle de référence pour le développement dâune IA de confiance, souveraine et inclusive», déclare Martin Jaggi, professeur en apprentissage automatique à lâEPFL et membre du comité de pilotage de lâinitiative Swiss AI. Le modèle sera régulièrement mis à jour par une équipe de développement composée dâingénieures et ingénieurs spécialisés et de nombreux chercheurs et chercheuses de lâEPFL et de lâETH Zurich.
Un moteur dâinnovation
Avec cette approche ouverte, lâEPFL, lâETH Zurich et le CSCS sâengagent dans une nouvelle voie. «Apertus ne suit pas le schéma classique de transfert technologique de la recherche vers lâindustrie. Nous le considérons plutôt comme un catalyseur dâinnovation et un moyen de renforcer les compétences en IA dans la recherche, la société et lâéconomie», explique Thomas Schulthess, directeur du CSCS et professeur à lâETH Zurich.
Apertus a été entraîné sur 15 000 milliards de tokens (mots ou parties de mots) issus de plus de 1000 langues. Avec environ 40% de sources non-anglophones, le modèle intègre des langues généralement peu représentées dans les LLM, comme le suisse allemand, le romanche, et bien dâautres encore.
«Apertus est conçu pour le bien commun. Il fait partie des rares LLM de cette envergure à être totalement open source, et il est le premier à intégrer, dès sa conception, des principes fondamentaux comme le multilinguisme, la transparence et la conformité réglementaire», souligne Imanol Schlag, responsable technique du projet LLM et chercheur senior à lâETH Zurich.
«Swisscom est fier dâêtre parmi les premiers à déployer ce modèle de pointe sur sa plateforme souveraine dâIA suisse. En tant que partenaire stratégique de lâinitiative Swiss AI, nous soutenons lâaccès à Apertus lors des Swiss {ai} Weeks. Cela illustre notre engagement envers un écosystème dâIA sûr et responsable, au service de lâintérêt public et de la souveraineté numérique de la Suisse», ajoute Daniel Dobos, directeur de la recherche chez Swisscom.
Accessibilité
Le téléchargement et la configuration du modèle sont simples pour les professionnelles et professionnels et pour les utilisateurs et utilisatrices expérimentés. Toutefois, lâutilisation pratique du modèle requiert des composants additionnels tels que des serveurs, une infrastructure cloud ou des interfaces utilisateur spécifiques. Les hackathons des prochaines Swiss {ai} Weeks offriront la première opportunité aux développeurs et développeuses dâexpérimenter directement Apertus, de tester ses capacités et de fournir un retour pour améliorer ses futures versions. Swisscom mettra à disposition une interface dédiée pour les participants, facilitant l'interaction avec le modèle. Dès aujourdâhui, les clients professionnels de Swisscom peuvent accéder à Apertus via leur plateforme souveraine Swiss AI.
En outre, pour les personnes en dehors de la Suisse, la Public AI Inference Utility rendra Apertus accessible dans le cadre dâun mouvement mondial pour une IA publique. âApertus est actuellement le modèle dâIA publique de référence: un modèle construit par des institutions publiques, pour lâintérêt général. Câest la meilleure preuve à ce jour qu'une IA peut devenir une véritable infrastructure publique, au même titre que les routes, lâeau ou lâélectricité.â déclare Joshua Tan, responsable de la Public AI Inference Utility.
Transparence et conformité
La transparence est au cÅur dâApertus, garantissant la reproductibilité complète du processus dâentraînement. En complément des modèles, lâéquipe de recherche publie toute une gamme de ressources: documentation complète, code source du processus dâentraînement et des ensembles de données utilisés, poids du modèle incluant des checkpoints intermédiaires â le tout sous licence Apache 2.0, qui permet aussi un usage commercial. Les conditions générales sont disponibles sur Hugging Face.
Apertus a été développé en tenant dûment compte des lois suisses sur la protection des données, des droits dâauteur, ainsi que des obligations de transparence du règlement européen sur lâIA (Loi sur l'IA de l'UE). Un soin particulier a été accordé à lâintégrité des données et au respect des normes éthiques: le corpus dâentraînement repose uniquement sur des données publiquement accessibles et a été filtré rétroactivement pour respecter les demandes dâexclusion lisibles par machine, supprimer les données personnelles et éliminer les contenus indésirables avant lâentraînement.
Un point de départ
«Apertus démontre quâune IA générative peut être à la fois puissante et ouverte», affirme Antoine Bosselut, directeur du Laboratoire de traitement du langage naturel à lâEPFL et co-responsable de lâInitiative Swiss AI. «Le lancement dâApertus ne marque pas une étape finale, mais bien le début dâun engagement à long terme pour une infrastructure dâIA ouverte, de confiance et souveraine, pour le bien commun mondial. Nous avons hâte de voir les développeurs et développeuses interagir avec le modèle lors des hackathons des Swiss {ai} Weeks. Leur créativité et leurs retours nous aideront à améliorer les futures générations du modèle.»
Les prochaines versions visent à étendre la famille de modèles, à améliorer leur efficacité, et à développer des variantes spécifiques à certains domaines comme le droit, la santé ou lâéducation. Elles intégreront aussi des capacités de recherche dâinformations, permettant lâaccès à des données actualisées tout en garantissant la transparence et le respect des normes réglementaires.
Apertus a été développé dans le cadre de lâInitiative Swiss AI, menée par lâEPFL et lâETH Zurich. Il résulte dâun effort collaboratif réunissant chercheurs, ingénieurs et étudiants de toute la Suisse, avec le soutien technique du Centre national suisse de calcul scientifique (CSCS) qui dispose dâune infrastructure de premier plan en matière de puissance de calcul. Cette expertise collective, issue de plusieurs institutions et disciplines, a rendu le développement dâApertus possible.
Le développement de ce modèle linguistique de grande ampleur, ainsi que la recherche sur les modèles de fondation spécifiques à certains domaines, est financé par le Conseil des EPF, lâorgane de direction stratégique du Domaine des EPF (comprenant lâETH Zurich, lâEPFL, le WSL, le PSI, lâEmpa et lâEawag). Ce financement est complété par la contribution de partenaires stratégiques, notamment Swisscom, premier fournisseur de télécommunications de Suisse.
Les Swiss {ai} Weeks sont une initiative collaborative visant à transformer les avancées de la recherche suisse en IA en un impact concret pour la société et lâéconomie. Par le biais de hackathons, dâévénements dâexperts, de rencontres publiques et dâincubation de startups, elles rassemblent chercheurs, développeurs, entrepreneurs et citoyens autour dâun objectif commun : promouvoir une IA éthique, ouverte et digne de confiance. Au cÅur de cette initiative se trouve le premier grand modèle de langage open source suisse â développé dans lâesprit des valeurs suisses : transparence, responsabilité et multilinguisme. Les Swiss {ai} Weeks insufflent ainsi un élan collectif en faveur dâapplications dâIA responsables â décentralisées, pratiques et orientées vers le bien commun. Lâinitiative est portée par le EPFL AI Center, lâETH AI Center, Swisscom, Impact Hub Switzerland, Kickstart Innovation, Panter et Wildcard Media.