Nadiya Balovsiak Professeur agrégé du Département des communications médiatiques de l'Université Catholique d'Ukraine

Indépendance numérique : l’Ukraine crée son propre modèle de langage

7 juillet 2025, 12:08

Le ministère ukrainien de la Transformation numérique a annoncé la création de son propre équivalent ukrainien de ChatGPT. Le gouvernement considère ce projet ambitieux et coûteux comme une mesure justifiée pour renforcer sa souveraineté numérique.

L’Ukraine a-t-elle besoin de son propre modèle de langage informatique, alors que le marché actuel de l’IA offre une grande variété de produits ? La décision du ministère ukrainien des Communications et des Technologies numériques peut sembler être un gaspillage de fonds publics en temps de guerre. Mais les choses ne sont pas si simples. Tôt ou tard, les solutions d’IA deviendront incontournables dans divers domaines, notamment dans les institutions publiques. Dans le cas de l’Ukraine, il s’agit aussi de la lutte contre la propagande hostile et les discours manipulateurs sur la Toile.

Un modèle de langage propre permettra d’éviter les préjugés inhérents aux systèmes étrangers et garantira que l’intelligence artificielle non seulement traite correctement la langue ukrainienne, mais ne reproduit pas les discours nuisibles qui profitent à l’État agresseur. De plus, le développement d’une IA nationale constitue un investissement dans les futures start-ups spécialisées dans l’IA créées en Ukraine.

Pourquoi ukrainiser ChatGPT ?

Un grand modèle de langage (LLM – large language model) est un programme informatique entraîné à partir d’une grande quantité de textes, ce qui lui permet de comprendre les requêtes des utilisateurs et d’y répondre. Par exemple, la société OpenAI a créé un modèle appelé GPT, tandis que Google a baptisé le sien Gemini. Les services de type ChatGPT sont des outils permettant d’accéder aux LLM : grâce à ChatGPT, les utilisateurs interagissent avec un modèle qui traite leurs requêtes et y répond en affichant la réponse dans la fenêtre du chatbot IA.

La principale particularité de l’équivalent ukrainien de GPT réside dans le fait qu’il tiendra compte du contexte ukrainien. Les développeurs promettent qu’il s’agira d’un projet open source grâce auquel le modèle ukrainien servira de base à la création d’un écosystème numérique pouvant être utilisé tant par les institutions publiques que par les structures privées. Le modèle, qui traite et stocke les données en Ukraine, réduit également les risques de fuite et d’ingérence étrangère. Cela est particulièrement important dans les secteurs critiques tels que la défense, la médecine et l’administration publique.

Lire aussi:    L’Ukraine et la propagande 

L’Ukraine n’est pas le seul pays à tenter de protéger son indépendance technologique en investissant dans ses propres développements en matière d’IA. Un projet européen similaire, GenAI4EU, lancé l’année dernière dans l’UE pour soutenir les start-ups spécialisées dans l’IA, prévoit également la création de grands modèles de langage pour les 24 langues officielles de l’Union.

Comment apprendre à l’IA à répondre correctement à la question « À qui appartient la Crimée ? »

Le ministre de la Transformation numérique, Mikhaïl Fédorov, explique que le LLM ukrainien comprendra non seulement la langue ukrainienne, mais aussi le contexte culturel, les réalités historiques et les spécificités de la société ukrainienne. C’est extrêmement important pour la sécurité nationale et cela permet d’éviter les préjugés qui peuvent subvenir à travers les LLM étrangers à cause des données qu’ils utilisent pour s’entraîner.

Le développement de l’intelligence artificielle aide déjà les propagandistes russes à diffuser leurs récits et leurs fausses informations. Les Russes se sont révélés particulièrement efficaces dans ce domaine avec leurs opérations Doppelganger et le réseau Pravda. Ces deux projets ont littéralement « empoisonné » les grands modèles de langage afin de diffuser leur propagande.

L’entraînement de grands modèles linguistiques à partir de jeux de données contenant les récits « souhaités » est devenu une menace réelle de guerre de l’information, dans laquelle le fact-checking ou la maîtrise des médias sont impuissants. L’utilisation de LLM étrangers peut donc être dangereuse pour le pays. C’est pourquoi la création d’un modèle résistant à la propagande et aux discours hostiles est une question de survie dans le monde actuel de l’IA. Selon Mikhail Fedorov, le LLM ukrainien sera créé dans le respect de la législation, en particulier du droit de la propriété intellectuelle.

Lire aussi:   Chtistine Dugoin-Clément : « Il est temps de changer notre hiérarchisation des menaces »  

Des services publics à l’écosystème des start-ups

Oleksandr Krakovetskyi, directeur de DevRain et auteur du livre ChatGPT, DALL·E, Midjourney : Comment l’intelligence artificielle générative change le monde est convaincu que le développement d’un grand modèle de langage ukrainien est aujourd’hui une question de sécurité nationale. Pour réaliser l’objectif annoncé par le ministère de la Transformation numérique, la principale ressource nécessaire est un corpus de données ukrainien. La puissance de calcul et les serveurs sont également nécessaires pour accomplir cette tâche, mais ils sont plus faciles à obtenir par l’intermédiaire de partenaires tels que Microsoft, Google et AWS, ou même par le biais de centres de données locaux.

Le principal défi consiste à créer l’ensemble des données. Quant à l’utilisation du projet, selon l’expert, le modèle ukrainien pourrait être utilisé dans le domaine juridique, pour la création de documents officiels et pour la traduction. Il existe un problème important lié à la traduction de documents juridiques et réglementaires de l’anglais vers l’ukrainien, et un tel modèle pourrait garantir des traductions précises. De plus, en Ukraine, où il existe une pénurie de main-d’œuvre, l’IA peut automatiser certaines tâches, permettant ainsi au personnel de se concentrer sur les missions les plus complexes.

Créer son propre modèle de langage, c’est investir dans l’avenir, un investissement qui sera clairement rentable à long terme. Le projet pourra non seulement être utilisé dans le domaine des affaires, mais aussi devenir un élément du processus éducatif et de l’activité scientifique. La recherche scientifique disposera d’un outil puissant pour analyser de grands volumes de données, les entreprises pourront automatiser des processus complexes et créer des produits innovants à moindre coût. L’essentiel est que derrière les slogans retentissants et les plans ambitieux, tous les risques soient pris en compte.