| Fiche technique | |
|---|---|
| Type de produit : | Modèle |
| Auteur : | Google DeepMind |
| Site Web : | https://gemini.google.com/ |
Gemini
Gemini est une famille de modèles d'intelligence artificielle développée par Google DeepMind, conçue pour succéder à la série PaLM (Pathways Language Model). Présenté pour la première fois en 2023, Gemini incarne la vision de Google d'une IA multimodale capable de traiter simultanément différents types de données : texte, images, audio, vidéo et code. Contrairement aux anciens modèles se concentrant principalement sur le traitement du langage naturel, Gemini est pensé dès le départ pour fusionner plusieurs sources d'information, rendant ses capacités plus riches et plus adaptables aux tâches du monde réel. Cette approche multimodale en fait un outil très prometteur pour des usages allant des assistants intelligents à la recherche scientifique.
La série Gemini est déclinée en plusieurs variantes selon la puissance de calcul et les cas d'usage visés. Gemini Ultra est le modèle le plus avancé, destiné à des tâches complexes et critiques comme la modélisation scientifique ou la programmation assistée. Gemini Pro constitue un bon compromis entre performances et polyvalence, tandis que Gemini Nano est optimisé pour les appareils mobiles, permettant de faire tourner des modèles localement, sans connexion infonuagique. Cette modularité permet une intégration fluide dans différents produits Google tels que Gmail, Google Docs, Android ou Google Search, apportant une couche d'intelligence personnalisée et contextuelle aux services que des milliards de personnes utilisent au quotidien.
Ce qui distingue aussi Gemini des autres modèles de langage, c'est son interopérabilité avec l'écosystème Google. Il est accessible via Google AI Studio pour les développeurs, et ses API permettent de l'intégrer dans des applications web ou mobiles. En alliant puissance computationnelle, adaptation contextuelle et capacité multimodale, Gemini ambitionne de devenir une plateforme centrale de l'IA moderne. En intégrant des fonctions comme la génération de code, l'analyse d'image, la compréhension du langage naturel, ou encore la traduction et la synthèse vocale, Gemini se positionne comme un acteur incontournable dans la course aux modèles de fondation, en concurrence directe avec d'autres géants comme OpenAI ou Anthropic.