L'IA aujourd'hui épisode du 2025-01-23

L'IA aujourd'hui ! - En podcast av Michel Levy Provençal

Podcast artwork

Kategorier:

Bonjour et bienvenue dans L'IA Aujourd'hui, le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : les modèles de langage de grande taille, l'arrivée de DeepSeek-R1, l'essor des modèles de bases de données en entreprise, les dernières actualités du monde de l'IA, les enjeux de la vie privée et l'appel à candidatures de Google.org. C’est parti !Commençons par les modèles de langage de grande taille, ou LLM. Ces modèles mathématiques génèrent du texte en prédisant les mots suivants dans une phrase, grâce à un entraînement sur d'immenses quantités de données textuelles issues d'Internet. Par exemple, s'ils commencent avec "Le renard brun rapide saute par-dessus le chien paresseux", ils tentent de prédire les mots suivants en se basant sur les probabilités. Le terme "Large" ne se réfère pas seulement à la quantité de données, mais aussi au nombre colossal de paramètres qu'ils contiennent. GPT-3 d'OpenAI, par exemple, possède 175 milliards de paramètres. Ces paramètres sont ajustés lors de la phase d'entraînement grâce à la rétropropagation, qui compare la sortie du modèle à la valeur attendue pour minimiser l'erreur. Après le pré-entraînement, une étape de renforcement avec retour humain améliore encore leurs interactions. Les LLM utilisent des architectures comme les Transformers et exploitent la puissance des GPUs pour gérer les calculs massifs nécessaires. Ils ont révolutionné des tâches comme la traduction, le résumé de documents et les chatbots, simplifiant des processus auparavant complexes.Passons maintenant à DeepSeek-R1, un nouveau modèle de langage open-source publié sous licence MIT. Ce modèle rivalise avec les géants comme OpenAI en termes de performances de raisonnement, tout en étant dix fois moins coûteux. DeepSeek-R1 appartient à une nouvelle génération de "modèles pensants" qui simulent le raisonnement humain. Contrairement aux modèles traditionnels, il décompose les problèmes, débat des alternatives et s'auto-corrige. Par exemple, lorsqu'on lui demande combien de "R" sont présents dans "strawberry", il détaille son raisonnement étape par étape pour arriver à la réponse. Sur des benchmarks comme AIME 2024, DeepSeek-R1 surpasse le modèle o1 d'OpenAI et est à égalité sur des tâches de codage et de résolution de problèmes réels. Pour atteindre ces résultats, l'équipe a utilisé une technique appelée Group Relative Policy Optimization (GRPO) et a mis l'accent sur des récompenses orientées vers le raisonnement. En libérant les poids et les recettes de distillation, DeepSeek démocratise l'IA en permettant à chacun de construire des modèles spécialisés.En parallèle, une nouvelle vague de modèles, les LDM ou modèles de grandes bases de données, émerge dans le domaine de l'intelligence artificielle. Contrairement aux LLM qui exploitent des données textuelles, les LDM se concentrent sur les données tabulaires des entreprises. Ils permettent d'effectuer des requêtes sémantiques dans les bases de données, comme "Lister tous les clients les plus similaires à Jane Doe". IBM a développé Db2 SQL Data Insights, intégrant ces capacités dans son système. Un exemple concret est celui de Swiss Mobiliar, la plus ancienne compagnie d'assurance privée de Suisse, qui a utilisé l'IA prédictive pour estimer les chances qu'un client potentiel signe un contrat. En appliquant cette méthode à 15 millions de devis d'assurance automobile, ils ont augmenté leurs ventes de sept pour cent en six mois, une performance qui aurait normalement pris deux ans. Cette réussite démontre l'efficacité des LDM dans l'amélioration des processus commerciaux.Dans l'actualité de l'IA, Google et Mistral ont signé des accords respectivement avec l'Associated Press et l'Agence France-Presse pour fournir des actualités à jour via leurs plateformes d'IA. Cela signifie que des chatbots alimentés par l'IA diffuseront des informations récentes, transformant potentiellement la manière dont nous accédons aux nouvelles. De son côté, ChatGPT d'OpenAI a introduit une nouvelle fonctionnalité permettant de gérer des rappels et des listes de tâches, se positionnant davantage comme un assistant personnel. Synthesia, une plateforme de vidéo IA, a levé 180 millions de dollars pour améliorer sa technologie de génération de vidéos d'avatars humains, ce qui pourrait avoir de grandes implications pour la production de contenu numérique. Par ailleurs, de nouvelles directives américaines restreignent l'exportation de puces d'IA vers divers pays, impactant des entreprises technologiques comme Nvidia. L'administration Biden a proposé ces restrictions et a ordonné aux départements de l'Énergie et de la Défense de louer des sites pour des centres de données d'IA et la génération d'énergie propre, soulignant l'importance croissante de l'IA dans la politique industrielle et énergétique des États-Unis.Abordons maintenant les défis de la vie privée liés à l'IA. L'essor de l'IA soulève des questions cruciales en matière de confidentialité. En envoyant de plus en plus de données privées vers des systèmes externes pour traitement, nous exposons nos informations personnelles à des risques de surveillance et d'utilisation abusive. Des organisations, comme une salle de rédaction à but non lucratif mentionnée, ont interdit l'utilisation de modèles d'IA sur des données sensibles et ont mis en place des mesures de chiffrement. Apple propose une approche appelée "Private Cloud Compute", utilisant des dispositifs matériels de confiance dans ses centres de données pour protéger les informations des utilisateurs. Ces préoccupations soulignent la nécessité de réfléchir à qui bénéficient réellement ces technologies : nous, les utilisateurs, ou des entités tierces ?Enfin, Google.org lance un appel à candidatures pour la deuxième cohorte de son programme d'accélération en intelligence artificielle générative. Ce programme vise à aider les organisations à but non lucratif à utiliser l'IA pour avoir un impact social positif. Les participants recevront une formation technique, des crédits Google Cloud, un soutien pro bono de la part des employés de Google et une part d'un financement total de 30 millions de dollars. Lors de la première cohorte, 21 organisations ont développé des solutions alimentées par l'IA générative, servant plus de 30 millions de personnes d'ici 2028. Parmi elles, Tabiya a créé Compass, un agent conversationnel open-source pour réduire le chômage des jeunes, et Materiom a accéléré le développement d'alternatives durables aux plastiques. Les organisations intéressées ont jusqu'au 10 février 2025 pour postuler à ce programme de six mois.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui ! Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Visit the podcast's native language site