NVIDIA a lancé quatre plates-formes d'inférence optimisées pour un ensemble varié d'applications d'IA générative qui émergent rapidement, aidant les développeurs à créer rapidement des applications ...
Quand il est question d’IA générative et de grands modèles de langage, difficile de ne pas évoquer Nvidia. Le concepteur fabless d’accélérateurs de calcul est devenu la coqueluche des marchés ...
Swami Sivasubramanian, VP AI et Ddta d'AWS, annonce l'arrivée de nouvelles fonctionnalités pour entraîner et inférer plus facilement les modèles d'IA générative tout en réduisant (encore) les coûts.
Evoquer l'intelligence artificielle revient souvent à porter l'attention sur l'entraînement d'énormes modèles de deep learning, mobilisant des milliers de GPU pendant plusieurs semaines. Pourtant, la ...
À l’occasion du Red Hat Summit 2025, l’éditeur open source met en avant son Red Hat AI Inference Server, de nouveaux modèles validés par des tiers, et l’intégration des API Llama Stack (Meta) et MCP ...
DigitalOcean a annoncé que sa plateforme Inference Cloud offre un débit d'inférence en production deux fois supérieur pour ...
« Les clients se trouvent à différentes étapes de leur parcours d’adoption de l’IA générative », déclare Tushar Katarki, directeur produit, plateformes de modèles de fondation chez Red Hat. « Ils ...
Le fabricant d'ordinateurs d'IA affirme que son service d'inférence est beaucoup plus rapide et qu'il rend possible de nouveaux types d'IA « agentique ». Le marché des prédictions issues de ...
AWS a dévoilé une fonction d'inférence inter-régions pour Berdrock. Les développeurs peuvent ainsi gagner du temps en automatisant le routage de l'inférence entre les régions. AWS intègre à Bedrock ...
La plupart des modèles d'IA étant entraînés et déployés, les GPUs sont-ils encore au goût du jour pour faire face à la prochaine évolution de l'intelligence artificielle: l'inférence. Il ne fait aucun ...
Recogni développe des puces d'inférence pour l'IA générative et les véhicules autonomes, et cible notamment les secteurs automobile et aérospatial. Elle vante une densité de calcul élevée et une ...