Alors que les logiciels consomment le monde informatique, l’intelligence artificielle est à la mode.
Plusieurs avancées technologiques, telles que la vision par ordinateur et, plus particulièrement, l’IA générative, dévoilent une multitude de nouvelles capacités. De nombreuses entreprises avant-gardistes investissent déjà pour accroître la valeur pour l’utilisateur final et rester compétitives.
“Nous avons travaillé sur l’IA générative depuis un certain temps », a déclaré Bratin Saha (photo, au centre), vice-président et directeur général de l’IA et de l’apprentissage automatique chez Amazon Web Services Inc. “LL’année dernière, nous avons sorti CodeWhisperer, qui consiste à utiliser l’IA générative pour le développement de logiciels, et un certain nombre de clients l’utilisent et en tirer une réelle valeur. L’IA générative est donc désormais courante et les utilisateurs d’entreprise peuvent utiliser.
Saha ; Thomas Mason (à droite), directeur de la technologie de Stability AI Ltd. ; et Aidan Gomez (à gauche), co-fondateur et PDG de Cohere Inc., s’est entretenu avec l’analyste de l’industrie theCUBE Jean Fourreur au AWS Startup Showcase : événement “Top Startups Building Generative AI on AWS”, lors d’une diffusion exclusive sur theCUBE, le studio de diffusion en direct de SiliconANGLE Media. Ils ont discuté des cas d’utilisation de plus en plus puissants de l’IA générative et de la manière dont les trois entreprises les traitent. (* Divulgation ci-dessous.)
Des partenariats à foison vers des objectifs communs
La clé des efforts d’AWS pour explorer l’IA générative réside dans les partenariats industriels, et Stability AI et Cohere forment une partie essentielle de cet écosystème. Il se rapproche de l’objectif à partir de trois domaines, dont le premier est la création d’une infrastructure efficace et spécialement conçue. Viennent ensuite les modèles d’IA et, enfin, un écosystème d’applications animé, selon Saha.
Stability AI a fait ses armes dans la création de modèles fondamentaux open source capables pour les opérations d’IA, et AWS a, au fil des ans, renforcé ses liens avec l’entreprise pour former certains de ces modèles dans son jardin, selon Mason.
“Diffusion stable était notre premier grand modèle qui nous nous sommes entraînés sur AWS », a-t-il expliqué. “Et nous sommes ravis d’aller plus loin cette année que nous développons une stratégie commerciale de l’entreprise et construire la possibilité pour les entreprises clientes pour venir tirer toute la valeur de ces modèles que nous pensons qu’ils peuvent obtenir.
Certaines des mises à jour prévues à venir du camp Stability/AWS incluent de nouvelles modalités, des modèles vidéo et une gestion plus cohérente de la reconnaissance d’image.
Cohere, pour sa part, construit de grands modèles de langage pour l’entreprise, à une échelle similaire à celle des fondements de ChatGPT. Et un facteur limitant qui empêche les LLM d’atteindre le grand public de l’entreprise, comme l’a remarqué la société, est la difficulté à créer des produits raffinés à partir d’eux, selon Gomez.
« Il y a environ six mois, nous avons publié nos modèles de commande, qui sont parmi les meilleurs qui existent pour les grands modèles de langage », a-t-il expliqué. “Et, en décembre, nous avons publié nos modèles de compréhension de texte multilingue. UNnd qui a été formé sur plus d’une centaine de langues différentes avec des données authentiques de locuteurs natifs.
Où vont les LLM
Malgré les capacités déjà brillantes que les LLM affichent avec des produits comme Bard et ChatGPT, leur plage d’utilisation est encore assez limitée. Faire progresser leur potentiel impliquerait des choses comme une base de connaissances externe, où ces modèles restent à jour en temps réel. Équiper ces outils d’IA pour accéder et utiliser les API, par exemple, peut grandement améliorer leur approche des requêtes des utilisateurs finaux.
“Que se passe-t-il lorsque vous donnez ces modèles la capacité d’utiliser des outils, d’utiliser des API ? » dit Gomez. “Que peuvent-ils faire lorsqu’ils peuvent réellement influencer le changement dans le monde réel, au-delà de la simple diffusion de texte à l’utilisateur ? Je pense que c’est la pièce vraiment excitante.
Mais tout en établissant des projections pour l’avenir, le présent doit toujours être évalué. Et entre-temps, les premiers utilisateurs de l’écosystème de produits AWS exploitent déjà les modèles visuels et textuels de Stability et Cohere.
“L’une des choses que nous avons vues, à la fois avec les modèles de texte et les modèles visuels créés par Stability.ai est-ce que les clients l’utilisent vraiment pour changer la façon dont vous interagissez avec l’information », a déclaré Saha. “Ône exemple est d’un client que nous avons qui est en utilisant ça pour interroger les conversations des clients et poser des questions sur les problèmes des clients et comment les résoudre, en plus d’essayer d’obtenir ce genre d’informations qui étaient auparavant beaucoup plus difficiles à obtenir.
Voici l’interview vidéo complète, une partie de la couverture de SiliconANGLE et theCUBE de la AWS Startup Showcase : événement “Top Startups Building Generative AI on AWS”:
(* Divulgation : il s’agit d’un segment éditorial non sponsorisé. Cependant, theCUBE est un partenaire média payant pour le “Les meilleures startups qui développent l’IA générative sur AWS” événement. Amazon Web Services et les autres sponsors de la couverture des événements de theCUBE n’ont aucun contrôle éditorial sur le contenu de theCUBE ou de SiliconANGLE.)