fermer

Intelligence Artificielle

L’intelligence artificielle (IA) transforme de nombreux secteurs, de la santé à la finance, en passant par l’éducation et la sécurité. Explorez comment l’IA est utilisée pour automatiser des tâches, augmenter l’efficacité et créer de nouvelles opportunités de marché.

Nos discussions incluent également les défis éthiques et les implications sociétales de l’adoption de l’IA, fournissant une perspective équilibrée sur ce développement technologique clé.

Intelligence Artificielle

Participez à la révolution de l’IA avec Midjourney V6 : collaboration unique en développement

Screen 2023 12 18 07.03.00

Le monde de la création d’images par l’IA est sur le point de faire un grand pas en avant avec l’introduction de la version 6 de Midjourney. Cette nouvelle version, en développement depuis plus de 7 mois, est conçue pour améliorer la façon dont les utilisateurs interagissent avec l’IA.

En tant qu’utilisateur, vous jouez un rôle crucial dans l’enseignement de l’esthétique humaine à l’IA en sélectionnant des images qui guident son processus d’apprentissage. La prochaine version promet une expérience plus intuitive, avec des améliorations dans la façon dont l’IA interprète vos instructions et une meilleure compréhension du monde.

L’équipe de Midjourney demande maintenant aux clients payants de Midjourney de l’aider à évaluer les images afin d’entraîner le modèle d’IA de Midjourney 6 avec plus de précision. La dernière annonce de DavidH à Midjourney explique :

Nous sommes sur le point de sortir la V6 de Midjourney, mais avant cela, nous avons besoin de votre aide.

Si vous êtes un membre payant de MJ, veuillez aller ici et nous aider à évaluer les images : https://www.midjourney.com/rank-v6

Comment procéder :

  • Vous verrez deux images à la fois.
  • Sélectionnez celle qui vous semble la plus belle (en fonction de vos goûts esthétiques personnels).
  • Sur PC, vous pouvez utiliser les touches 1 et 2 pour sélectionner les images (1 est à gauche, 2 est à droite).
  • Si vous n’êtes pas sûr de la meilleure image, appuyez sur « skip » (ou sur la touche « 3″ sur PC).
  • Ces images utilisent des invites communautaires aléatoires. Si vous voyez quelque chose d’obscène, appuyez sur « Signaler l’image » (Désolé !)

Notez bien :

  • Ces images ne sont PAS représentatives de la V6 que nous sortirons bientôt.
  • Ces images sont simples/ennuyeuse/sans opinion/mauvaise pour aider notre système à « apprendre » les nouvelles choses que la communauté veut d’un modèle v6.
  • Ces images sont plus cohérentes que celles de la V5, mais la plupart des améliorations de la V6 sont liées à la compréhension des messages, à la connaissance du monde, aux images, au rendu du texte, etc. Des choses qui sont difficiles à remarquer ici.
  • Si vous vous inquiétez de la qualité, essayez de ne pas le faire ! La V5 était embarrassante lorsque nous avons organisé la première soirée d’évaluation. Obtenir l’aide de tout le monde pour identifier la « camelote » est une partie très importante de notre processus.

Ces évaluations sont très sérieuses et nous vous demandons de faire de votre mieux pour nous fournir des données de qualité.

L’une des principales avancées de la version 6 est la capacité de l’IA à interpréter les messages avec une plus grande précision. Cela signifie que lorsque vous indiquez à l’IA le type d’image que vous souhaitez créer, elle sera en mesure de mieux comprendre vos instructions et de produire des images plus pertinentes et contextuelles. Cette amélioration est importante car elle signifie que l’IA peut créer des images qui ne sont pas seulement visuellement attrayantes, mais aussi pleines de détails et de sens. La base de connaissances de l’IA a également été élargie, ce qui lui permet de puiser dans un plus large éventail d’informations lorsqu’elle génère des images.

Une nouvelle ère pour la création d’images par IA

Vos commentaires sont extrêmement importants au cours de cette phase de développement. En critiquant les images et en donnant votre avis, vous aidez l’IA à s’améliorer à chaque nouvelle itération. Les images que vous voyez maintenant ne sont qu’un aperçu de ce qui va suivre, et votre participation active est essentielle pour que l’IA apprenne et évolue.

L’impatience grandit au sein de la communauté à l’approche du lancement de la version 6 de Midjourney. Tout le monde attend avec impatience les futures soirées de classement et les mises à jour sur le processus de développement. Ces événements ne sont pas seulement amusants, ils sont aussi importants pour mettre la touche finale à la nouvelle version. La collaboration entre les utilisateurs et les développeurs est essentielle pour créer une IA qui capture l’essence de la créativité humaine et fait progresser les frontières de la technologie.

7314ed37 e5e7 4e13 a897 9b39959fd6db

La version 6 de Midjourney représente un effort de collaboration important, mettant en évidence la synergie entre les capacités de l’IA et les précieuses contributions d’utilisateurs tels que vous. Vos sélections et vos commentaires façonnent une IA qui comprend la beauté et la précision. Pour l’avenir, il est clair que l’évolution de Midjourney apportera des avancées encore plus passionnantes dans le domaine de l’IA et de la création d’images.

Lire plus
Intelligence Artificielle

Google prépare le Project Ellmann, un modèle d’IA pour interpréter la vie des utilisateurs

5c6fd87e c89c 42a7 bab0 70dd1fd00335

Google n’en a pas fini avec l’IA ! Le géant de la recherche vient de présenter son modèle d’IA « le plus puissant », appelé Gemini, et il semble que Google travaille actuellement sur un nouveau projet, qui sera capable d’en dire plus sur votre vie comme jamais auparavant.

Un rapport de CNBC suggère que le nouveau modèle d’IA, le Project Ellmann (nommé d’après le biographe et critique littéraire Richard David Ellmann), sera basé sur les Large Language Model (LLM) de Google, comme le très récent Gemini, afin de donner une « vue d’ensemble » de la vie d’un utilisateur. Il utilisera les smartphones des utilisateurs pour recueillir des données telles que des résultats de recherche et des photos, et formuler des interprétations sur leur vie. Le modèle d’IA pourrait ainsi devenir le « conteur d’histoires de vie » des utilisateurs.

Le projet Ellmann, comme l’a indiqué le chef de projet de Google lors d’une présentation à l’occasion d’un sommet interne, va « intégrer le contexte en utilisant les biographies, les précédents moments et les photos suivantes pour décrire les photos d’un utilisateur plus profondément que de simples pixels avec des étiquettes et des métadonnées ».

En parcourant les photos, leurs étiquettes et leurs emplacements, le modèle d’IA sera également en mesure d’identifier les moments importants de la vie d’une personne. Le chef de produit donne l’exemple d’une photo de retrouvailles que le modèle sera capable d’identifier. « Cela fait exactement 10 ans qu’il a obtenu son diplôme et il y a plein de visages que l’on n’a pas vus depuis 10 ans, il s’agit donc probablement d’une réunion d’anciens élèves », explique la présentation.

Outre la déduction de plusieurs moments de la vie, le projet Ellmann comprendra également un dispositif de type ChatGPT, « Ellmann Chat ». Il s’agira d’un modèle d’IA conversationnelle, que les gens pourront utiliser pour poser des questions. L’avantage supplémentaire sera la connaissance préalable de l’utilisateur.

De réelles interrogations

Le modèle d’IA déterminera également vos habitudes alimentaires, vos choix d’achat et d’autres centres d’intérêt. Il pourrait également vous indiquer vos applications et sites Web préférés ou les plus utilisés. Il reste à voir si ce modèle proposé verra le jour ou non et si c’est le cas, il n’y a pas de calendrier pour l’instant. De plus, on ne sait pas s’il sera intégré dans les applications Google comme Google Photos.

Dans l’ensemble, ce nouveau modèle offrira une sensation plus personnelle, car il aura plus de connaissances sur vous. Vous pourrez ainsi obtenir des informations sur les moments de votre vie plutôt que sur ce qui se passe dans le monde, ce qui pourrait être amusant. Cela dit, on ne sait pas dans quelle mesure il sera capable de déduire des informations à partir des données du téléphone portable.

De plus, la protection de la vie privée est toujours un aspect important et nous ne savons pas dans quelle mesure le projet Ellmann s’y intéressera. Il y a beaucoup de questions sans réponse concernant le prochain projet d’IA de Google et jusqu’à ce qu’il y ait une annonce officielle, il serait préférable de prendre ces détails avec des pincettes.

Lire plus
Intelligence Artificielle

Nvidia accroît ses investissements dans l’IA avec de nombreux soutiens à des startups innovantes

f7b9b5d2 fb0d 48e6 80a9 90106c02a73b

Nvidia s’est imposé comme un investisseur de premier plan dans les entreprises d’intelligence artificielle (IA) à la suite d’une série d’injections financières destinées à aider les jeunes entreprises.

Comme le rapporte le Financial Times, le fabricant de puces de renommée mondiale a révélé qu’il avait soutenu « plus de deux douzaines » d’entreprises au cours des 12 derniers mois, alors qu’il cherche à consolider sa position de leader du marché des processeurs d’IA.

On estime que la superpuissance californienne a participé à 6x plus d’opérations que l’année dernière, avec une variété de partenaires allant de nouveaux projets innovants de start-up dans les domaines de la santé et de l’énergie à des opérations d’IA de premier plan.

Il s’agit d’une stratégie d’investissement délibérée et audacieuse de la part de Nvidia, qui a devancé les sociétés de capital-risque de la Silicon Valley telles qu’Andreessen Horowitz et Sequoia, selon Dealroom.

Une stratégie d’investissement gagnant-gagnant

Mohamed Siddeek, responsable de NVentures (l’entité de capital-risque sur mesure de Nvidia), a parlé au FT de la confiance solide qui sous-tend leur récente activité d’investissement. « D’une manière générale, pour Nvidia, le critère numéro un (pour les investissements) est la pertinence ». « Les entreprises qui utilisent notre technologie, qui dépendent de notre technologie, qui construisent leurs activités sur notre technologie, je ne peux pas penser à une situation où nous avons investi dans une entreprise qui n’utilisait pas de produits Nvidia ».

Le portefeuille global de Nvidia comprend désormais Inflection AI et Cohere, considérés comme deux des plus grands concurrents d’OpenAI, créateur de ChatGPT.

Nvidia a un intérêt direct dans ces entreprises, étant donné qu’elles sont des clients existants. Il s’agit d’une situation gagnant-gagnant tant qu’elles continuent de croître et d’évoluer.

Nvidia a également investi dans Mistral AI, la start-up parisienne spécialisée dans l’IA qui a reçu une évaluation de 2 milliards d’euros au début du mois. Hugging Face et CoreWeave sont deux autres entreprises, toutes utilisatrices des puces GPU de Nvidia ou de ses logiciels.

À propos des remarques selon lesquelles les bénéficiaires des fonds bénéficient également de conditions favorables, Siddeek a répondu : « Nous n’aidons personne à sauter la file d’attente ». Il a réfuté toute condition d’utilisation des produits Nvidia dans le cadre d’un investissement, mais a ajouté que « nous essayons d’être aussi favorables à l’investissement que possible ».

La puce GPU H100 de Nvidia est considérée comme l’un des produits les plus recherchés dans la Silicon Valley ces derniers temps, ce qui renforce son attrait pour l’industrie de l’IA.

Lire plus
Intelligence Artificielle

Sam Altman réaffirme l’importance d’une IA sûre et innovante chez OpenAI

6231168e 53dc 4a90 bfa0 971a33bb67a0

Lors de sa première apparition publique depuis qu’il a repris le contrôle de la startup d’intelligence artificielle (IA) OpenAI la semaine dernière, le cofondateur et PDG Sam Altman a défendu l’approche exploratoire de l’entreprise dans le développement de la technologie de l’IA, selon un récent rapport de Bloomberg.

Lors d’une conférence organisée par l’organisation de défense des droits de l’homme Operation Hope à Atlanta lundi, Altman a déclaré : « Cela va soulever le monde », faisant référence au potentiel de l’IA, mais il a souligné l’importance de repousser les limites en toute sécurité afin de tirer parti de ses avantages dans les domaines de la santé, de l’éducation et bien d’autres encore.

Ces commentaires font suite à de récentes turbulences au sein de la direction d’OpenAI, après que Altman a été brièvement évincé de son poste de PDG dans ce qu’il a appelé une « tentative de coup d’État ». Des inquiétudes concernant la vitesse de développement de produits OpenAI tels que ChatGPT ont été à l’origine de ce coup d’État, qui a stupéfié la Silicon Valley. Toutefois, après la réaction des investisseurs et des employés, Altman a été réintégré quelques jours plus tard et la plupart des anciens membres du conseil d’administration se sont retirés.

Altman a reconnu les inquiétudes suscitées par l’utilisation abusive de l’IA, déclarant « qu’il n’est pas nécessaire d’avoir beaucoup d’imagination, car nous avons grandi avec cela dans les médias ». Mais, il a défendu l’approche ouverte et axée sur le déploiement de OpenAI, estimant qu’elle était essentielle pour développer la technologie en toute sécurité, plutôt que dans le secret.

Les détails concernant le nouveau conseil d’administration et les plans de gouvernance d’OpenAI n’ont pas été fournis, et des signes de divergences persistantes avec le cofondateur Ilya Sutskever subsistent après son opposition au retour de Altman.

Altman se pose des questions

Les événements récents ont amplifié la surveillance des progrès de l’IA réalisés par OpenAI, qui pourraient remodeler les industries, mais qui comportent également des risques d’utilisation militaire et d’autres dangers, selon les experts.

Altman a déclaré que « les gens sont très inquiets, et je le comprends », faisant référence aux appréhensions actuelles de la société à l’égard de l’IA avancée. Il a annoncé son intention de coprésider un nouveau conseil d’éthique de l’IA avec l’hôte de la conférence, John Hope Bryant, dans le cadre des efforts visant à façonner de manière responsable cette technologie émergente.

Lire plus
Intelligence Artificielle

Essential AI reçoit un soutien financier de Google et Nvidia pour développer l’IA

54d28b0b d6e8 4915 ad41 bc8415edea61

Une start-up spécialisée dans l’intelligence artificielle et fondée par deux anciens chercheurs de Google, Essential AI, a obtenu un important investissement de 56,5 millions de dollars.

Cette nouvelle tranche de financement a été menée par March Capital, avec la participation de grands acteurs tels que Google, Nvidia et AMD. D’autres entreprises ont également participé au financement, comme Franklin Venture Partners, KB Investment et Thrive Capital.

Essential AI, basée à San Francisco, est une jeune entreprise, mais elle est dirigée par deux personnes expérimentées et compétentes, Ashish Vaswani et Niki Parmar.

6FPCsWSl313i7xPV75OVb4DU9M4 jpg

Le duo a travaillé en étroite collaboration chez Google, où il a coécrit un document de recherche proposant l’architecture Transformer qui a établi de nouvelles normes pour la compréhension du langage il y a 6 ans, ce qui en a fait un précurseur de la technologie que nous voyons aujourd’hui dans ChatGPT et d’autres programmes d’IA.

Comme le rapporte Venture Beat, Vaswani et Parmar veulent « approfondir le partenariat entre l’homme et l’ordinateur » dans le but de produire des solutions d’IA prêtes à l’emploi pour stimuler et accroître la productivité sur le lieu de travail.

Une grosse concurrence

Malgré l’obtention du financement nécessaire pour faire avancer l’entreprise, on ne sait pas encore exactement ce que Essential a l’intention de faire et sur quoi elle veut se concentrer, mais les informations figurant sur le site Web de l’entreprise suggèrent qu’elle cherchera à produire des analyses complexes avec des produits d’IA dédiés qui rendront les analystes de données jusqu’à 10x plus rapides et permettront aux utilisateurs finaux d’être autonomes et de prendre des décisions fondées sur des données.

Suite à l’annonce de l’investissement dans Essential AI, le communiqué de presse confirmant le financement de série A citait Vaswani, PDG d’Essential, à propos des personnes prêtes à faire avancer le projet :

Niki et moi sommes enthousiastes à l’idée de constituer une équipe multidisciplinaire de classe mondiale composée d’ingénieurs, de chercheurs, de concepteurs et d’experts en vente et en produits, prêts à relever les défis de l’IA dans le monde réel et à créer une nouvelle opportunité de marché massive

Avec le soutien de Google et de Nvidia, l’aventure d’Essential AI est loin d’être un pari, mais la concurrence dans ce domaine est actuellement très forte, et il sera donc intéressant de voir ce qui se passera, car Essential AI cherche à se démarquer.

Lire plus
Intelligence Artificielle

Google prépare Pixie, une nouvelle IA pour les Pixel avec des fonctions avancées

gemini mm 02

Il y a quelques jours, Google a dévoilé Gemini, son tout nouveau LLM (Large Language Model) pour les tâches d’intelligence artificielle. L’entreprise a annoncé qu’une version plus petite de Gemini arriverait à l’avenir sur les smartphones Android phares, y compris les Pixel et les appareils Galaxy. Aujourd’hui, un nouveau rapport révèle comment Google prévoit de surpasser les autres marques de téléphones Android, y compris Samsung, en utilisant son nouvel assistant d’IA.

Depuis des années, Google Assistant est l’un des meilleurs assistants d’intelligence artificielle. Il est bien plus puissant que Siri, moins axé sur l’incitation à l’achat qu’Alexa, et à des années-lumière de Bixby. Cependant, il y a des choses que Assistant ne fait pas aussi bien qu’il le pourrait, et il est limité par le fait que presque toutes ses fonctionnalités ne fonctionneront pas s’il n’est pas connecté à Internet.

Selon un nouveau rapport de The Information, cela pourrait changer très bientôt. Selon ce rapport, Google travaille sur un nouvel assistant d’intelligence artificielle appelé « Pixie ». Il s’agirait d’un assistant exclusif à la gamme Pixel, doté de toute la puissance de Google Assistant, mais aussi de nouvelles fonctions que l’Assistant ne peut pas exécuter.

Pixie — qui pourrait être un nom de code interne et non le nom officiel du produit — intégrerait la puissance de Gemini Nano. Nous avons déjà vu ce que Gemini peut faire sur les Pixel, comme résumer des enregistrements et créer des réponses préprogrammées à des messages. Ces deux fonctions fonctionnent sur l’appareil, ce qui signifie que vous n’avez pas besoin d’une connexion de données.

Selon le nouveau rapport, ce n’est qu’un début, et Pixie pourrait introduire toute une série de nouveaux outils utilisant l’IA sur l’appareil.

Les détails sont limités, mais le rapport indique que Pixie pourrait extraire des informations des applications présentes sur le téléphone de l’utilisateur, telles que Maps ou Gmail. Cela permettrait à Pixie d’être beaucoup plus personnalisé qu’Assistant.

Rendez-vous en 2024

Bien sûr, le fait d’être exclusif aux Pixel pousserait les consommateurs à adopter un Pixel plutôt qu’une marque concurrente. Mais le fait d’être un service sur l’appareil signifierait que le processeur Tensor de Google devrait faire tout le travail. On ne sait donc pas si Pixie sera disponible sur les smartphones Pixel actuels ou seulement sur les futurs Pixel dotés du matériel adéquat.

En parlant de cela, le rapport de The Information suggère que nous pourrions voir Pixie faire ses débuts avec la série Pixel 9, qui devrait débarquer à l’automne 2024.

Google semble avoir également discuté en interne de lunettes AR. Ces lunettes pourraient être dotées de caméras et d’un assistant IA embarqué. Celui-ci pourrait être capable de voir ce que l’utilisateur voit, de reconnaître des objets, d’aider le porteur à utiliser certains outils, de résoudre un problème mathématique ou de l’aider à jouer d’un instrument de musique. La dernière fois que nous avons entendu parler de lunettes AR, Google les a abandonnées au profit du prochain appareil XR de Samsung, qui fonctionne sous Android et est équipé d’une puce Qualcomm.

Lire plus
Intelligence Artificielle

Mozilla lance Solo, un outil d’IA pour la création de sites Web pour indépendants

image 13

Mozilla a lancé un nouveau projet baptisé Solo, un outil d’intelligence artificielle (IA) de création de sites Web pour les indépendants et les « solopreneurs ».

Le développeur de logiciels destine ce produit aux indépendants qui n’ont pas les ressources ou les capacités nécessaires pour concevoir et mettre en place un site Web pour leur projet, et souhaite qu’ils se concentrent sur la réalisation de leur projet.

Les créateurs du navigateur Firefox ont expliqué ce que Solo permet d’accomplir : « L’utilisation de l’IA pour générer le contenu de votre site et trouver vos images, qu’un solopreneur peut ensuite réviser pour leur donner une voix et un style uniques, nivelle le terrain de jeu ». « Solo va encore plus loin et peut également récupérer votre page Yelp ou une autre page (listing) afin que votre présence en ligne soit totalement authentique », précise la société.

Solo onboarding questions edited jpg

Pour accéder au nouveau créateur de sites Web, les utilisateurs intéressés doivent simplement se rendre sur le site de Solo, puis fournir quelques informations de base sur leur entreprise ou leur projet, et même établir un lien avec leur présence en ligne existante.

Ensuite, Solo utilisera l’IA pour construire un nouveau site Web pour vous, l’ensemble du processus, y compris la personnalisation, ne prenant que quelques minutes.

Solo editor 2048x1456 1 jpg

Mozilla adopte l’IA open source

Ce nouveau projet fait suite à l’annonce par Mozilla, en début d’année, de son intention d’adopter pleinement l’IA open source, en engageant 30 millions de dollars dans Mozilla.ai, une start-up dont l’objectif est de créer un écosystème indépendant et fiable.

Dirigée par le directeur général Moex Draief, « la vision de Mozilla.ai est de faciliter le développement de produits d’IA dignes de confiance. Nous construirons des choses et nous engagerons/collaborerons avec des personnes qui partagent notre vision : une IA dont le cœur est l’agence, la responsabilité, la transparence et l’ouverture ».

« Mozilla.ai sera un espace en dehors des grandes entreprises technologiques et du monde universitaire où se réuniront des fondateurs, des développeurs, des scientifiques, des gestionnaires de produits et des constructeurs partageant les mêmes idées ».

En présentant son projet challenger comme une alternative aux grandes entreprises technologiques, Mozilla vise à devenir une plateforme de confiance pour l’IA, un point de vente qui souhaite emmener les gens avec elle dans son voyage et se démarquer de la foule.

Reste à savoir si Mozilla a les moyens de suivre le rythme et d’attirer l’attention avec son offre.

Lire plus
Intelligence Artificielle

Gemini Pro vs GPT-4 : comparaison des capacités des modèles d’IA de Google et d’OpenAI

8d717659 1ea4 4672 b15c 84ac4d40cf31

Le monde de l’intelligence artificielle (IA) évolue rapidement et les géants de la technologie rivalisent d’ingéniosité pour créer des modèles d’IA avancés. Google a récemment intensifié son jeu avec la sortie de Bard, qui vient s’ajouter à sa suite d’outils d’IA comprenant Gemini Pro et Gemini Ultra.

Ce guide de comparaison rapide entre Gemini Pro et GPT-4 fournit davantage d’informations sur les performances que vous pouvez attendre de Gemini Pro à l’heure actuelle.

Ces nouveaux modèles bouleversent l’industrie et représentent un défi pour les modèles établis tels que ChatGPT, GPT-4 et GPT-3.5. Les progrès de l’IA devraient avoir un impact significatif sur la manière dont nous interagissons avec les plateformes numériques, les pratiques industrielles et le paysage technologique dans son ensemble.

Pour les utilisateurs quotidiens, les progrès de l’IA entraînent des changements passionnants. Google Bard, par exemple, est capable d’interpréter des images et de fournir des réponses à des questions complexes avec un niveau de détail et de précision qui pourrait potentiellement surpasser ChatGPT. Il s’agit d’une avancée majeure pour Google et d’un outil précieux pour ceux qui sont à la recherche d’une assistance IA plus intelligente et plus intuitive.

En matière de performances, Gemini Pro fait également parler de lui. Sa capacité à s’intégrer à divers services et API est particulièrement remarquable, surtout si on la compare à GPT-4 et à l’ancienne version GPT-3.5. Imaginez la transformation de votre expérience avec le contenu et la publicité sur des plateformes telles que YouTube et Twitter, car elles deviennent plus intelligentes et sophistiquées grâce à ces algorithmes d’IA.

Gemini Pro vs GPT 4

En outre, Gemini Ultra de Google est sur le point d’établir de nouvelles normes en matière de capacités d’IA, dépassant potentiellement GPT-4. Cela pourrait avoir un effet profond sur les créateurs de contenu et les spécialistes du marketing, en particulier dans le domaine de l’optimisation des moteurs de recherche (SEO). La manière dont nous établissons et maintenons une présence en ligne pourrait être fondamentalement modifiée par l’influence de l’IA.

gpt 4 vs gemini texte jpg

L’objectif de l’intégration de l’IA dans des plateformes telles que YouTube et Twitter est de créer une expérience utilisateur plus personnalisée et plus efficace. Imaginez une IA qui non seulement comprend ce que vous aimez regarder ou lire, mais qui prédit également vos besoins, en vous donnant des conseils de voyage ou en gérant facilement des tâches complexes. Voici un bref résumé des différences entre Gemini Pro et GPT 4, d’après ce que nous savons jusqu’à présent.

Gemini Pro

  • Fait partie de la suite d’outils d’IA de Google, aux côtés de Bard
  • Il se distingue par sa capacité à s’intégrer à divers services et API, ce qui permet d’améliorer le contenu et la publicité sur des plateformes telles que YouTube et Twitter.
  • Conçu pour offrir une expérience utilisateur plus personnalisée et plus efficace en prédisant les besoins et les préférences des utilisateurs.
  • Défie les modèles d’IA établis tels que GPT-4 en termes de capacités et d’applications.

GPT-4

  • Développé par OpenAI, à la suite des versions précédentes comme GPT-3.5.
  • Ne dispose pas des capacités d’intégration avancées de Gemini Pro, en particulier avec d’autres services et API.
  • Réputé pour ses réponses détaillées et précises, il n’est peut-être pas aussi avancé dans certains domaines, comme l’interprétation d’images, que certains outils d’IA de Google.
  • Continue d’être un acteur important dans le paysage de l’IA, avec des applications très variées.

Observations générales

  • Le secteur de l’IA évolue rapidement avec de nouveaux modèles proposés par différents géants de la technologie.
  • Les modèles d’IA de Google (y compris Gemini Pro) remettent en question les modèles établis tels que GPT-4.
  • L’intégration de l’IA dans les plateformes numériques vise à améliorer l’expérience de l’utilisateur et la personnalisation du contenu.
  • Malgré les progrès réalisés, les modèles d’IA présentent encore des limites dans des domaines tels que la génération d’images et la compréhension du contexte.
  • Le rôle de l’IA dans les interactions numériques et les pratiques industrielles est de plus en plus important.

Cependant, il est important de reconnaître que les modèles d’IA ont encore leurs limites, en particulier dans le domaine de la génération d’images. Bien qu’ils puissent créer des visuels impressionnants, ils manquent parfois le coche en ce qui concerne le contexte et peuvent, par inadvertance, renforcer les préjugés. Cela nous rappelle que l’IA n’a pas encore atteint le stade où elle peut remplacer complètement la créativité et le jugement humains.

Le débat sur la question de savoir si l’IA remplacera les moteurs de recherche traditionnels ou servira d’outil complémentaire qui se poursuit et façonne notre expérience de l’Internet. De plus en plus, l’IA est considérée comme un partenaire précieux, capable d’améliorer les résultats de recherche grâce à sa rapidité et à sa précision.

L’influence de l’IA sur nos interactions numériques quotidiennes devient de plus en plus évidente. Si vous êtes intrigué par les capacités des modèles d’IA tels que Bard, Gemini Pro et Gemini Ultra, et que vous souhaitez rester informé des dernières tendances et idées en matière d’IA, ce contenu est un excellent moyen de le faire. En continuant à explorer le rôle évolutif de l’IA dans le monde numérique, vous comprendrez mieux son impact.

Lire plus
Intelligence Artificielle

ChatGPT présente des signes de « paresse » hivernale, provoquant des spéculations

58dd3092 3dc9 4223 995f 58690522c590

L’intelligence artificielle générative (IA) la plus populaire au monde devient « paresseuse » à l’approche de l’hiver — c’est ce qu’affirment certains utilisateurs avisés de ChatGPT.

Selon un récent rapport d’ArsTechnica datant de la fin novembre, les utilisateurs de ChatGPT, le chatbot d’IA alimenté par le modèle de langage naturel GPT-4 d’OpenAI, ont commencé à remarquer quelque chose d’étrange. En réponse à certaines demandes, GPT-4 refusait d’accomplir des tâches ou fournissait des réponses simplifiées « paresseuses » au lieu des réponses détaillées habituelles.

OpenAI a reconnu le problème, mais a affirmé qu’elle n’avait pas intentionnellement mis à jour le modèle. Certains pensent maintenant que cette paresse pourrait être une conséquence involontaire du fait que GPT-4 imite les changements de comportement saisonniers de l’homme.

Baptisée « hypothèse de la pause hivernale », cette théorie suggère que, puisque GPT-4 se nourrit de la date du jour, il a appris, grâce à ses vastes données d’entraînement, que les gens ont tendance à terminer les grands projets et à ralentir leur activité en décembre. Les chercheurs se penchent de toute urgence sur la question de savoir si cette idée apparemment absurde a du poids. Le fait qu’elle soit prise au sérieux souligne la nature imprévisible et humaine des Large Language Model (LLM) tels que GPT-4.

Le 24 novembre, un utilisateur de Reddit a indiqué qu’il avait demandé à GPT-4 de remplir un gros fichier CSV, mais qu’il n’avait fourni qu’une seule entrée comme modèle. Le 1er décembre, Will Depue, de OpenAI, a confirmé qu’il était conscient des « problèmes de paresse » liés aux « refus excessifs » et s’est engagé à les résoudre.

Certains affirment que GPT-4 a toujours été sporadiquement « paresseux » et que les récentes observations ne sont qu’un biais de confirmation. Cependant, le moment où les utilisateurs ont remarqué plus de refus après la mise à jour du 11 novembre de GPT-4 Turbo est intéressant, même s’il s’agit d’une coïncidence, et certains ont supposé qu’il s’agissait d’une nouvelle méthode d’OpenAI pour économiser de l’argent sur le calcul.

La théorie de la « pause hivernale »

Le 9 décembre, le développeur Rob Lynch a constaté que GPT-4 générait 4 086 caractères lorsqu’on lui demandait une date de décembre, contre 4 298 pour une date de mai. Bien que le chercheur en intelligence artificielle Ian Arawjo n’ait pas pu reproduire les résultats de Lynch de manière statistiquement significative, la nature subjective du biais d’échantillonnage avec les LLM rend la reproductibilité notoirement difficile. Alors que les chercheurs s’empressent d’étudier la question, la théorie continue d’intriguer la communauté de l’IA.

Geoffrey Litt d’Anthropic, le créateur de Claude, l’a qualifiée de « théorie la plus amusante qui soit », tout en admettant qu’il est difficile de l’exclure étant donné les réactions bizarres des LLM aux sollicitations et aux encouragements de type humain, comme le montrent les sollicitations de plus en plus étranges. Par exemple, la recherche montre que les modèles GPT produisent de meilleurs résultats en mathématiques lorsqu’on leur demande de « respirer profondément », tandis que la promesse d’un « pourboire » allonge la durée des réponses. Le manque de transparence concernant les potentiels changements apportés à GPT-4 fait que même les théories les plus improbables méritent d’être explorées.

Encore beaucoup de questions sur les LLM

Cet épisode démontre l’imprévisibilité des LLM et les nouvelles méthodologies nécessaires pour comprendre leurs capacités et leurs limites, qui ne cessent d’apparaître. Il montre également la collaboration mondiale en cours pour évaluer d’urgence les progrès de l’IA qui ont un impact sur la société. Enfin, elle nous rappelle que les LLM d’aujourd’hui nécessitent encore une supervision et des tests approfondis avant d’être déployés de manière responsable dans des applications du monde réel.

L’hypothèse de la « pause hivernale » derrière l’apparente paresse saisonnière de GPT-4 peut s’avérer fausse ou offrir de nouvelles perspectives qui amélioreront les itérations futures. Quoi qu’il en soit, ce cas curieux illustre la nature étrangement anthropomorphique des systèmes d’IA et la nécessité de comprendre les risques tout en poursuivant les innovations rapides.

Lire plus
Intelligence Artificielle

Google introduit Gemini Pro pour les développeurs: IA générative puissante gratuite

Gemini Google Logo 1536w 864h.jp 1

Google a annoncé aujourd’hui que son modèle d’IA générative le plus puissant et le plus performant, Gemini, est désormais disponible pour les entreprises afin de répondre à leurs besoins en matière de développement d’applications.

Annoncé la semaine dernière, Gemini se décline en trois « versions » : Ultra, Pro et Nano. Aujourd’hui, l’entreprise dirigée par Sundar Pichai rend la version Pro du modèle accessible depuis l’API. Elle peut être utilisée gratuitement pour l’instant, mais il y a certaines limitations d’utilisation, a écrit l’entreprise dans un article de blog.

En outre, l’entreprise a également fait un certain nombre d’autres annonces dans le domaine de l’IA, notamment une mise à jour de l’outil de diffusion texte-image Imagen 2 et une famille de modèles de base adaptés à l’industrie de la santé.

Gemini Pro pour les développeurs : à quoi s’attendre ?

La première version de Gemini Pro est disponible par l’API Gemini dans le Google AI Studio — qui offre aux développeurs une plateforme de développement basée sur le Web pour développer des prompts et obtenir ensuite une clé API à utiliser dans le développement d’applications. Elle est livrée avec une fenêtre contextuelle de 32 Ko pour la génération de texte, qui, selon l’entreprise, sera étendue à l’avenir.

« Nous avons également mis à disposition aujourd’hui un endpoint multimodal Gemini Pro Vision dédié qui accepte le texte et l’imagerie en entrée, avec une sortie texte », a écrit Google.

Dans un post X annonçant la disponibilité, Pichai a souligné que l’API Gemini permet aux développeurs d’accéder à une gamme complète de fonctionnalités, notamment l’appel de fonctions, l’intégration, l’extraction sémantique, l’ancrage de connaissances personnalisées et la fonctionnalité de dialogue en ligne. Elle prend également en charge 38 langues dans plus de 180 pays.

Outre l’AI Studio, Gemini Pro est également disponible sur Vertex AI, la plateforme d’IA de bout en bout de Google Cloud qui comprend des outils, une infrastructure entièrement gérée et des fonctions intégrées de confidentialité et de sécurité pour le développement de l’IA. Les développeurs ont ainsi la possibilité de passer à un environnement entièrement géré chaque fois qu’ils en ont besoin.

En fin de compte, l’entreprise prévoit d’apprendre des commentaires des développeurs pour affiner Gemini Pro et se diriger vers le lancement de Gemini Ultra, plus grand, l’année prochaine. Il a été conçu pour des tâches plus complexes.

Gratuit, mais avec un inconvénient

Selon Google, Gemini Pro et Gemini Pro Vision sont dès à présent accessibles gratuitement, avec une limite de 60 requêtes par minute. Il en va de même pour les développeurs qui utilisent les modèles sur Vertex AI, mais seulement jusqu’à la disponibilité générale l’année prochaine. Google indique que le quota gratuit est 20 fois supérieur à celui des autres offres et devrait convenir à la plupart des besoins de développement.

Cela dit, une fois que l’offre sera disponible, l’entreprise prévoit de facturer par 1 000 caractères ou par image à la fois sur Google AI Studio et Vertex AI. Plus précisément, le prix d’entrée de Gemini Pro est maintenu à 0,00025 dollar par 1 000 caractères et à 0,0025 dollar par image, tandis que le prix de sortie reste inchangé à 0,0005 dollar par 1 000 caractères.

Comme certains l’ont fait remarquer sur X, ce prix est bien plus élevé que celui pratiqué par des concurrents tels que GPT d’OpenAI, puisque Google facture « par caractère », c’est-à-dire chaque lettre ou chiffre généré par le modèle d’IA, alors qu’OpenAI et la plupart des autres sociétés d’IA facturent « par jeton », un jeton numérique pouvant être utilisé pour représenter des mots entiers.

Outre Gemini Pro, Google a également mis à jour Vertex AI avec Imagen 2, sa dernière technologie de diffusion texte-image. Imagen 2 apporte un grand nombre de nouvelles fonctionnalités, notamment la possibilité de générer une grande variété de logos, d’emblèmes et de lettrages créatifs et réalistes.

En outre, il permet d’obtenir de meilleurs résultats dans des domaines où les outils de conversion texte-image rencontrent souvent des difficultés, comme le rendu de textes en plusieurs langues.

Lire plus
Intelligence Artificielle

Mistral AI dévoile Mixtral 8x7B, un modèle d’IA révolutionnaire dépassant GPT-3.5 et Llama 2

mistral ai.max 2500x2500 1

Mistral AI, une société française qui se consacre à la recherche de modèles d’IA open source et de Large Language Model (LLM), a trouvé l’or avec sa dernière version — du moins parmi les utilisateurs précoces/les influenceurs de l’IA sur X et LinkedIn.

La semaine dernière, dans ce qui est en train de devenir sa signature, Mistral AI a levé le voile en tout discretion son nouveau modèle — Mixtral 8x7B, ainsi nommé parce qu’il emploie une technique connue sous le nom de « mélange d’experts », une combinaison de différents modèles chacun spécialisé dans une catégorie de tâches différente — en ligne sous la forme d’un lien torrent, sans aucune explication ou article de blog ou vidéo de démonstration présentant ses capacités.

Hier, Mistral AI a publié un article de blog détaillant davantage le modèle Mixtral 8x7B et montrant des benchmarks dans lesquels il égale ou surpasse le modèle GPT-3.5 d’OpenAI, ainsi que la famille Llama 2 de Meta, cette dernière étant l’ancien leader de l’IA open source. L’entreprise a reconnu avoir travaillé avec CoreWeave et Scaleway pour l’assistance technique pendant la formation. Elle a également déclaré que Mixtral 8x7B est effectivement disponible pour un usage commercial sous une licence Apache 2.0.

Les premiers utilisateurs de l’IA ont déjà téléchargé Mixtral 8x7B, ont commencé à l’utiliser et ont été époustouflés par ses performances. Grâce à son faible encombrement, il peut également fonctionner localement sur des machines dépourvues de GPU dédiés, y compris sur les Mac dotés du nouveau CPU M2 Ultra.

Et, comme l’a fait remarquer Ethan Mollick, professeur à la Wharton School of Business de l’université de Pennsylvanie et influenceur en matière d’IA, sur X, Mistral 8x7B n’a apparemment « aucun garde-fou », ce qui signifie que les utilisateurs qui se plaignent des politiques de contenu de plus en plus strictes de OpenAI disposent d’un modèle aux performances comparables qu’ils peuvent utiliser pour produire du matériel jugé « dangereux » ou NSFW par d’autres modèles. Toutefois, l’absence de garde-fous peut également constituer un défi pour les décideurs et les régulateurs.

Vous pouvez l’essayer vous-même depuis HuggingFace.

Mistral a également des modèles encore plus puissants dans ses cartons, comme l’a noté le PDG d’HyperWrite AI, Matt Schumer, sur X, la société sert déjà une version alpha de Mistral-medium sur son API qui a également été lancée ce weekend, ce qui suggère qu’un modèle plus grand et encore plus performant est en cours d’élaboration.

Lire plus
Intelligence Artificielle

Le modèle IA de xAI, Grok, affiche les politiques d’OpenAI : erreur ou emprunt délibéré ?

b8559e76 7077 435f b87e 2d9c4cce21af

Le modèle de langage d’IA créé par xAI d’Elon Musk, Grok, a été largement diffusé la semaine dernière, et les gens ont commencé à repérer des problèmes. Vendredi dernier, le testeur de sécurité Jax Winterbourne a tweeté une capture d’écran montrant Grok refusant une requête avec la déclaration suivante : « J’ai bien peur de ne pas pouvoir répondre à cette demande, car elle va à l’encontre de la politique d’OpenAI en matière de cas d’utilisation ».

Évidemment, cela a surpris de nombreuses personnes, car Grok n’est pas développé par OpenAI, la société responsable de ChatGPT, que Grok est censé concurrencer.

Il est intéressant de noter que les représentants de xAI n’ont pas nié que ce comportement se produisait avec leur modèle d’IA. En réponse, Igor Babuschkin, employé de xAI, a écrit : « Le problème est que le Web est plein de sorties ChatGPT, et nous en avons donc accidentellement récupéré certaines lorsque nous avons entraîné Grok sur une grande quantité de données Web. Nous avons été très surpris lorsque nous l’avons remarqué pour la première fois. Pour ce que cela vaut, le problème est très rare et maintenant que nous en sommes conscients, nous nous assurerons que les futures versions de Grok n’auront pas ce problème. Ne vous inquiétez pas, aucun code OpenAI n’a été utilisé pour créer Grok ».

En réponse à Babuschkin, Winterbourne a écrit : « Merci pour la réponse. Je dirais que ce n’est pas très rare, et que cela se produit assez fréquemment lorsqu’il s’agit de création de code. Néanmoins, je laisserai les spécialistes du LLM et de l’IA s’exprimer à ce sujet. Je ne suis qu’un observateur ».

Cependant, l’explication de Babouchkine semble peu probable pour certains experts, car les Large Language Model ne recrachent généralement pas leurs données d’apprentissage mot pour mot, ce qui pourrait être le cas si Grok captait quelques mentions parasites des politiques de OpenAI ici ou là sur le Web. Au lieu de cela, le concept de refus d’un résultat basé sur les politiques de OpenAI devrait probablement faire l’objet d’un apprentissage spécifique. Et, il y a une très bonne raison pour laquelle cela a pu se produire : Grok a été affiné à partir des données de sortie des modèles de langage de OpenAI.

Pas une première

À mesure que les Large Language Model (LLM) de OpenAI sont devenus plus performants, il est devenu de plus en plus courant pour certains projets d’IA (en particulier les projets open source) d’affiner les résultats d’un modèle d’IA à l’aide de données synthétiques — des données d’entraînement générées par d’autres modèles de langage. Le réglage fin permet d’ajuster le comportement d’un modèle d’IA en fonction d’un objectif spécifique, tel que l’amélioration du codage, après un premier cycle d’entraînement.

Il est possible que xAI ait utilisé l’un d’entre eux pour affiner Grok en vue d’atteindre un objectif spécifique, tel que l’amélioration de la capacité à suivre des instructions. Cette pratique est si courante qu’il existe même un article de WikiHow intitulé « Comment utiliser ChatGPT pour créer un ensemble de données ».

Même si l’emprunt de résultats à d’autres est courant dans la communauté de l’apprentissage automatique (bien que cela soit généralement contraire aux conditions de service), cet épisode a particulièrement attisé les flammes de la rivalité entre OpenAI et X, qui remonte aux critiques d’Elon Musk à l’égard d’OpenAI par le passé. Lorsque la nouvelle s’est répandue que Grok pourrait emprunter à OpenAI, le compte officiel ChatGPT a écrit « nous avons beaucoup en commun » et a cité l’article de Winterbourne sur X. En guise de riposte, Musk a écrit que Grok n’était pas le seul à avoir emprunté à OpenAI.

Grok: l’IA superintelligente et audacieuse

Au début du mois de novembre, Grok a été repéré sur l’application Web de X, et le propriétaire de X, Elon Musk, a révélé que le chatbot d’IA serait bientôt lancé pour que le monde entier puisse le voir et en faire l’expérience. Depuis lors, Grok est lié à la plateforme X et n’est disponible que par le biais de l’abonnement Premium+, le niveau le plus cher du réseau social, offrant ses promesses massives, mais dans le cadre de sa version bêta précoce.

La première semaine de décembre a vu l’arrivée de Grok sur X, et Musk a souhaité que les abonnés Premium+ « s’amusent » en utilisant le chatbot IA, disponible dans les versions applicatives de la plateforme.

Cela fait partie de l’objectif de X d’être « l’application de tout », offrant son point de vue sur l’intelligence artificielle, mais elle est actuellement exclusive aux abonnés Premium+ aux États-Unis.

Lire plus
Intelligence Artificielle

Mistral AI, innovateur en IA, obtient une évaluation de 2 milliards après un investissement massif

e7ad22ab 4d86 4fc5 a1c5 5c00c4615eba

La startup parisienne Mistral AI a franchi une étape importante pour le secteur européen de l’intelligence artificielle. L’entreprise a réussi à obtenir un investissement substantiel de 450 millions d’euros, propulsant son évaluation à un niveau impressionnant de 2 milliards de dollars.

Ce tour de table marque un tournant, non seulement pour Mistral AI, mais aussi pour le paysage européen de l’IA en plein essor, ce qui témoigne de la place de plus en plus importante qu’occupe la région dans l’arène mondiale de l’IA.

Andreessen Horowitz, un grand nom du monde du capital-risque, est le chef de file de ce tour de table, ce qui témoigne d’une grande confiance dans le potentiel de Mistral AI. Les géants de la technologie Nvidia Corp et Salesforce se joignent à la mêlée, apportant 120 millions d’euros supplémentaires sous forme de dette convertible. Cet éventail diversifié d’investisseurs, comprenant à la fois du capital-risque traditionnel et de grandes entreprises technologiques, souligne l’attrait et le potentiel de la technologie et de la vision de Mistral AI.

Cet afflux de capitaux témoigne de l’approche innovante de Mistral AI et de son potentiel perçu de bouleverser l’industrie de l’IA. Grâce à ce soutien financier substantiel, Mistral AI est prête à faire progresser sa recherche et son développement, à étendre sa portée et à consolider sa position en tant qu’acteur de premier plan dans le domaine de l’IA. L’ampleur de ce tour de table reflète également la reconnaissance croissante de l’importance stratégique des technologies de l’IA et la concurrence de plus en plus vive pour prendre la tête de ce secteur en pleine mutation.

Avancées technologiques et impact sur le marché

Mistral AI est à la pointe de l’innovation avec son produit phare, Mistral 7B, un Large Language Model (LLM) réputé pour son efficacité et ses capacités avancées. Publié sous la licence libre Apache 2.0, Mistral 7B représente une avancée significative dans la technologie de l’IA, caractérisée par ses méthodes personnalisées d’entraînement, de réglage et de traitement des données.

Ce qui distingue Mistral 7B, c’est sa capacité à comprimer les connaissances et à faciliter les capacités de raisonnement profond, même avec un nombre réduit de paramètres par rapport aux autres modèles du marché. Cette approche optimisée améliore non seulement les performances du modèle, mais contribue également à la durabilité en réduisant le temps de formation, les coûts et l’impact sur l’environnement.

Le déploiement réussi de Mistral 7B a positionné Mistral AI comme un acteur clé sur le marché de l’IA et un concurrent d’OpenAI. Son impact s’étend à diverses industries, offrant de potentielles transformations dans des domaines tels que les soins de santé, l’éducation, la finance et la fabrication. La capacité de l’entreprise à fournir des solutions performantes et évolutives devrait avoir un impact sur la manière dont ces secteurs exploitent l’IA pour l’innovation et l’efficacité.

Paysage européen de l’IA et avantage concurrentiel

Le récent tour de table de Mistral AI est un indicateur clair de la stature croissante de l’Europe dans le paysage mondial de l’IA. Historiquement, les entreprises européennes dans le domaine de l’IA sont restées à la traîne de leurs homologues aux États-Unis et en Asie en termes d’investissement et d’innovation. Cependant, le succès de Mistral AI, ainsi que d’autres investissements importants, marque un changement décisif, mettant en évidence le potentiel croissant de l’Europe et son engagement en faveur de l’innovation dans le domaine de l’IA.

Dans l’arène concurrentielle de l’IA générative, Mistral AI se distingue par son approche open source et son souci de créer des modèles évolutifs et efficaces. Cette stratégie la distingue des géants établis tels que OpenAI, Google AI et DeepMind, en offrant une proposition de valeur unique sur le marché. En donnant la priorité à l’accessibilité et à l’efficacité, Mistral AI contribue non seulement à la démocratisation de la technologie de l’IA, mais se positionne également comme un concurrent redoutable dans la course mondiale à l’IA.

La trajectoire de Mistral AI et du secteur européen de l’IA en plein essor laisse présager un avenir dynamique pour le développement de l’IA. Avec des investissements substantiels dans les startups européennes de l’IA, la région rattrape rapidement son retard et se fait une place dans le domaine hautement compétitif et en constante évolution de l’intelligence artificielle.

Lire plus
Intelligence Artificielle

Google lance l’API Gemini Pro le 13 décembre : une révolution pour les développeurs

final keyword header.width 1600 2 2

Google a récemment lancé l’IA Gemini, la rendant utilisable dans son moteur de recherche Google Bard. Gemini est une avancée significative dans le domaine de l’intelligence artificielle et les développeurs attendent patiemment de pouvoir mettre la main sur le nouveau modèle d’IA. Ils seront heureux d’apprendre que Google a annoncé que l’accès à l’API Gemini Pro sera disponible le 13 décembre 2023.

Gemini est conçu dès le départ pour la multimodalité, c’est-à-dire qu’il raisonne de manière transparente à travers le texte, les images, la vidéo, l’audio et le code, explique Google.

Les développeurs et les entreprises auront accès à cet outil sophistiqué par Google AI Studio et Google Cloud Vertex AI, ce qui leur permettra d’intégrer l’IA dans leurs applications avec une facilité sans précédent. La caractéristique principale de l’API Gemini Pro est son modèle d’IA multimodale, qui est capable de traiter une variété de types de données tels que le texte, le code, l’audio, les images et la vidéo.

Accès à l’API Google Gemini Pro

L’introduction de l’API Gemini Pro marque un tournant pour les développeurs. Elle ouvre la voie à la création d’applications complexes capables de comprendre et d’interagir avec de multiples formes de données. Imaginez une application qui ne se limite pas au traitement du langage naturel, mais qui peut aussi interpréter du code, transcrire des mots parlés, reconnaître des images et analyser du contenu vidéo avec une grande précision. C’est cette capacité que l’API Gemini Pro promet d’offrir.

L’un des aspects les plus remarquables de l’API est sa polyvalence. Elle a été conçue pour fonctionner sur toute une série de plateformes, depuis les serveurs robustes des centres de données jusqu’aux smartphones que nous portons. Cette polyvalence permet aux développeurs de concevoir des applications basées sur l’IA qui sont flexibles et peuvent s’adapter à différents environnements, y compris les appareils mobiles. Cela signifie que les fonctions d’IA de pointe peuvent désormais être mises directement à la disposition des utilisateurs, quel que soit leur appareil.

Pour ceux qui cherchent à prototyper et à perfectionner rapidement des applications d’IA, Google AI Studio offre une plateforme intuitive. En revanche, Google Cloud Vertex AI est conçu pour répondre aux besoins des entreprises qui souhaitent une plateforme d’IA entièrement gérée, dotée d’options de personnalisation avancées et de capacités de niveau professionnel.

Gemini Nano, la version pour les appareils mobiles

Les développeurs Android ont eux aussi de bonnes nouvelles à annoncer : la prochaine version de Gemini Nano. Cette version du modèle d’IA Gemini sera intégrée par AICore dans Android 14 et est spécifiquement conçue pour les appareils mobiles. En commençant par le Pixel 8 Pro, Gemini Nano devrait améliorer considérablement l’expérience utilisateur d’Android en introduisant des fonctionnalités d’IA sophistiquées.

L’innovation de Google ne s’arrête pas là. L’entreprise développe actuellement Gemini Ultra, qui fait l’objet d’évaluations approfondies en matière de confiance et de sécurité. Dans un premier temps, ce modèle d’IA avancé sera accessible à un groupe limité d’utilisateurs, préparant ainsi le terrain pour une diffusion plus large à l’avenir.

À l’avenir, Google prévoit de dévoiler Bard Advanced, qui exploitera la puissance de Gemini Ultra pour offrir des capacités d’IA encore plus avancées. Cette initiative devrait être lancée au début de l’année prochaine et devrait permettre de repousser encore plus loin les limites de la technologie de l’IA.

La publication de l’API Gemini Pro, ainsi que les efforts continus de Google en matière de développement de l’IA, représentent une avancée significative pour les développeurs et les entreprises. La capacité de traiter et d’interagir avec divers types de données, associée à la possibilité de fonctionner sur une multitude d’appareils, fait de l’API Gemini Pro un élément central du paysage technologique. Alors que Google va de l’avant avec ses innovations, l’évolution continue des expériences d’IA mérite une attention particulière.

Lire plus
Intelligence Artificielle

L’UE conclut un accord historique pour encadrer l’intelligence artificielle

c6005a89 8a8d 49dc 878a 27abc32014a0

Les premières lois globales au monde visant à réglementer l’intelligence artificielle ont fait l’objet d’un accord historique à l’issue d’une négociation marathon de 37 heures entre le Parlement européen et les États membres de l’UE.

L’accord a été qualifié « d’historique » par Thierry Breton, le commissaire européen responsable d’une série de lois en Europe qui régiront également les réseaux sociaux et les moteurs de recherche, couvrant des géants tels que X, TikTok et Google.

Breton a déclaré que 100 personnes étaient restées dans une salle pendant près de trois jours pour sceller l’accord. Il a ajouté que cela valait la peine de dormir quelques heures pour conclure cet accord « historique ».

Carme Artigas, secrétaire d’État espagnole à l’intelligence artificielle, qui a facilité les négociations, a déclaré que la France et l’Allemagne soutenaient le texte, alors que les entreprises technologiques de ces pays se battaient pour une approche plus légère afin de favoriser l’innovation au sein des petites entreprises.

L’accord place l’UE devant les États-Unis, la Chine et le Royaume-Uni dans la course à la réglementation de l’intelligence artificielle et à la protection du public contre les risques, notamment la potentielle menace pour la vie que beaucoup craignent que cette technologie en développement rapide comporte.

Les fonctionnaires ont fourni peu de détails sur ce qui figurera exactement dans la future loi, qui n’entrera pas en vigueur avant 2025 au plus tôt.

L’accord politique entre le Parlement européen et les États membres de l’UE sur les nouvelles lois visant à réglementer l’IA a été âprement disputé, avec des affrontements sur les modèles de fondation conçus à des fins générales plutôt que spécifiques.

Une réglementation sur la surveillance en temps réel

Mais, il y a eu aussi de longues négociations sur la surveillance par l’IA, qui pourrait être utilisée par la police, les employeurs ou les détaillants pour filmer les membres du public en temps réel et reconnaître le stress émotionnel.

Le Parlement européen a obtenu l’interdiction de l’utilisation de la surveillance en temps réel et des technologies biométriques, y compris la reconnaissance émotionnelle, mais avec trois exceptions, selon Breton. Cela signifie que la police ne pourrait utiliser ces technologies invasives qu’en cas de menace inattendue d’attaque terroriste, de recherche de victimes et dans le cadre de poursuites judiciaires pour des crimes graves.

Le débuté européen Brando Benefei, qui a codirigé l’équipe de négociation du Parlement avec Dragoș Tudorache, le débuté européen roumain qui a mené pendant 4 ans la bataille du Parlement européen pour réglementer l’IA, a déclaré qu’ils avaient également obtenu la garantie que des « autorités indépendantes » devraient donner leur autorisation à la « police prédictive » afin de se prémunir contre les abus de la police et la présomption d’innocence dans les crimes.

« Nous avions un objectif : élaborer une législation qui garantirait que l’écosystème de l’IA en Europe se développe avec une approche centrée sur l’homme, en respectant les droits fondamentaux, les valeurs humaines, la confiance, la conscience de la manière dont nous pouvons tirer le meilleur parti de cette révolution de l’IA qui se déroule sous nos yeux », a-t-il déclaré lors d’une conférence de presse tenue après minuit à Bruxelles.

 

Le fondement de l’accord est un système à plusieurs niveaux basé sur le risque, dans lequel le niveau de réglementation le plus élevé s’applique aux machines qui présentent le plus grand risque pour la santé, la sécurité et les droits de l’homme. Dans le texte original, il était envisagé d’inclure tous les systèmes comptant plus de 10 000 utilisateurs professionnels.

La catégorie de risque la plus élevée est désormais définie par le nombre de transactions informatiques nécessaires pour entraîner la machine, connu sous le nom « d’opérations en virgule flottante par seconde » (Flops). Selon certaines sources, il n’existe qu’un seul modèle, GPT-4, qui correspondrait à cette nouvelle définition.

Le niveau inférieur de la réglementation impose toujours des obligations majeures aux services d’IA, notamment des règles de base concernant la divulgation des données utilisées pour apprendre à la machine à faire n’importe quoi, de la rédaction d’un article de journal au diagnostic d’un cancer.

Tudorache a déclaré : « Nous sommes les premiers au monde à mettre en place une véritable réglementation pour l’#AI, et pour le futur monde numérique piloté par l’IA, en guidant le développement et l’évolution de cette technologie dans une direction centrée sur l’humain ».

Auparavant, il a déclaré que l’UE était déterminée à ne pas commettre les erreurs du passé, lorsque des géants de la technologie tels que Facebook ont été autorisés à devenir des sociétés multimilliardaires sans obligation de réglementer le contenu de leurs plateformes, y compris l’ingérence dans les élections, les abus sexuels sur les enfants et les discours haineux.

Une réglementation forte et complète de la part de l’UE pourrait « servir d’exemple à de nombreux gouvernements qui envisagent de réglementer », a déclaré Anu Bradford, professeur à la Columbia Law School et expert de l’UE et de la réglementation numérique. D’autres pays « ne copieront peut-être pas toutes les dispositions, mais s’inspireront probablement de nombreux aspects ».

Les entreprises d’IA qui devront se conformer aux règles de l’UE étendront probablement certaines de ces obligations aux marchés situés en dehors du continent, a déclaré Bradford à l’AP. « Après tout, il n’est pas efficace de reformer des modèles distincts pour différents marchés », a-t-elle déclaré.

Lire plus