fermer

Intelligence Artificielle

L’intelligence artificielle (IA) transforme de nombreux secteurs, de la santé à la finance, en passant par l’éducation et la sécurité. Explorez comment l’IA est utilisée pour automatiser des tâches, augmenter l’efficacité et créer de nouvelles opportunités de marché.

Nos discussions incluent également les défis éthiques et les implications sociétales de l’adoption de l’IA, fournissant une perspective équilibrée sur ce développement technologique clé.

Intelligence Artificielle

OpenAI lance Sora, un nouveau modèle d’IA pour la conversion de texte en vidéo

Screen Shot 2024 02 15 at 1.40.0 jpg

OpenAI ne se contente pas d’être connue comme la société ChatGPT ou même LLM. Dans une démarche innovante, OpenAI se lance dans la génération vidéo avec Sora, un modèle de GenAI qui transforme le texte en vidéos de 1080p. Ce développement vise à aider les utilisateurs à relever les défis de l’interaction avec le monde réel en générant des vidéos qui adhèrent étroitement aux prompts spécifiés tout en conservant une grande fidélité visuelle.

Le cofondateur et PDG Sam Altman a déclaré sur X (anciennement Twitter) qu’il s’agissait d’un « moment remarquable ».

Bien que le produit ne soit pas encore officiellement utilisable par le plus grand nombre en raison de ce que Altman a qualifié dans son message de « red-teaming initial », c’est-à-dire de tests opposés de ses défenses de sécurité, de ses failles et de ses utilisations abusives, le fondateur a indiqué qu’il était mis à la disposition d’un « nombre limité de créateurs », l’expansion publique étant prévue à une date ultérieure.

Sora se distingue par sa capacité à créer des scènes dynamiques avec divers personnages, types de mouvements et détails d’arrière-plan, promettant une immersion à la hauteur des films. Le modèle peut également enrichir des clips vidéo existants, ajoutant des détails manquants pour une expérience plus complète.

ezgif 1 a559a3c1e8

ezgif 1 02294151d2

ezgif 1 c767cd7883

Avec une compréhension profonde du langage, Sora interprète avec précision les demandes des utilisateurs, donnant vie à des personnages expressifs et de vives émotions. Ce modèle comprend la demande non seulement dans le contexte du langage, mais aussi dans sa manifestation physique réelle.

Sora est capable de générer des vidéos jusqu’à une minute dans une variété de styles, y compris photoréaliste, animé, et noir et blanc, évitant ce que l’on pourrait appeler les « bizarreries de l’IA » communes à d’autres technologies de génération de texte en vidéo.

Quelques limites identifiées

Si Sora présente des capacités impressionnantes en matière de génération de scènes vidéo détaillées et complexes, il rencontre également des difficultés en ce qui concerne la précision de la simulation physique et la reconnaissance des détails dans l’espace. Ces défis mettent en évidence les limites actuelles du modèle dans la compréhension et la reproduction des complexités de la physique et des relations spatiales du monde réel.

OpenAI positionne Sora comme un aperçu de recherche, conscient du potentiel d’abus de cette technologie et travaillant activement à développer des outils pour détecter les vidéos générées par Sora. La société envisage une collaboration avec des experts, des décideurs politiques, des enseignants et des artistes pour explorer les cas d’utilisation positive de cette technologie, tout en incluant des métadonnées de provenance dans les productions générées pour garantir une utilisation sûre et responsable de Sora.

Lire plus
Intelligence Artificielle

Gemini 1.5 de Google : une révolution IA pour les professionnels et développeurs

press kit gemini header

Seulement quelques semaines après le déploiement de Gemini, le Large Language Model de Google destiné à révolutionner le secteur de l’IA, la firme de Mountain View annonce déjà son successeur : Gemini 1.5. Accessible dès aujourd’hui pour les développeurs et les entreprises, en prélude à un lancement grand public imminent, Google mise pleinement sur Gemini comme outil professionnel et assistant personnel.

Gemini 1.5 se distingue par de nombreuses améliorations, notamment Gemini 1.5 Pro, la version grand public, qui rivalise désormais avec Gemini Ultra, le modèle haut de gamme récemment introduit. Surpassant Gemini 1.0 Pro dans 87 % des benchmarks, Gemini 1.5 utilise une technique de plus en plus répandue, le « Mixture of Experts » (MoE). Cette méthode permet d’activer seulement une partie du modèle pour une requête donnée, optimisant ainsi la rapidité d’utilisation pour l’utilisateur et l’efficacité opérationnelle pour Google.

L’innovation majeure de Gemini 1.5 réside dans son contexte élargi, capable de traiter des requêtes bien plus vastes et d’examiner une quantité d’informations considérable en une seule fois. Avec une fenêtre de contexte atteignant le million de tokens, bien au-delà des 128 000 de GPT-4 d’OpenAI et des 32 000 de l’actuel Gemini Pro, cette avancée permet d’aborder des contenus d’une ampleur sans précédent. Sundar Pichai, PDG de Google, simplifie la comparaison : « cela représente environ 10 ou 11 heures de vidéo, des dizaines de milliers de lignes de code ».

press kit tokens scale static jpg

Cette capacité étendue ouvre des perspectives nouvelles, tant pour les utilisateurs individuels que pour les entreprises. Pichai évoque la possibilité pour les cinéastes de soumettre un film entier à Gemini pour anticiper les critiques, ou pour les entreprises d’analyser d’immenses volumes de données financières. « Je considère cela comme l’une de nos percées les plus significatives, » affirme-t-il.

Pour l’instant, Gemini 1.5 est exclusivement disponible pour les utilisateurs professionnels et les développeurs via Vertex AI et AI Studio de Google. À terme, il remplacera Gemini 1.0, et la version standard de Gemini Pro, accessible à tous via gemini.google.com et les applications de l’entreprise, sera mise à niveau vers 1,5 Pro, avec une fenêtre de contexte de 128 000 tokens. L’accès à la fenêtre d’un million de tokens sera soumis à un surcoût. Google teste également les limites de sécurité et d’éthique du modèle, notamment en ce qui concerne la nouvelle fenêtre de contexte élargie.

Gemini1.5Pro AIStudio Sherlock J jpg

Une course à l’IA

Dans la course effrénée pour développer le meilleur outil d’IA, Google semble prendre une longueur d’avance, notamment pour ceux déjà intégrés dans son écosystème. Cependant, la concurrence reste vive, notamment avec les récentes annonces d’OpenAI concernant la « mémoire » pour ChatGPT et ses ambitions dans la recherche Web.

Selon Pichai, l’évolution rapide de la technologie sous-jacente continue de captiver l’attention du public, même si, à terme, l’expérience utilisateur primera sur les détails techniques.

Cette initiative de Google marque une étape importante dans le développement des capacités de l’IA, ouvrant la porte à des applications plus vastes et plus complexes. Reste à voir comment ces avancées seront adoptées par les développeurs et les entreprises, et quel impact elles auront sur l’évolution future des modèles d’IA générative.

Lire plus
Intelligence Artificielle

Gemini se réinvente : l’avenir des écouteurs connectés avec Google

vs2CpSW8PQQuYFYLl1Iy0E2sZeGOPFVrsVNAGCrxt7oB3aHZkKeXhzNvUTN3U0tPNE2 HXlmzNXBVqEICsPeSfrIDCKGBb3WfNMgrw e365 w3000

Depuis son lancement (ou sa renaissance sous un nouveau nom) la semaine dernière, Google n’a cessé d’enrichir Gemini, la dernière version de son chatbot, avec de nouvelles mises à jour. Tout a commencé avec le changement de nom de « Bard » en « Gemini », visant à aligner le branding sur le nom du Large Language Model (LLM) qui l’anime.

Puis, une version payante a été introduite, ainsi qu’une application mobile pour Android, transformant Gemini en un assistant virtuel pour smartphone.

Selon une découverte récente de l’équipe de 9to5Google, qui a fouillé dans le code de la dernière version bêta de l’application Google pour Android (version 15.6), Google pourrait être en train de préparer une mise à jour encore plus significative pour Gemini, qui changerait notre utilisation des écouteurs connectés.

Actuellement, l’invocation de l’assistant virtuel par des écouteurs tels que les Pixel Buds active toujours Google Assistant, même si Gemini est configuré comme assistant par défaut sur le smartphone de l’utilisateur.

Toutefois, des indications cachées dans le code suggèrent que cela pourrait bientôt changer. Bien que Google n’ait pas encore annoncé officiellement ou laissé entendre une telle intégration, la présence d’une chaîne de caractères décrite comme « l’application mobile Gemini travaille à élargir sa disponibilité pour être accessible depuis vos écouteurs » nous donne une idée claire de ce qui est en préparation, sans toutefois préciser comment l’intégration sera gérée.

Quels avantages pour les utilisateurs ?

L’intégration de Gemini dans les écouteurs pourrait révolutionner l’expérience d’écoute. Imaginez un contrôle mains libres et ultra-performant : changer de pistes, contrôler la lecture, se faire lire des résumés d’articles, voire résoudre des formules complexes tout en se déplaçant.

Bien que ces développements en soient encore à leurs débuts, ils pourraient ouvrir la voie à une nouvelle ère de son et de capacités pilotées par l’IA, comme un égaliseur adapté à vos habitudes d’écoute ou à la chanson que vous écoutez à un moment donné. Les possibilités semblent infinies et promettent d’être passionnantes à explorer. Espérons que nous n’aurons pas à attendre trop longtemps pour découvrir cela.

Lire plus
Intelligence Artificielle

MWC 2024 : Nokia prépare l’industrie avec MX Workmate, son nouvel assistant IA

62edd851 6442 4e19 b63b f4a99a85c9a2

La prochaine édition du Mobile World Congress (MWC) ne se limitera pas à la présentation des derniers smartphones haut de gamme, tels que le Honor Magic 6 Pro et le Xiaomi 14 Ultra, attendus avec impatience par le public international. Cette année, Nokia réserve également une surprise de taille.

Contrairement aux attentes, le géant finlandais ne dévoilera pas un nouveau smartphone facile à réparer tel que le Nokia G22. Nokia s’apprête plutôt à présenter un assistant personnel alimenté par l’intelligence artificielle (IA).

Avant de soupirer d’indifférence, sachez que cette innovation n’est pas une énième réponse aux assistants IA populaires comme Gemini de Google. Selon Reuters, l’outil IA de Nokia est conçu pour générer des messages destinés aux travailleurs industriels, incluant des alertes sur les équipements défectueux basés sur des données en temps réel, et propose même des recommandations pour augmenter la production en usine.

Baptisé « MX Workmate », cet outil entend enrichir la technologie de communication existante de Nokia, déjà utilisée par des clients industriels, en exploitant les modèles de langage génératif pour rédiger des textes semblables à ceux d’un humain, a indiqué l’entreprise.

La première version de cet assistant IA sera présentée lors du prochain MWC qui se tiendra à la fin février à Barcelone. Certaines fonctionnalités de l’assistant sont encore au stade de la recherche, les développeurs souhaitant éviter les « hallucinations IA » — c’est-à-dire lorsque l’IA fournit une réponse convaincante, mais totalement fictive.

Une première version

« L’outil doit être précis, clair et correct. Il doit également être traçable et modéré », a expliqué Stéphane Daeuble, responsable du marketing des solutions d’entreprise chez Nokia. Des mesures de sécurité initiales, telles que la validation des prompts de l’IA par une personne, seront mises en place.

Nokia fournit déjà des technologies 4G et 5G pour les communications internes, permettant aux entreprises industrielles d’accéder aux données issues des capteurs de machines. « L’idée est maintenant de disposer d’un assistant pour aider les travailleurs à interpréter toutes ces données », a ajouté Daeuble.

Il conclut en estimant qu’il faudra peut-être attendre un an, voire un an et demi, avant de voir la première mise en œuvre concrète de cette technologie.

Lire plus
Intelligence Artificielle

Gemini de Google : avancées et questions de vie privée

Gemini SS.width 1300 1

Un avertissement de Google sur la protection de la vie privée indique qu’il existe un risque si les utilisateurs divulguent des informations personnelles lorsqu’ils utilisent des applications d’intelligence artificielle (IA).

La société Alphabet Inc. a confirmé le changement de nom de Bard, qui s’appellera Gemini et deviendra l’assistant d’intelligence artificielle phare des appareils Android. L’application apportera des avancées et une plus grande cohésion entre les différents services sur les smartphones, mais il semble aussi avoir un coût.

Comme le rapporte ZDNet, dans les informations en petits caractères contenues dans le Hub de confidentialité des applications Gemini, un avertissement stipule que Google recueille des conversations, la localisation, des commentaires et des informations d’utilisation lorsque Gemini est activé.

L’objectif de la collecte de ces informations est énoncé de manière vague, mais il pourrait amener les utilisateurs à se demander qui a accès à leurs conversations avec l’outil Gemini et pourquoi.

Google déclare : « Nous prenons votre vie privée au sérieux et nous ne vendons vos informations personnelles à personne. Pour améliorer Gemini tout en protégeant votre vie privée, nous sélectionnons un sous-ensemble de conversations et utilisons des outils automatisés pour supprimer les informations permettant d’identifier l’utilisateur (telles que les adresses électroniques et les numéros de téléphone) ».

Avertissement sur la confidentialité de Gemini

Cette partie ne semble pas trop préoccupante, mais l’avertissement suit, dans la section intitulée Vos données et les applications Gemini, avec ce qui suit : « Veuillez ne pas saisir d’informations confidentielles dans vos conversations, ni de données que vous ne souhaiteriez pas qu’un évaluateur voie ou que Google utilise pour améliorer nos produits, nos services et nos technologies d’apprentissage automatique ».

Du point de vue de la protection de la vie privée, la confirmation que les données des utilisateurs sont conservées pendant 3 ans constitue une révélation alarmante. Les conversations Gemini examinées par des évaluateurs humains sont conservées pendant cette période, même si l’activité de l’application est supprimée, car elles sont conservées séparément et ne sont pas liées à un compte Google.

Le géant de la technologie a été transparent, dans une certaine mesure, sur le fait qu’il faut bien réfléchir aux informations que l’on échange avec Gemini et ne pas fournir de détails personnels sensibles que l’on ne souhaiterait pas voir conservés par la technologie d’intelligence artificielle.

Vous êtes prévenus.

Lire plus
Intelligence Artificielle

Révolutionnez votre travail d’équipe avec Slack AI

Slack AI Search

Slack s’apprête à révolutionner la gestion du travail en équipe avec le lancement d’une suite de fonctionnalités intégrées d’intelligence artificielle, destinées à optimiser la communication et l’organisation au sein des entreprises.

Cette avancée, baptisée Slack AI, promet de transformer l’expérience utilisateur sur la plateforme en offrant des résumés de discussions et des récapitulatifs de canaux, tout en permettant aux utilisateurs de poser des questions spécifiques sur leur environnement de travail.

L’initiative Slack AI, qui a fait l’objet de tests préliminaires l’année dernière, est désormais en cours de déploiement sous forme d’option payante pour les utilisateurs de Slack Enterprise. Cette innovation pourrait s’avérer particulièrement utile pour les employés cherchant à se mettre à jour sur des fils de discussion auxquels ils ont été mentionnés, ou désireux de se tenir informés des conversations récentes au sein de leurs canaux de travail.

Avec l’emploi de l’IA générative pour améliorer la recherche et la capacité de résumé, Slack AI est conçu pour analyser et condenser d’énormes volumes de données en informations concises et exploitables. Cette facilité d’accès à l’information est désormais disponible en tant qu’option payante pour les abonnés de Slack Enterprise, offrant une solution intuitive qui ne nécessite aucune formation préalable et peut être mise en œuvre ou interrompue rapidement. Cette option offre la possibilité de résumer les messages non lus, ceux publiés au cours des 7 derniers jours, ou ceux envoyés sur une période personnalisée, facilitant ainsi le rattrapage des informations clés après une absence.

Slack AI Summarize

En outre, Slack AI est capable de répondre à des questions concernant des projets spécifiques ou la politique de l’entreprise, à condition que ces sujets aient été abordés dans Slack. L’outil peut même définir les acronymes utilisés, s’appuyant sur les messages pertinents pour fournir des éclaircissements.

Slack AI Search

L’intégration de Slack AI avec d’autres applications tierces enrichit encore cette expérience, en permettant par exemple de résumer des documents Notion directement dans les aperçus de liens, ou de poser des questions sur des contenus stockés dans Box.

Uniquement en anglais américain et britannique pour le moment 

Slack AI Digest

Slack ne se contente pas de ces nouveautés et annonce le développement d’autres outils destinés à résumer et prioriser l’information. Parmi les fonctionnalités à venir, une nouvelle option de digest offrira les points forts des canaux sélectionnés, idéale pour les utilisateurs pressés par le temps. La plateforme travaille également à l’intégration native d’Einstein Copilot, un chatbot IA capable de rédiger des messages aux collègues.

Il est important de souligner que les modèles de Large Language Model (LLM) utilisés par Slack sont hébergés directement sur la plateforme, garantissant ainsi que les données des clients restent isolées et ne sont pas utilisées au profit d’autres clients. Slack assure également que ces données ne serviront pas à l’entraînement des LLM.

Bien que les détails concrets sur la tarification de l’option Slack AI restent à préciser, le service sera initialement disponible en anglais américain et britannique, avec des plans supplémentaires et des options de prise en charge linguistique prévus pour bientôt.

Lire plus
Intelligence Artificielle

Sam Altman, PDG d’OpenAI, révèle le danger de l’IA qui l’empêche de dormir

1663509d 7d6d 4948 9d46 9671ce3dfc3a

Le PDG d’OpenAI, Sam Altman, a fait des commentaires prudents sur l’importance d’atténuer les dangers de l’intelligence artificielle (IA), tout en révélant les préoccupations qui l’empêchent de dormir.

S’exprimant par liaison vidéo lors du World Government Summit à Dubaï (Émirats arabes unis), il a demandé qu’un régulateur universel joue un rôle crucial dans la protection des progrès futurs de l’IA, afin d’écarter la menace de dommages graves pour la société.

Le dirigeant de 38 ans a fait référence à l’Agence internationale de l’énergie atomique comme étant le type d’organisme qu’il envisage pour cette industrie, y compris une relation distante avec les développeurs, comme l’a rapporté ABC News.

« Il y a là des choses faciles à imaginer où les choses tournent vraiment mal et je ne suis pas très intéressé par les bots tueurs qui se promènent dans les rues et qui tournent mal », a déclaré Altman.

« Je suis beaucoup plus intéressé par les déséquilibres sociétaux très subtils où nous avons ces systèmes dans la société et où, sans mauvaise intention particulière, les choses tournent terriblement mal », a-t-il ajouté.

Le temps de l’action

Parvenant à trouver le ton juste avec son auditoire, Altman a indiqué que des entreprises comme OpenAI — le développeur de ChatGPT — devraient être liées par une organisation jouant un rôle de supervision et bénéficiant de l’apport de nombreux acteurs du secteur technologique à l’échelle mondiale.

« Nous en sommes encore au stade des discussions. Tout le monde organise une conférence. Tout le monde a une idée, un document d’orientation, et c’est très bien ainsi », a poursuivi Altman. « Je pense que nous sommes encore à une époque où le débat est nécessaire et sain, mais à un moment donné dans les prochaines années, je pense que nous devons nous diriger vers un plan d’action avec une véritable adhésion dans le monde entier ».

Après son retour à OpenAI en décembre, le patron de l’entreprise soutenue par Microsoft a évoqué les appréhensions de la société à l’égard de l’IA avancée, en annonçant la création d’un conseil d’éthique de l’IA. Les commentaires qu’il a formulés lors du sommet mondial des gouvernements reflètent donc une approche cohérente.

Lire plus
Intelligence Artificielle

Chat With RTX : l’assistant personnel révolutionnaire de NVIDIA

Chat with RTX Feb 13

L’application « Chat With RTX » marque une avancée notable dans l’univers des assistants personnels dotés d’intelligence artificielle, en permettant aux utilisateurs possédant le matériel compatible de transformer leurs fichiers locaux en une base de données consultable par l’IA.

Conçue comme une démonstration technique par NVIDIA, cette application se révèle efficace pour récupérer, résumer et synthétiser les informations contenues dans des fichiers textuels, offrant ainsi une aide précieuse pour naviguer dans des documents techniques ou répondre à des questions personnelles du quotidien.

Au cœur de cette innovation, « Chat With RTX » fonctionne comme un assistant personnel capable d’explorer vos documents et notes, évitant ainsi la nécessité de rechercher manuellement dans les fichiers écrits, téléchargés ou reçus. Cette capacité s’étend même à la récupération de transcriptions de vidéos YouTube, permettant par exemple de convertir un tutoriel en instructions imprimables étape par étape.

L’aspect remarquable de « Chat With RTX » réside dans son fonctionnement en local, garantissant une réponse rapide tout en préservant la confidentialité des données personnelles, puisque l’IA n’analyse que les fichiers ou dossiers sélectionnés par l’utilisateur.

Bien que d’autres Large Language Model (LLM), y compris ceux proposés par HuggingFace et OpenAI, puissent également fonctionner en local, « Chat With RTX » se distingue par sa facilité d’utilisation et la démonstration des capacités du projet open source TensorRT-LLM RAG de NVIDIA, destiné aux développeurs souhaitant créer leurs propres applications IA.

Nécessite un GPU NVIDIA

Notre expérience avec « Chat With RTX » lors du CES 2024 souligne le potentiel de cette technologie, bien qu’elle soit présentée comme une simple démo technique. Au-delà de ses fonctionnalités de récupération d’informations et de résumé de documents, l’application ouvre également la porte à des usages créatifs, comme la rédaction d’histoires à partir de transcriptions de playlists YouTube.

Disponible au téléchargement sur le site de NVIDIA, « Chat With RTX » nécessite une carte graphique RTX Series 30 ou 40 avec au moins 8 Go de VRAM. NVIDIA propose également le projet de référence open source TensorRT-LLM RAG pour ceux intéressés à développer des applications similaires à « Chat With RTX ».

Lire plus
Intelligence Artificielle

Otter.ai révolutionne les réunions avec Meeting GenAI

image1

Une start-up basée à San Francisco, Otter.ai, élargit aujourd’hui sa plateforme éponyme avec l’introduction de nouvelles fonctionnalités nommées « Meeting GenAI ».

Ces ajouts visent à améliorer l’intelligence des réunions grâce à l’utilisation de l’intelligence artificielle (IA) pour la transcription vocale. Ces services, qui s’intègrent à des plateformes de réunion populaires telles que Zoom, ont d’abord vu le jour en juin 2023 avec les capacités de chatbot d’Otter, permettant de poser des questions sur des réunions spécifiques et d’obtenir des résumés.

Les nouveautés de « Meeting GenAI » permettent aux organisations de tirer profit de l’assistant IA d’Otter non seulement dans une réunion unique, mais aussi à travers toutes les transcriptions de réunions disponibles sur la plateforme. Les utilisateurs peuvent ainsi obtenir des résumés de plusieurs réunions, connaître les points clés et les étapes suivantes. La fonctionnalité de chatbot est désormais également intégrée à l’option canal d’Otter, permettant à plusieurs utilisateurs d’une même organisation de dialoguer avec l’IA d’Otter dans le cadre d’une conversation de groupe.

65ca0fbab931cdebe3b756e0 2792 Channels 1600x900 white bg 080224 transcode

Sam Liang, co-fondateur et PDG d’Otter AI, explique que le nouveau chatbot peut interroger l’ensemble de la base de données des réunions pour répondre à des questions ambiguës en identifiant les réunions pertinentes. Cette mise à jour rend le chatbot plus collaboratif, permettant à plusieurs utilisateurs de participer à une conversation de groupe avec l’IA. Dans un canal Otter, un groupe de personnes peut ainsi interagir entre elles et avec Otter AI, qui devient un participant à part entière de la conversation.

Liang voit cette capacité de collaboration via Otter comme complémentaire à l’utilisation d’autres outils de collaboration, tels que Slack, en se concentrant sur la voix et le stockage de transcriptions de réunions recherchables.

Un futur proactif ?

Otter continue de perfectionner ses capacités IA, notamment en améliorant la qualité de résumé basée sur les retours des utilisateurs. Otter développe ses propres modèles et affine également les modèles existants pour réduire le risque « d’hallucinations » IA, en s’assurant que les noms, entreprises ou terminologies mentionnés par l’IA correspondent au contenu original.

Liang anticipe un futur où Otter AI pourrait intervenir proactivement lors des réunions, agissant comme un participant supplémentaire capable de répondre à des requêtes vocales ou d’offrir des informations de manière proactive au moment approprié, faisant ainsi d’Otter un membre d’équipe participant activement aux discussions.

Toutes ces fonctionnalités IA seront disponibles pour tous les utilisateurs d’Otter, y compris ceux du plan Basic gratuit.

Lire plus
Intelligence Artificielle

ChatGPT révolutionne avec la mémoire persistante : une nouvelle ère pour les chatbots

820c6bea 4335 4d36 b530 b4d5f3d3b9ae

OpenAI a récemment annoncé une mise à jour significative de son application de chatbot basée sur le Web, ChatGPT : la mémoire persistante. Cette fonctionnalité, qui sera déployée progressivement pour certains utilisateurs de la version gratuite et des abonnés payants de ChatGPT Plus à 20 dollars par mois, permettra à ChatGPT de se souvenir des informations fournies par les utilisateurs, qu’il pourra rappeler plus tard, même lors de sessions de chat nouvelles et non liées.

Contrairement à son fonctionnement jusqu’à présent, où ChatGPT ne se souvenait des informations que pour une session de chat unique, la nouvelle fonctionnalité de mémoire lui permettra de sauver du temps aux utilisateurs en évitant de devoir répéter des informations d’une session à l’autre.

Initialement, cette mise à jour sera disponible uniquement pour un groupe sélectionné d’utilisateurs gratuits et Plus, afin d’évaluer son impact. Les abonnés aux plans Teams et Enterprise auront accès à cette capacité à une date ultérieure.

Cette initiative intervient alors que la concurrence dans le domaine des chatbots devient de plus en plus intense, notamment avec les efforts récents de Google pour promouvoir son chatbot avec un rebranding majeur et l’inclusion de son modèle le plus avancé, Gemini Advanced, sous un nouveau plan payant.

Avec la mémoire améliorée, ChatGPT commencera à accumuler des détails au fur et à mesure des échanges avec les utilisateurs. Si l’utilisateur souhaite que l’assistant se souvienne de quelque chose de spécifique, il peut le lui demander explicitement. Toutes les informations mémorisées sont stockées sur les comptes des utilisateurs pour améliorer les futures conversations.

memory and new controls for chat jpg

Une fonctionnalité très utile

Cette fonctionnalité peut être utile dans divers cas d’utilisation professionnels et personnels, comme demander à ChatGPT de se souvenir de préférences spécifiques sans devoir les répéter. OpenAI précise que les souvenirs collectés peuvent être utilisés pour entraîner ses modèles, sauf si l’utilisateur opte pour une conversation temporaire, qui n’apparaît pas dans l’historique, elle n’utilise ni ne crée de mémoire, et ne sera pas utilisée pour l’entraînement des modèles.

La mémoire sera activée par défaut, mais les utilisateurs pourront la désactiver ou gérer les souvenirs spécifiques à supprimer de leur compte. OpenAI prend des mesures pour évaluer et atténuer les biais et éviter de se souvenir de manière proactive d’informations sensibles, à moins qu’on ne lui demande explicitement.

Cet enrichissement de ChatGPT avec des fonctions de mémoire améliorera sans doute l’utilité de l’assistant pour les projets professionnels et personnels des utilisateurs, tout en prenant une approche impartiale sur ce qui devrait être mémorisé ou non.

Lire plus
Intelligence Artificielle

L’ère de l’IA provoque des milliers de licenciements chez Microsoft, eBay et PayPal

843f3d2a f66b 4fbe b45e ee2123ac760a

Depuis le début de l’année, Microsoft, eBay et PayPal ont supprimé des milliers d’emplois dans le cadre d’une réorientation vers l’intelligence artificielle, les entreprises révisant leurs ressources.

Comme le rapporte le Financial Times, les entreprises technologiques ont supprimé environ 34 000 emplois en l’espace de quelques semaines, l’accent étant mis sur l’IA générative.

Outre les poids lourds mentionnés ci-dessus, Snap a également supprimé un nombre important de postes dans le cadre d’une réduction à l’échelle de l’industrie de 138 entreprises qui ont licencié du personnel. Ces chiffres sont significatifs, mais pas tout à fait au même niveau que l’année précédente, lorsque Microsoft, Meta et Amazon ont réduit leurs effectifs.

Les analystes ont indiqué que la dernière série de licenciements est un signe du passage à l’IA, tandis que certaines entreprises ont considéré que la productivité est liée à leur production globale.

Brent Hill, analyste à la célèbre institution financière Jefferies, a estimé que les entreprises ont évalué leurs effectifs en concluant que « nous avons un tas de bois mort, et que si nous avions une organisation plus légère, nous pourrions faire plus ». « Les licenciements vont se poursuivre et la situation pourrait s’aggraver. C’est devenu contagieux », a ajouté Hill.

Qui sera le prochain ?

Le mois dernier, Twitch, propriété d’Amazon, a été frappé par le licenciement d’environ 500 employés en raison de pressions financières, un autre indicateur de la réduction des coûts et de l’ajustement dans l’ensemble du secteur. Même les « Big Five » sont touchés, comme le montre la longue liste d’employeurs qui ont réduit leurs effectifs au cours des dernières semaines.

La société de logiciels d’entreprise SAP a confirmé une « transformation à l’échelle de l’entreprise » en janvier, y compris la suppression d’environ 8 000 emplois alors qu’elle se tourne davantage vers l’IA tout en requalifiant le personnel autant que possible.

Autumn Mitchell, testeuse d’assurance qualité chez ZeniMax, filiale de Microsoft, a commenté l’incertitude actuelle en ces termes : « Tous ceux qui travaillent dans la technologie ou les jeux en ce moment s’inquiètent des licenciements à un degré ou à un autre, que ce soit pour eux-mêmes ou pour quelqu’un qu’ils connaissent ».

On voit une entreprise annoncer des licenciements et on se dit : « C’est parti, qui sera licencié la semaine prochaine ? » a déclaré Mitchell.

Lire plus
Intelligence Artificielle

Simplifiez votre vie avec l’IA : applications pratiques au quotidien

b43f72a7 3e41 4db3 ac98 92f725d4d985

L’intégration de l’intelligence artificielle (IA) dans nos tâches quotidiennes personnelles et professionnelles n’est plus une vision futuriste, mais une réalité palpable. L’IA transforme la manière dont nous abordons des projets variés, de la rénovation de notre maison à la composition d’e-mails complexes.

Voici comment exploiter l’IA pour simplifier et enrichir notre quotidien.

1. Rénovation de maison

Pour ceux qui, comme moi, manquent d’imagination en matière de design intérieur, des applications telles que Remodel AI, un outil freemium, offrent une solution en visualisant des idées abstraites avec des modifications photoréalistes de vos espaces.

L’application vous permet d’expérimenter des palettes de couleurs, des thèmes, des choix de meubles et des agencements de pièces en quelques clics seulement.

2. Résumé d’articles longs

J’adore lire, mais je ne suis pas toujours d’humeur à lire de longs articles. Parfois, vous souhaitez simplement connaître l’essentiel d’un article d’opinion intéressant ou les faits essentiels d’un article d’actualité, sans avoir à lire chacun d’entre eux du début à la fin.

Les chatbots tels que ChatGPT, Copilot et Bard peuvent résumer de longs articles à la demande. Il suffit de coller l’article entier dans le champ de saisie et de demander un résumé, ou d’entrer une invite telle que « Résumer cet article : » suivie de son URL. Comme d’autres GPT, Bard peut résumer des articles à l’aide de l’IA générative lorsque vous entrez une URL ou collez du texte à partir de ces articles.

Vous pouvez modifier votre prompt pour répondre à des demandes personnalisées, comme la recherche de sections spécifiques ou l’énumération des points forts sous forme de puces.

De même, les chatbots peuvent résumer des livres complets. Je préfère utiliser Bard et Copilot car ils parcourent l’Internet à la recherche d’informations et de critiques pertinentes lorsqu’ils rédigent des résumés. Le modèle linguistique de ChatGPT écrit et comprend également le langage naturel. Cependant, son modèle GPT 3.5, que vous pouvez utiliser gratuitement, a une date limite de connaissance de janvier 2022, et ne peut donc pas résumer des livres plus récents.

3. Création de programmes d’entraînement

Fitbod utilise l’apprentissage automatique pour personnaliser les programmes d’entraînement, offrant une méthode structurée et efficace pour progresser dans votre condition physique.

Frame 8 907x1024 1

4. Soutien en santé mentale

Je suis une personne naturellement anxieuse et je m’inquiète pour les choses les plus insignifiantes. Des applications comme Wysa utilisent des chatbots basés sur l’IA pour fournir un soutien cognitif comportemental, offrant une aide immédiate pour gérer l’anxiété et d’autres troubles.

5. Organisation des pensées

En tant qu’écrivain, j’ai du mal à mettre de l’ordre dans mes idées. Je peux passer des heures à regarder un document vierge si je ne sais pas où ou comment commencer à écrire. Même les idées les plus brillantes restent le fruit de mon imagination jusqu’à ce qu’elles se matérialisent, bien plus tard, en un résultat tangible et visible.

Des outils de transcription IA tels que AudioPen aident à organiser les idées en convertissant la parole en texte, facilitant le processus créatif pour les écrivains.

971df322 8836 437a 9cfa 748525ff jpg

6. Traduction de textes étrangers

Les traducteurs de langues modernes utilisent des modèles d’intelligence artificielle sophistiqués pour produire des résultats plus précis. Prenons l’exemple de DeepL. Son système de traitement du langage naturel (NLP) analyse le contexte et le ton des entrées, puis recherche les traductions appropriées dans sa base de données. Celles-ci transmettent les messages bien mieux que les traductions directes.

7. Génération d’art

Les générateurs texte-image ont beaucoup évolué depuis qu’ils produisent des résultats obscurs. Les modèles d’IA modernes tels que DiffusionBee (Stable Diffusion), Dall-E et Midjourney peuvent désormais produire des images vivantes tout en imitant un large éventail de styles artistiques. Que vous imaginiez des mondes fantastiques pour le concept art ou que vous créiez des portraits hyperréalistes pour étayer vos écrits, ces modèles peuvent contribuer grandement à donner vie à vos idées.

Malheureusement, ces générateurs d’images s’accompagnent d’un abonnement mensuel. Une alternative gratuite que j’utilise souvent est Playground, qui génère des résultats uniques et modifie des images existantes à partir de messages-guides textuels.

Notez simplement que les générateurs d’images IA peuvent extraire des éléments de sources tierces. Vous devez donc vous assurer que vos images sont autorisées à être utilisées avant de les inclure dans des projets commerciaux.

8. Transcription de réunions et enregistrements

Avant que les outils de transcription par IA n’arrivent sur le marché, je devais transcrire les réunions manuellement. Je prenais des notes pendant les réunions et j’écoutais les enregistrements pour les transcrire par la suite. Ce processus prenait beaucoup de temps. Même en tant que rédacteur expérimenté, je passais souvent des heures à transcrire une seule réunion ou une seule interview.

Les outils de transcription pilotés par l’IA ont changé la donne. Ils peuvent transcrire des clips audio en temps réel, ce qui permet aux utilisateurs de se concentrer sur leur participation aux réunions. La prise de notes et l’enregistrement des procès-verbaux sont très distrayants.

mp4

Notta est l’un des outils les plus fiables que j’utilise. Reliez-le à vos comptes Zoom et Google Meet, et vous obtiendrez automatiquement des transcriptions après chaque réunion. Bien entendu, vous pouvez également télécharger des enregistrements audio et vidéo pour générer des transcriptions.

9. Création de CV

Les recruteurs examinent des dizaines de CV par jour afin de trouver les candidats idéaux pour leur entreprise. Si vous ne vous distinguez pas des autres candidats, vous risquez de ne même pas passer le processus de sélection initial. Alors, au lieu de recycler des modèles de CV génériques, créez-en un unique en utilisant l’IA.

Je recommande OpenResume et Teal. Vous trouverez plusieurs créateurs de CV en ligne, mais la plupart d’entre eux facturent des tarifs élevés pour des modèles simples et répétitifs. En revanche, ces deux créateurs proposent des versions gratuites fonctionnelles. Ils sont également dotés de fonctions intuitives — il vous suffit de remplir les cases avec vos références et de choisir vos mises en page préférées.

10. Rédaction d’e-mails complexes

J’ai souvent du mal à envoyer mes e-mails ; j’ai tendance à trop analyser s’ils semblent impolis ou agressifs, en particulier lorsque je m’adresse à des collègues. Pour accélérer le processus, je génère des prompts avec l’IA.

J’indique à ChatGPT, Bard ou Google Labs l’essentiel de mon message, puis ils le reformulent pour plus de clarté. Ensuite, je modifie le résultat pour qu’il corresponde à mon ton. C’est tellement plus facile et plus rapide que de me remettre en question en parcourant ma boîte de réception. Je passe également mes e-mails au crible de Grammarly. Il détecte les mots mal orthographiés, les erreurs grammaticales, les fautes de frappe et les phrases maladroites qui m’ont échappé. Ne négligez pas ces erreurs, elles donneront à vos courriels un aspect non professionnel.

Ces exemples illustrent seulement une fraction des applications de l’IA dans la vie quotidienne. En explorant et en adoptant ces outils, on peut non seulement améliorer notre efficacité, mais aussi ouvrir la porte à de nouvelles possibilités créatives et professionnelles.

Lire plus
Intelligence Artificielle

Sam Altman d’OpenAI propose un plan audacieux pour l’avenir des puces d’IA

0ac93081 1612 44f4 9a9d 13af541925de

Le PDG d’OpenAI, Sam Altman, cherche à obtenir un investissement de 7 000 milliards de dollars pour réformer l’industrie mondiale des semi-conducteurs, rapporte le Wall Street Journal.

Les puces à semi-conducteurs sont un facteur extrêmement limitant dans le monde du développement de l’intelligence artificielle (IA) en raison de la puissance de calcul extrêmement élevée nécessaire pour former les modèles d’IA. Avec cet investissement, Altman cherche à annuler un facteur qui limite considérablement le potentiel de croissance d’OpenAI.

Malgré les investissements considérables et l’orientation stratégique du gouvernement américain, l’industrie des semi-conducteurs est complexe. En raison de sa valeur stratégique et de l’importance des puces pour le développement de l’IA, il s’agit d’un secteur très réglementé et les États-Unis exercent des contrôles stricts sur l’exportation des puces. Altman a rencontré la secrétaire au commerce, Gina Raimondo, pour discuter de son plan ambitieux.

« OpenAI a eu des discussions productives sur l’augmentation de l’infrastructure mondiale et des chaînes d’approvisionnement pour les puces, l’énergie et les datacenters, qui sont essentiels pour l’IA et d’autres industries qui en dépendent », a déclaré un porte-parole de OpenAI au WSJ. « Nous continuerons à tenir le gouvernement américain informé étant donné l’importance des priorités nationales, et nous sommes impatients de partager plus de détails à une date ultérieure ».

Toutefois, la collecte des 5 à 7 billions de dollars nécessaires ne sera pas une mince affaire. Comme le rapporte le WSJ, la taille du marché mondial des puces semi-conductrices était de 527 milliards de dollars l’année dernière et ne devrait pas atteindre 1 000 milliards de dollars avant 2030. L’investissement recherché éclipse même le marché des équipements de fabrication de puces, qui s’élevait à environ 100 milliards de dollars l’année dernière.

Sam Altman recherche un montant supérieur au PIB de la plupart des pays

Arrêtons-nous un instant pour replacer ce chiffre dans son contexte, car 7 000 milliards de dollars représentent une somme extravagante. Le PIB de la France s’élève à 3 000 milliards de dollars, soit moins de la moitié de la somme recherchée par Alman. La valeur combinée de Microsoft et d’Apple, les entreprises les plus valorisées des États-Unis, dépasse à peine les 6 000 milliards de dollars.

L’entrepreneur technologique a rencontré des représentants du gouvernement des Émirats arabes unis et des hommes d’affaires de Taïwan pour tenter de faire avancer ses projets. Malgré l’intérêt du Moyen-Orient, Altman souhaite concentrer ses usines de fabrication de puces aux États-Unis, notamment en raison des investissements considérables de l’administration Biden dans l’industrie des puces.

OpenAI est en partenariat avec Microsoft et bénéficie de son soutien total. Altman a discuté de ses projets avec Satya Nadella, le PDG de Microsoft, et Kevin Scott, son directeur de la technologie, et continue avec leur soutien.

Rien n’a encore été confirmé concernant cet énorme projet, mais Altman continue de rencontrer des personnes influentes pour le faire avancer.

Lire plus
Intelligence Artificielle

Roblox révolutionne le jeu en ligne avec un traducteur de texte en temps réel

ko to en revised 1

Roblox a créé un impressionnant outil de traduction de texte en temps réel qui pourrait transformer l’expérience de jeu de son public. Le modèle d’IA est si habile que les utilisateurs ne se rendent peut-être même pas compte qu’il traduit le texte d’autres joueurs dans 16 langues, dont l’anglais, le français, le japonais et le vietnamien.

La vaste plateforme communautaire de jeux en ligne, qui compte 70 millions d’utilisateurs quotidiens, vise à améliorer la communication entre les joueurs, afin de rendre l’expérience globale plus confortable, comme l’a déclaré son directeur technique, Dan Sturman.

« Nous savons que l’engagement augmente lorsque les utilisateurs parlent ou interagissent avec d’autres dans leur propre langue », a-t-il déclaré. « Nous avons repris ce concept et supprimé la barrière de la langue grâce à la traduction automatique ».

Imaginez que vous soyez en vacances dans un pays étranger et que vous puissiez converser instantanément avec une autre personne ou un individu partageant les mêmes idées. Fantastique.

Roblox s’est lancé dans l’aventure en construisant un Large Language Model (LLM) basé sur un transformateur et en l’entraînant à partir de données publiques et d’informations internes.

en default demo

Changer l’expérience de jeu

Le LLM a ensuite été immergé dans une architecture de mélange d’experts (MoE), faisant fonctionner plusieurs applications de traduction sans que l’entreprise n’ait besoin de construire un LLM individuel pour chaque langue.

Le communiqué de blog officiel relatif à la fonction de traduction de texte détaille les exigences : « nous avons besoin d’un modèle contextuel qui reconnaisse le langage spécifique à Roblox, y compris l’argot et les abréviations (comme obby, afk ou lol). En outre, notre modèle doit prendre en charge n’importe quelle combinaison des 16 langues actuellement prises en charge par Roblox ».

Sturman a tenu à souligner que Roblox continuera à surveiller les communications entre les utilisateurs, à la fois pour des raisons de sécurité et pour signaler et résoudre tout problème lié à des traductions incorrectes.

Le modèle introduit par le réseau de jeu se généralisera au fur et à mesure des développements de l’IA, mais ce n’est pas le seul traducteur actuellement utilisé. Meta, propriétaire de Facebook, a lancé son traducteur de la parole au texte et du texte au texte, SeamlessM4T, tandis que YouTube héberge déjà le modèle universel de parole de Google pour fournir des sous-titres dans plus de 100 langues.

Lire plus
Intelligence Artificielle

Microsoft soutient le journalisme avec de nouvelles initiatives IA pour 2024

ad93e65c 7e45 440a 9361 71f44cbfd23c

Microsoft a annoncé lundi 5 février plusieurs nouvelles collaborations visant à aider les organismes de presse à adopter des outils et des techniques d’intelligence artificielle (IA).

Ces initiatives s’inscrivent dans le cadre des efforts déployés par Microsoft pour garantir que le journalisme puisse innover afin de servir l’intérêt public au cours d’une année électorale cruciale.

Dans le cadre de ces nouveaux programmes, Microsoft fournira une formation à l’IA, des ressources et un accès à la technologie aux organes de presse et aux écoles partenaires de journalisme. L’objectif est de démontrer comment l’IA peut rendre la collecte d’informations plus efficace et plus durable tout en respectant les normes éthiques.

« Notre objectif est de soutenir des salles de rédaction prospères et durables en leur fournissant la technologie dont elles ont besoin pour remplir la fonction essentielle d’informer le monde », a déclaré Noreen Gillespie, directrice du journalisme chez Microsoft, sur le blog de Reporting The World.

Les organisations collaboratrices sont le projet GroundTruth, Semafor, l’école supérieure de journalisme Craig Newmark de CUNY, l’Online News Association (ONA) et la startup Nota spécialisée dans l’IA. GroundTruth ajoutera une filière IA à son corps de reporters locaux. Semafor utilisera les outils Microsoft pour aider les journalistes à découvrir diverses sources et perspectives. L’école de journalisme CUNY proposera un programme de formation à l’IA gratuit pour les journalistes en activité. L’ONA organisera des événements et des sessions de formation pour diffuser les meilleures pratiques en matière d’IA. Nota, qui travaille déjà en partenariat avec plus de 100 salles de rédaction sur l’IA, prévoit de lancer un nouvel outil pour optimiser le contenu.

IMG20221216093301 1140x725 1 jpg

L’humain doit rester dans les salles de presse

Tous les partenaires se sont engagés à partager leurs résultats avec l’ensemble du secteur des médias. Les projets s’appuient sur l’initiative Democracy Forward de Microsoft, lancée l’année dernière pour aider le journalisme à contrer les menaces qui pèsent sur l’information.

L’élément central de ces efforts est de s’assurer que les journalistes humains restent au cœur des salles de rédaction. « Il n’y a pas d’organes de presse sains sans journalistes qui connaissent leurs communautés et leurs sujets », a affirmé Gillespie.

En démontrant le potentiel de l’IA tout en atténuant les risques, Microsoft espère apporter un éclairage positif sur la façon dont les technologies émergentes peuvent soutenir un journalisme de qualité malgré les vents contraires de l’économie. Alors que des milliards de personnes voteront cette année dans le monde entier, l’entreprise considère qu’un journalisme fiable et éthique est essentiel à la bonne santé des démocraties.

« La survie de l’information factuelle est inextricablement liée à des démocraties saines, à des communautés prospères et à la participation civique », conclut Gillespie.

L’IA perturbe le journalisme

L’industrie de l’information n’est pas étrangère aux bouleversements. Elle a été durement touchée par le passage à la consommation de médias en ligne et par la baisse correspondante des revenus tirés de la presse écrite. Ensuite, Google et Facebook se sont accaparés la part du lion des recettes publicitaires et, enfin, comme il est plus facile que jamais de créer un site Web d’information, de petites publications indépendantes et insurgées ont vu le jour.

L’IA pose un nouveau défi. Si les outils d’IA promettent d’améliorer l’efficacité des salles de rédaction, le fait de s’appuyer trop fortement sur les technologies automatisées pour la collecte et la production d’informations présente également d’importants inconvénients. Cela pose également des risques concernant la perte de qualité, de diversité, d’emplois et de confiance.

Il est clair qu’il s’agit d’une technologie qui ne peut être ignorée et qui doit être abordée de front. Les avantages pourraient l’emporter sur les inconvénients, mais seulement s’ils sont gérés avec soin et en toute connaissance de cause.

Lire plus