Bonjour, câest Fabrice pour votre Point fort du jour.
Beaucoup s’extasient sur ChatGPT, capable de traiter du texte et de l’image. Mais saviez-vous que les IA sont sur le point de prendre notre voix?
Se profile le vieux rĂȘve du traducteur universel qui nous dispensera de cours d’allemand, mais aussi la crainte de n’ĂȘtre plus jamais sĂ»r de qui est au bout du fil.
đ«Ą Et si vous avez une minute avant cela, n’hĂ©sitez pas Ă nous donner votre avis sur le Point fort. C’est grĂące Ă vos retours qu’on s’adapte Ă vos envies! |
Avant d'entrer dans le vif
|
|
Ne lui manque que la parole
|
Le traducteur universel de Star Trek/ John Kobal Collection
|
đLire la version Ă©toffĂ©e en ligne (abonnĂ©s)đ
➢ La sortie de GPT-4, le nouveau moteur sous le capot de ChatGPT, masque des dĂ©veloppements tout aussi significatifs dans l’IA appliquĂ©e Ă la parole.
➢ A l’horizon: des assistants virtuels vraiment intelligents, et la traduction d’Ă©noncĂ©s en temps rĂ©el.
đ„ Souvenez-vous du film Her, oĂč le personnage principal tombe amoureux dâune IA Ă la voix chaude et Ă©raillĂ©e de Scarlett Johansson.
đ Et du poisson Babel, lâanimal-interprĂšte universel du Guide du voyageur galactique, le roman de S-F loufoque de Douglas Adams.
De quoi on parle. Les tentatives actuelles de traducteurs instantanés, comme celle de Skype, sont limitées par une synthÚse vocale peu convaincante. Les assistant virtuels tels que Siri, Alexa ou Cortana restent simplistes. Ca va changer
đ DĂ©but mars, des informaticiens ont par exemple associĂ© ChatGPT aux logiciels de la start-up britannique ElevenLabs pour lire des textes gĂ©nĂ©rĂ©s Ă haute voix.
đ„Œ Les technologies vocales dĂ©voilĂ©es par OpenAI et Microsoft laissent entrevoir des applications de conversations orales encore plus puissantes.
L’effet Vall-E X.
đŒ Il y a deux mois, les chercheurs de Microsoft ont dĂ©voilĂ© Vall-E, un modĂšle de synthĂšse vocale capable d’imiter de maniĂšre convaincante votre voix sur la base d’un enregistrement de… trois secondes.
đ La semaine derniĂšre, Microsoft a prĂ©sentĂ© une nouvelle version de Vall-E. BaptisĂ©e Vall-E X, elle peut traduire instantanĂ©ment vos propos dans une langue Ă©trangĂšre, en gardant vos intonations et l’Ă©motion initiale.
đ Pour l’instant, cela ne fonctionne quâentre le chinois et lâanglais, mais dâautres langues sont prĂ©vues. Les chercheurs consultĂ©s par Heidi.news se disent impressionnĂ©s.
đšđł «Les exemples de dĂ©monstration en chinois sont bons.», estime Zhijing Jin, chercheuse en intelligence artificielle au Max Planck Institute et Ă lâEPFZ.
Whisper vous Ă©coute.
➢ Il y a deux semaines, OpenAI, lâentreprise derriĂšre ChatGPT, a ouvert lâaccĂšs technique Ă Whisper, un modĂšle qui intĂšgre la reconnaissance automatique de la parole.
➢ EntrainĂ© sur 680’000 heures de donnĂ©es multilingues, Whisper peut analyser et retranscrire des phrases prononcĂ©es en plusieurs langues, malgrĂ© des bruits de fonds parasites.
➢ Phil Garner, chercheur senior Ă l’Institut Idiap (Martigny):
«De la reconnaissance du langage à son expression synthétisée de maniÚre quasi naturelle, et avec au milieu des IA productrices de textes comme ChapGPT, vous avez tous les éléments pour que des IA maitrisent des formes de langage parlé.»
Qui est au bout du fil?
đ„ž DĂšs lors que trois secondes d’audio suffisent pour imiter une voix, il suffira dâavoir nâimporte quel enregistrement de personne rĂ©elle pour usurper son identitĂ©.
đ Avec ces «deepfake» vocaux, comment ĂȘtre sĂ»r que l’on parle bien Ă son interlocuteur au tĂ©lĂ©phone? Bienvenue dans l’Ăšre du soupçon.
đLire la version Ă©toffĂ©e (abonnĂ©s)đ (FR)
|
|
Et l’Europe dans tout ça?
Lâhistoire du numĂ©rique est une longue liste dâopportunitĂ©s manquĂ©es par lâEurope. Un seul exemple: le web, inventĂ© Ă GenĂšve, dĂ©veloppĂ© dans la Silicon Valley. Maintenant que lâintelligence artificielle s’ouvre au grand public, avec des produits comme ChatGPT, le vieux continent sera-t-il enfin Ă la hauteur?
Heidi.news (abonnés) (FR)
|
Ingénieurs, le grand remplacement?
Les IA gĂ©nĂ©ratives ne se contentent pas d’Ă©crire des poĂšmes ou de dessiner dans le style du studio Ghibli. Elles sont aussi capables de coder des programmes informatiques. Les ingĂ©nieurs en IA sont-ils en train de construire la machine qui va les remplacer demain? Notre enquĂȘte.
Heidi.news (abonnés) (FR)
|
|
Il est temps de raconter le monde
|
|
ChatGPT 4 est dĂ©sormais capable d’analyser et dĂ©crire des images. Bluffant? On remarquera quand mĂȘme que certain des ingrĂ©dients proposĂ©s ne sont pas Ă l’image. | Source: New York Times
|
GPT-4: AprĂšs le texte, ChatGPT se met Ă l’image.
OpenAI, lâentreprise derriĂšre le moteur conversationnel ChatGPT vient de dĂ©voiler mardi GPT-4, la nouvelle version de son modĂšle de langage, encore plus puissante et capable de traiter des images. Une annonce trĂšs attendue dans le monde de la tech, aprĂšs lâengouement suscitĂ© Ă la fin de lâannĂ©e par cette IA.
Heidi.news (abonnés) (FR)
|
|
Des nuages de carbone.
Les IA gĂ©nĂ©ratives comme GPT-4 sont de grosses consommatrices de donnĂ©es et de puissance de calcul, et donc d’Ă©lectricitĂ©. La rĂ©volution que nous sentons poindre s’accompagnera-t-elle d’immenses Ă©missions de CO2? L’opacitĂ© rĂšgne, relĂšve Bloomberg, avant de plonger dans les efforts des chercheurs pour la dissiper.
Bloomberg (accĂšs libre) (EN)
|
Droit au cĆur via les oreilles.
Dans Wired for Speech, Clifford Nass et Scott Brave, chercheurs Ă Stanford, montraient en 2007 dĂ©jĂ Ă quel point nous sommes influencĂ©s par la voix et rĂ©agissons aux technologies vocales comme nous rĂ©agirions Ă des personnes rĂ©elles. Les auteurs examinaient par exemple comment les gens rĂ©agissent Ă une voix fĂ©minine dans le commerce Ă©lectronique ou comment la voix d’une voiture peut promouvoir une conduite plus sĂ»re. Bref, comment nous pourrions ĂȘtre manipulĂ©s par des voix artificielles.
Wired for Speech (livre) (EN)
|
L’IA humanisĂ©e.
Dans The Most Human Human, publiĂ© en 2011 mais hĂ©las non traduit, le chercheur, informaticien et poĂšte amĂ©ricain Brian Christian montre comment l’intelligence artificielle et en particulier les agents conversationnels, loin d’ĂȘtre une menace pour notre humanitĂ©, nous offrent une occasion de mieux comprendre qui nous sommes.
The Most Human Human (livre) (EN)
|
|
|
Avenue du Bouchet 2
1209 GenĂšve
Suisse
|
|
|