Le géant de la technologie Mark Zuckerberg continue d’investir massivement dans les technologies de pointe, notamment l’intelligence artificielle. Meta, détenu par ce dernier, a ainsi lancé ImageBind, un outil d’IA capable d’assimiler six modalités différentes en même temps : images, vidéos, audio, profondeur, mouvements thermiques et spatiaux.
Avec cet outil, Meta se démarque de ses principaux concurrents, qui se contentent de traiter le texte, l’image, la vidéo et l’audio. ImageBind, quant à lui, permet de reproduire l’expérience sensorielle des humains en apprenant à relier plusieurs entrées. Et selon l’entreprise de Zuckerberg, il ne s’agit que d’un début.
Zoom sur ImageBind, le nouvel outil d’IA de Meta
ImageBind a été conçu pour aider les machines à comprendre de manière plus approfondie l’environnement qui les entoure. Selon Meta, il peut même mettre à jour les modèles d’IA existants pour prendre en charge les entrées provenant de l’une des six modalités, permettant ainsi la recherche basée sur l’audio, la recherche multimodale, l’arithmétique multimodale et la génération multimodale.
L’outil est disponible sur le site open source de Meta pour les développeurs qui souhaitent l’utiliser ou le tester.
Meta défie les limites de l’apprentissage multimodal
L’équipe de Meta est convaincue que cette approche multimodale de l’IA est l’avenir. Meta veut aller encore plus loin en ajoutant d’autres sens, notamment le toucher, la parole, l’odorat et les signaux IRMf du cerveau. Pour l’instant, les recherches dans ce domaine sont encore en cours, et un travail considérable reste à accomplir.
Meta note : « Il reste encore beaucoup à découvrir sur l’apprentissage multimodal. La communauté des chercheurs en IA doit encore quantifier efficacement les comportements de mise à l’échelle qui n’apparaissent que dans des modèles plus vastes et comprendre leurs applications. »
Meta continue de repousser les limites de l’intelligence artificielle avec des projets tels que ImageBind et LLaMa, un outil d’IA destiné à entraîner et améliorer les modèles de traitement du langage naturel. Meta contribue ainsi à l’essor de l’IA en voulant la rendre plus intelligente et plus sensible.
Afficher sommaire

Je suis une grande fan de nouvelles sur les gens – je suis une pro de la tech et des smartphones, de la littérature de série, et j’écris pendant mon temps libre.