Datagen, Mindtech, Synthesis AI vendent des données synthétiques pour l’IA

Sloched dans le métro après une nuit de fête? Vous vous ennuyez lors d’une réunion virtuelle ? S’assoupir à un feu rouge ? Les entreprises créent des logiciels qui utilisent l’IA pour surveiller le comportement des gens et interpréter leurs émotions et leur langage corporel dans la vie réelle, virtuellement et même dans le métaverse. Mais pour développer cette IA, ils ont besoin de fausses données, et les startups interviennent pour les fournir. Les sociétés de données synthétiques fournissent des millions d’images, de vidéos et parfois d’échantillons de données audio qui ont été générés dans le seul but de former ou d’améliorer des modèles d’IA qui pourraient faire partie de notre vie quotidienne dans des formes controversées d’IA telles que la reconnaissance faciale, l’IA émotionnelle et d’autres systèmes algorithmiques utilisés pour suivre le comportement des gens. Alors que dans le passé, les entreprises qui construisaient une IA basée sur la vision par ordinateur s’appuyaient souvent sur des ensembles de données accessibles au public, les développeurs d’IA se tournent désormais vers des données synthétiques personnalisées pour « résoudre de plus en plus de problèmes spécifiques à un domaine qui n’ont aucune donnée à laquelle vous pouvez réellement accéder », a déclaré Ofir Zuk. , co-fondateur et PDG de la société de données synthétiques Datagen. Les entreprises de données synthétiques telles que Datagen, Mindtech et Synthesis AI représentent un coin d’une industrie de l’IA de plus en plus compartimentée. Ils produisent des pièces d’IA qui seront éventuellement assemblées pour créer des logiciels, des fonctionnalités dans des applications ou des systèmes utilisés dans des véhicules. Ils servent des clients tels que des ingénieurs en vision par ordinateur et des scientifiques des données travaillant pour de grands géants de la technologie, des constructeurs automobiles, des sociétés de jeux ou des fabricants de téléphones mobiles. Image : Datagen Comme beaucoup de polyester, les ensembles de données synthétisés sont destinés à imiter la réalité. Les données synthétiques ne se contentent pas de répliquer les données photo et vidéo réelles ; il l’améliore en ajoutant des dimensions et des détails qui aident les systèmes basés sur l’IA à apprendre. Parfois, les éléments synthétiques comblent de graves lacunes dans les données lorsque les données réelles n’existent pas ou sont difficiles à obtenir. Il peut représenter des situations dangereuses sur les autoroutes utilisées pour former l’IA des véhicules autonomes, ou inclure des images faciales représentant des personnes de plusieurs ethnies ou âges nécessaires pour aider à garantir que l’IA prend des décisions justes et précises. Beaucoup de ces entreprises présentent les données synthétiques comme une panacée pour le manque d’ensembles de données de formation à l’IA diversifiés qui ont contribué à une IA discriminatoire, en particulier la reconnaissance faciale. « Nous aidons les clients à réduire les biais de l’IA en fournissant des données synthétiques couvrant un large éventail d’âge, de sexe, d’IMC et d’origine ethnique », a déclaré Yashar Behzadi, PDG de Synthesis AI. Former l’IA pour repérer les ivrognes et les tricheurs « Une entreprise nous a récemment demandé une solution pour détecter la tricherie aux examens », a déclaré Steve Harris, PDG de Mindtech, une société qui propose une plate-forme de conception et de rendu d’images basées sur l’infographie photoréaliste. Harris n’a pas nommé le client de la technologie de test virtuel, mais a déclaré que, comme de nombreuses autres entreprises de technologie de test virtuel, le client souhaitait incorporer l’IA pour surveiller si les candidats au test montraient des signes de tricherie, comme détourner le regard de l’écran de l’ordinateur ou interagir avec une personne. ou un téléphone. Pour qu’un modèle d’IA capte tous les différents signes possibles de tricherie dans plusieurs environnements impliquant une variété de personnes, il faudrait un grand corpus d’images montrant les mouvements des mains, des yeux et du corps à partir desquels apprendre – le genre d’images qui pourraient être trop cher à l’achat, ou obliger à obtenir des violations de la vie privée, même s’il y en avait suffisamment. « Cela devient encore plus complexe lorsque vous ajoutez des données de points clés du visage et des données de pose de squelette pour entraîner les systèmes à comprendre dans quelle direction va le regard de l’élève, dans quelle direction son corps est sur le point de se tourner ou dans quelle direction ses mains sont tournées », a déclaré Harris. . Le Centre pour la démocratie et la technologie a signalé que les systèmes basés sur l’IA utilisés pour détecter la tricherie lors des tests virtuels présentent des risques pour la vie privée et la santé mentale des étudiants, et peuvent être discriminatoires à l’égard des personnes handicapées. Harris a déclaré que les clients sont également intéressés par l’utilisation de données synthétiques pour créer une IA à utiliser dans des lieux publics tels que les centres de transport. Certains ont recherché des données pour former des systèmes d’IA afin d’empêcher une personne altérée de se blesser dans une gare, par exemple, « si quelqu’un est ivre et se déplace trop près de la ligne », a-t-il déclaré. Mindtech a récemment dévoilé un ensemble d’images prédéfinies conçues spécifiquement pour les environnements de vente au détail qui pourraient être utilisées pour suivre l’intérêt des clients pour des produits spécifiques, suivre le stock sur les étagères des magasins ou prédire le flux de trafic dans les parkings. Au début de la pandémie, les clients de Mindtech voulaient des données synthétiques pour entraîner l’IA à surveiller le respect des règles relatives aux masques faciaux, a déclaré Harris. Alors que les entreprises continuent de développer l’IA pour une gamme infinie d’applications, les investisseurs voient un avenir radieux pour les fabricants de données synthétiques fournissant les matières premières. Mindtech a collecté 3,25 millions de dollars de financement l’année dernière. Synthesis AI a reçu 17 millions de dollars en financement de série A en avril, et Datagen a recueilli 50 millions de dollars lors d’un cycle de financement de série B fin mars. Les données sur l’expression faciale détectent l’ennui rencontré et la distraction du conducteur Pour l’instant, une grande partie de l’IA que les données synthétiques aident à construire est utilisée dans des situations banales et réelles telles que la conduite. Les données synthétiques entraînent des modèles d’IA pour les systèmes de surveillance des conducteurs qui capturent les images des conducteurs via des caméras de tableau de bord et utilisent l’IA de vision par ordinateur pour détecter les distractions, comme dans les véhicules de livraison. « Nous avons un certain nombre de clients dans cette région », a déclaré Behzadi. Par exemple, Synthesis AI fournit des données faciales synthétiques à Affectiva, une entreprise qui propose des systèmes basés sur l’IA pour estimer les émotions et les états cognitifs des personnes en temps réel afin de détecter la distraction du conducteur et les comportements tels que la rage au volant, selon Rana el Kaliouby, fondatrice d’Affectiva. . « Les données que nous fournissons à Affective et à d’autres dans le domaine de la surveillance des conducteurs sont axées sur l’amélioration de la sécurité des conducteurs – des actions telles que s’endormir, ne pas porter de ceinture de sécurité ou être distrait. Nous pensons que les données synthétiques peuvent être un net avantage pour réduire le nombre de décès et améliorer la sécurité globale », a déclaré Behzadi. Les systèmes basés sur l’IA pour évaluer le comportement des conducteurs devraient être de plus en plus courants dans les années à venir. La Commission européenne a rendu obligatoires les fonctions de reconnaissance de la distraction et de la somnolence pour les nouveaux véhicules cette année. Pendant ce temps, aux États-Unis, la loi sur l’infrastructure de 2022 a réservé des fonds pour étudier l’utilisation de systèmes de surveillance du conducteur afin de minimiser la distraction du conducteur. Les données synthétiques alimentent également l’IA pour la surveillance du lieu de travail. Le dernier produit de Datagen permet aux clients de créer des images annotées à 30 images par seconde pour une utilisation dans les technologies de bureau, de réunion et de conférence. Zuk a déclaré que les nouvelles données pourraient être utilisées pour former une IA qui détecte si quelqu’un s’ennuie lors d’une réunion de travail ; il comprend des données d’image montrant des personnes tenant leur tête dans leurs mains, par exemple. Déjà, des fonctionnalités basées sur l’IA pour évaluer les états émotionnels des gens apparaissent dans les plateformes de classe virtuelle et même dans les logiciels de réunion de vente, bien que les données synthétiques n’aient pas encore été utilisées pour former bon nombre de ces systèmes. Les défenseurs des droits de l’homme luttent contre l’utilisation potentielle de l’intelligence artificielle émotionnelle dans la technologie de tous les jours. Plus de 25 organisations, dont l’American Civil Liberties Union, l’Electronic Privacy Information Center et Fight for the Future, ont envoyé mercredi une lettre à Eric Yuan, fondateur et PDG de Zoom, exigeant que l’entreprise mette fin à son intention d’intégrer l’IA émotionnelle dans ses fonctionnalités logicielles. La lettre et les efforts précédents de Fight for the Future ont été motivés par un rapport dans Protocol en avril sur le plan potentiel de Zoom pour incorporer l’IA émotionnelle dans ses produits. « Ce logiciel est discriminatoire, manipulateur, potentiellement dangereux et basé sur l’hypothèse que tout le monde utilise les mêmes expressions faciales, schémas vocaux et langage corporel », ont écrit les groupes. Harris, de Mindtech, a déclaré que les entreprises qui construisent la prochaine vague de logiciels de bureau et de réunion sont intéressées par la surveillance des interactions humaines pour « signaler les choses qui semblent inhabituelles ». Il a dit qu’il s’attend à ce que des entreprises comme Meta et Google intègrent ce type d’IA de suivi dans les environnements virtuels qu’elles créent, mais il a ajouté : « C’est loin d’être le cas ». Pour que l’IA détecte si les gens prêtent attention à la route – ou au patron lors d’une réunion – elle doit souvent reconnaître les expressions faciales. Les ensembles de données de Synthesis AI incluent des distinctions infimes parmi des millions d’images exprimant jusqu’à 150 «micromouvements» du visage, a déclaré Behzadi. Les clients utilisent le système numérique de l’entreprise pour soumettre des demandes de données personnalisées, puis il affiche automatiquement ce qu’ils ont commandé. « Ils diront: » J’ai besoin d’un million d’images qui couvrent toutes ces différentes dimensions «  », a déclaré Behzadi. Le résultat peut être des milliers d’images faciales avec une variété de tons de peau, de styles de cheveux ou de caractéristiques comme des chapeaux ou des lunettes. La diversité se manifeste également dans la façon dont les images sont éclairées, a déclaré Behzadi. Si Synthesis AI crée des données à utiliser dans un environnement de réalité augmentée, le système produira plusieurs versions d’images de personnes ou d’objets – une tasse de café sur un bureau, par exemple – avec des variations dans la direction d’où émane la lumière. « Ainsi, lorsque je rends cette image dans la scène, elle est réaliste », a-t-il déclaré. Une étape éloignée des implications éthiques Selon el Kaliouby, Affective a utilisé des données synthétiques pour accroître la diversité de son ensemble de données représentant les personnes de toutes les tranches d’âge et de toutes les ethnies. Le simple fait d’avoir de nombreux visages à travers les cultures peut ne pas suffire à former l’IA qui doit également apprendre à quoi ressemblent les gens lorsqu’ils portent une casquette, lorsqu’ils sont alertes ou endormis ou dans des environnements à faible ou forte luminosité. « Cela devient très complexe et coûteux très rapidement de faire évoluer cela », a-t-elle déclaré. Mais alors que les entreprises de données synthétiques poussent une mission de diversité, leurs produits peuvent être utilisés pour créer des formes controversées d’IA. La légitimité de l’IA émotionnelle a été remise en question par des chercheurs qui affirment que ni les humains ni les machines ne peuvent détecter avec précision les émotions des gens en fonction des expressions faciales. Et en général, beaucoup pensent également que les systèmes algorithmiques surveillant les expressions faciales des gens ou leur façon de marcher ou de parler perpétuent une surveillance inutile et pourraient être utilisés pour pénaliser injustement les gens. Cependant, dans certains cas, les fournisseurs de données synthétiques restent à distance des produits qui seront fabriqués à partir de leurs données. Image : Datagen Parce qu’elles sont produites automatiquement, les données synthétiques sont accompagnées de métadonnées intégrées, y compris des détails sur ce que représentent les images et les vidéos qui sont nécessaires pour aider les modèles d’IA à apprendre. Dans le cas de Datagen, l’entreprise inclut des étiquettes indiquant l’intensité des expressions faciales telles que « légèrement souriant » ou « extrêmement heureux », mais permet également aux clients d’ajouter des étiquettes personnalisées. « Datagen propulse les progrès de l’IA en supprimant le besoin de rechercher et d’annoter manuellement les données de formation », a déclaré Gil Elbaz, CTO et co-fondateur de Datagen. La société n’a pas précisé si elle avait des restrictions sur les types de clients auxquels elle fournirait des données, si ce n’est pour dire qu’elle « se concentre sur les applications commerciales de vision par ordinateur permettant aux équipes d’IA de développer des cas d’utilisation sûrs et centrés sur l’humain ». Mais d’autres entreprises de données synthétiques laissent certaines des décisions d’étiquetage des données à leurs clients et restent à distance des produits finaux qu’elles contribuent à fabriquer. Au lieu de fournir des étiquettes qualitatives catégorisant les expressions faciales comme confuses ou ennuyées, Synthesis AI annote uniquement les images faciales avec des informations techniques. Une étiquette d’image peut inclure des métadonnées indiquant que le côté gauche de la bouche s’est déplacé vers le haut de 10 degrés, mais ne serait pas pré-étiqueté comme « légèrement heureux », par exemple. Alors que Behzadi a déclaré que Synthesis AI avait refusé de travailler avec des clients qui souhaitaient utiliser ses données pour identifier des personnes sans leur consentement, il a déclaré que la société n’avait pas refusé de clients potentiels qui souhaitaient que des données forment des modèles d’IA émotionnelle. Mindtech laisse également les décisions d’étiquetage et de produit final aux clients. « Nous comprenons que les expressions faciales sont très subjectives, nous permettons donc à un client de déterminer comment il souhaite utiliser les étiquettes », a déclaré Chris Longstaff, vice-président de la gestion des produits de Mindtech. Il a déclaré que la confidentialité des clients empêche Mindtech de connaître les détails des produits construits avec ses données. Attendez-vous à plus de création de données synthétiques dans un avenir proche, car elles constituent la base de toutes sortes d’IA conçues pour les environnements virtuels émergents. « Il est possible que les données synthétiques soient un outil de premier plan pour les entreprises du métaverse », a déclaré Harris. Behzadi a déclaré qu’il s’attend à ce que l’intérêt pour les utilisations liées au métaverse pour les données synthétiques s’intensifie au cours de la prochaine année. Synthesis AI travaille avec des clients qui souhaitent numériser des événements sportifs en temps réel pour des environnements métavers. À l’avenir, Behzadi a déclaré: « Je peux regarder le match avec les yeux de Tom Brady. »

Laisser un commentaire