Nos solutions de traitement d'image

En partant d'une base de données d'images classée, nous pouvons définir ce qu'il y a sur de nouvelles images. Lors de notre premier entretien, nous voulons en général avant tout comprendre les enjeux de vos besoin de traitement d'image. En fonction de vos priorités, nous axerons nos efforts plutôt sur une classification rapide et un poids léger de modèle ou plutôt sur une classification lourde et la plus efficace possible. Une fois qu'on a compris vos besoin, nous passons à la récolte des images et à la classification. Nous créons un premier modèle (appelé modèle naïf) et nous comparons avec ce que les humains experts du domaine peuvent faire en qualité. Notre but est de dépasser ce que des experts peuvent atteindre en reconnaissance visuelle.

CNN picture

Dans le détail technique

En triant dans des dossiers différents, en utilisant keras avec Tensorflow, nous ordonnons les données. Une fois celles-ci labelisées, et la bonne dose d'augmentation des données faite, il ne nous reste qu'à créer l'architecture convolutionnelle (Conv, MaxPooling, BatchNorm) qui va faire ses boucles de 'forward propagation', calcul du coût et 'backward propagation'. En passant par quelques étapes supplémentaires on arrive à obtenir des 'métrics' intéressantes et une perte faible. Notre modèle est alors prêt à être testé après le dev set, sur notre test set qui représentent tous deux la distribution réelle du monde.

Exemple classique de la classification d'images

Catégoriser une image en "chien ou chat" est assez commun, mais d'autres applications plus sérieuses comme la classification de la flore, de la faune, de radios pour détecter des tumeurs et pleins d'autres choses sont faisables. Le but est de dépasser la performance humaine dans ces domaines, pour créer une sorte de conseillé sage qui peut nous appuyer.

  • Créer une seconde opinion bien utile.
  • Permettre d'être accompagné d'un expert en mettant en production dans une application.

Exemple de localisation

Un exemple bien connu est celui des voitures autonomes avec des algorithmes comme YOLO, nous pouvons, dans une même image, identifier les différents sujets (piétons, autres voitures, etc) et montrer la position de chacun sur l'image.

  • Détecter où se trouve un objet sur une image
  • Coupler avec un algorithme de classification permet d'identifier.

Nos centres d'intérêt actuels

Nous le proposerons bientôt en service mais nous avons à coeur de générer automatiquement des images de qualité en passant une chaîne textuelle en entrée ou une simple séquence de nombres. Les technologies telles que les GAN, StyleGAN2 et VAE nous intéressent énormément.