GPT-4o Mini ou Claude 3.5 Sonnet : Quel modèle d’IA pour HRzilla ?

Christophe Thibault
27 novembre

Derrière notre solution innovante HRzilla, il y a des choix techniques cruciaux. Aujourd’hui, nous vous partageons notre réflexion sur le choix du modèle d’IA pour HRzilla : GPT-4o Mini ou Claude 3.5 Sonnet

Chez Flint, nous sommes convaincus que l’intelligence artificielle a le potentiel de révolutionner de nombreux métiers, dont ceux du recrutement. C’est dans cet esprit que nous avons conçu HRzilla, notre solution SaaS destinée à simplifier et accélérer les processus RH pour les entreprises. Mais derrière chaque produit performant, il y a des choix techniques cruciaux. Aujourd’hui, nous vous partageons notre réflexion sur le choix du modèle d’IA pour HRzilla.

Bienvenue dans les coulisses de nos décisions, avec une comparaison détaillée entre deux modèles d’IA qui ont retenu notre attention : GPT-4o Mini et Claude 3.5 Sonnet.

Flint propose HRzilla : l’IA qui accélère vos processus de recrutement

HRzilla, notre logiciel SaaS, transforme la façon dont les entreprises gèrent les processus RH grâce à l’intelligence artificielle. Analyse en profondeur de chaque CV (compétences clés et expériences pertinentes), classement des CV par pertinence, proposition de questions personnalisées pour les entretiens … HRzilla est un partenaire stratégique pour les recruteurs, allégeant la charge de travail tout en maintenant le contrôle humain au cœur du processus de sélection. 

En savoir plus sur notre démarche ici : Flint dévoile HRzilla, l’IA qui accélère vos processus de recrutement.

Pour maximiser les performances de HRzilla, il fallait choisir un modèle d’IA capable de répondre à trois critères :

  • Vitesse : Offrir une expérience fluide et réactive pour les utilisateurs.
  • Capacité contextuelle : Gérer de grandes quantités de données complexes, telles que du texte et des images
  • Rentabilité : Proposer un outil performant tout en maîtrisant les coûts.

Nous avons donc étudié deux modèles : GPT-4o Mini et Claude 3.5 Sonnet.

GPT-4o Mini : l’efficacité à moindre coût

GPT-4o Mini a attiré notre attention pour son rapport coût-performance imbattable.

Coût

  • Input : $0,15/million de tokens.
  • Output : $0,60/million de tokens.
  • Comparé à Claude 3.5 Sonnet, GPT-4o Mini est environ 20 à 25 fois moins cher, ce qui est crucial pour garantir la viabilité économique d’une application SaaS comme HRzilla.

Performances techniques

  • Fenêtre contextuelle : 128 000 tokens, largement suffisant pour traiter des CV volumineux ou des workflows complexes.
  • Capacité de sortie : 16 400 tokens, idéal pour générer des réponses longues ou synthétiques.
  • Temps de réponse : 105 tokens de sortie par seconde garantissant une interaction rapide avec les utilisateurs.

Pourquoi GPT-4o Mini nous séduit ?

Avec une fenêtre contextuelle généreuse, des coûts réduits et sa polyvalence multimodale, GPT-4o Mini s’est imposé comme une solution parfaitement adaptée à des tâches clés comme :

  • L’analyse rapide de CV.
  • La génération de réponses contextuelles pour les questions de préparation à l’entretien.
  • La gestion économique d’un grand volume de requêtes.

Claude 3.5 Sonnet : la polyvalence à un prix élevé

De son côté, Claude 3.5 Sonnet offre des performances techniques impressionnantes, mais avec un coût bien supérieur.

Coût

  • Input : $3,00/million de tokens.
  • Output : $15,00/million de tokens.
  • Malgré sa précision, son coût représente un investissement important, difficilement justifiable pour des besoins RH généralistes.

Performances techniques

  • Fenêtre contextuelle : 200 000 tokens, offrant une capacité inégalée pour traiter des contextes très complexes.
  • Capacité de sortie : 4 096 tokens, plus limitée que GPT-4o Mini pour les tâches nécessitant beaucoup de génération de texte.
  • Temps de réponse : 56 tokens de sortie par seconde.

Pourquoi Claude 3.5 Sonnet reste intéressant ?

Ce modèle brille dans des cas spécifiques, comme :

  • L’analyse approfondie de gros ensembles de données.
  • La production de contenus nécessitant une compréhension très fine des nuances contextuelles.

Le choix final de GPT-4o Mini pour HRzilla

Chez Flint, notre philosophie est claire : proposer des solutions performantes tout en restant pragmatiques sur les coûts. Après avoir testé et comparé ces deux modèles, nous avons choisi GPT-4o Mini pour HRzilla.

Pourquoi ?

  • Optimisation des coûts : Pour un outil SaaS destiné à un large public, les économies sur le coût d’inférence. GPT-4o Mini nous permet de maintenir des tarifs compétitifs pour nos clients.
  • Vitesse et performance : Avec une grande réactivité et une capacité de sortie supérieure, ce modèle nous permet de répondre parfaitement aux attentes des recruteurs.
  • Capacité contextuelle suffisante : Les 128 000 tokens de fenêtre contextuelle sont largement adaptés aux besoins d’HRzilla (traitement de textes et d’images), que ce soit pour analyser des CV ou pour des workflows complexes.

Claude 3.5 Sonnet, un choix pour l’avenir

Même si nous avons écarté Claude 3.5 Sonnet pour le moment, nous ne fermons pas la porte à ce modèle. Pour des cas d’usage nécessitant une profondeur d’analyse exceptionnelle, il pourrait devenir une solution complémentaire à l’avenir.

Et maintenant ?

Grâce à GPT-4o Mini, HRzilla est en mesure de proposer une expérience rapide, précise et abordable pour ses utilisateurs. 

Nous sommes toujours en recherche de beta-testeur. Alors rejoignez l’aventure et soyez parmi les premiers à bénéficier des avantages d’HRzilla ou bien prenons juste un café pour échanger sur ce choix, Flint et comment nous pourrions aussi vous accompagner dans vos projets IA et GenAI

Christophe Thibault

Data Scientist et AI Engineer chez Flint