Dans la plupart des équipes commerciales que nous croisons, un manager écoute 5 à 10 appels par semaine. Et son équipe en passe 200 à 400. Cela veut dire que 95% des conversations clients ne sont jamais évaluées. C’est un trou noir. Quand Heex Technologies nous a demandé de combler ce trou, nous avons construit un scoring IA automatique sur 100% des appels. Ce qui s’est passé ensuite a été plus intéressant que la techno elle-même.

Le problème : 5 appels écoutés sur 200

Heex est une scale-up tech avec 8 commerciaux. Chacun passe 30 à 40 appels par semaine — démo, qualification, closing. Le directeur commercial écoutait, dans le meilleur des cas, 10 appels par semaine. C’est 4% de visibilité sur l’activité.

L’effet collatéral : le coaching commercial était fondé sur un échantillon biaisé. Le manager entendait souvent les mêmes deux ou trois commerciaux, et passait à côté des bonnes pratiques (et des mauvaises) des autres.

Le brief : pouvoir scorer chaque appel automatiquement, et faire de cette donnée un outil de progression collective.

L’architecture qu’on a livrée

Côté capture : intégration aux outils de visio (Zoom, Google Meet) et au softphone du CRM. Dès qu’un appel se termine, le fichier audio remonte automatiquement.

Côté transcription : Whisper en local pour les appels sensibles, l’API OpenAI pour le reste. Précision côté français : > 95%.

Côté scoring : un workflow LLM compare le déroulé de l’appel au script commercial Heex (découverte → qualification → démo → objections → closing). Il produit un score 0–100 par étape, plus une synthèse en deux lignes.

Côté restitution : push automatique vers le dashboard via un workflow d’automatisation IA. Pas de ressaisie, pas d’export Excel.

Le pivot : de « reporting » à « coaching »

Au lancement, l’équipe commerciale était méfiante. Le mot « scoring IA » sonnait comme « surveillance automatisée ». Et c’est légitime : si les scores sont publics, vous tuez le moral en deux semaines.

Nous avons donc fait un choix produit : par défaut, chaque commercial voit ses propres scores en détail (avec les passages problématiques surlignés), mais le manager ne voit que des moyennes agrégées. Pas de classement public, pas de comparaison directe.

Le résultat a été surprenant. Au bout de quelques semaines, les commerciaux ont commencé à écouter eux-mêmes leurs appels les moins bien notés, à identifier leurs propres patterns d’échec (ne pas creuser la décision, sauter la qualification du budget). C’est devenu un outil d’auto-amélioration, pas de surveillance.

Quatre erreurs à éviter en scoring IA d’appels

Erreur 1 — Scorer sans script comme baseline. Si vous demandez à un LLM « ce commercial est-il bon ? » sans cadre, vous obtenez du bruit. Il faut un script de référence (même imparfait) sur lequel comparer. Sinon, le score change selon l’humeur du modèle.

Erreur 2 — Mettre tous les scores publics. Tentant côté management, désastreux côté équipe. Les commerciaux gameront le score (parler longtemps pour cocher les cases) et perdront la spontanéité qui fait gagner les deals.

Erreur 3 — Vouloir un score chiffré ultra-précis. La différence entre un score de 72 et 78 n’a aucun sens statistique. Mieux vaut trois niveaux (« on protocol », « partial », « off-script ») que du faux 0–100.

Erreur 4 — Oublier le RGPD du recording. Vos prospects doivent être informés à l’ouverture de l’appel que la conversation est enregistrée et analysée par un système automatisé. C’est un point bloquant si on l’oublie.

Étendre au-delà du sales

La même architecture peut servir bien au-delà des appels commerciaux. Le support client : scorer la résolution et la satisfaction. L’onboarding (comme dans le cas Toshify) : scorer la qualité de la qualification IA. Les RH : scorer les entretiens (avec consentement, évidemment).

Le pattern à retenir : transcrire automatiquement, scorer contre un cadre, restituer aux bonnes personnes au bon niveau d’agrégation. C’est un workflow réutilisable, pas un produit one-shot.

Ce que nous retenons

Le vrai succès chez Heex n’est pas le scoring lui-même. C’est le passage du scoring d’un outil de reporting à un outil de coaching. Ce passage tient à un détail produit : qui voit quoi, et à quel niveau d’agrégation. Si on l’avait raté, on aurait livré un outil techniquement correct mais socialement inutilisable.

Lire le cas complet Heex