Elements de contexte
Les évolutions de ces dernières années ont profondément réformé le paysage des professionnels du crédit (concentration bancaire, arrivées de nouveaux opérateurs...), de l'offre de crédits (ouvertures de crédit : croissance de 1.500.000 contrats entre 1999 et 20061 !) et les habitudes des consommateurs, de plus en plus nombreux à recourir au crédit en dehors de l'achat d'un immeuble ou d'un véhicule.
Cette forte croissance n'a été rendue possible que grâce à une forte rationnalisation des process2, dans laquelle se trouve en bonne place l'analyse risque réalisée pour l'octroi des crédits. De manière simple et schématique, on peut considérer que l'analyse risque s'articule autour de deux matières principales:
La mesure de la fiabilité
Celle-ci cherche à répondre à la question : « Cette personne est-elle digne de confiance? Respectera-t-elle ses engagements? Est-elle capable de gérer adéquatement son crédit? »
Elle s'intéresse à la nature du client, son comportement général, son attitude face à ses engagements.
La mesure de la solvabilité
S'intéresse aux données budgétaires du/des demandeurs – le niveau de revenu, les dépenses du ménage et les engagements en cours. L'objectif est de déterminer si le demandeur (et son ménage) dispose des moyens nécessaires au remboursement du crédit envisagé.
Principes généraux du « credit scoring »
Pour élaborer un tel outil statistique, il est nécessaire de disposer :
- d'un produit de crédit (ex : l'ouverture de crédit de 2.500 €)
Idéalement, le prêteur mettra au point un credit scoring par type de crédit proposé. En effet, selon les caractéristiques propres à chacun d'eux (montants minima et maxima, taux d'intérêt, durées de remboursement, mode de vente - agences, web, grandes surfaces,...), le credit scoring différera; - d'un échantillon de clients ayant eu accès à ce crédit, pour lesquelles les informations personnelles ont été conservées. Ces données sont principalement collectées grâce à un formulaire de demande de crédit, imprimé ou « en ligne ». Dans la phase de construction, les décisions d'octroi sont mises en oeuvre par un Comité de crédit qui travaille sans le support du score, de façon traditionnelle;
- de l'historique de remboursement de ces clients : pour réaliser un bon credit scoring, il est important de disposer, parmi ceux-ci, d'un nombre suffisant de clients défaillants (n'ayant pas honorés leurs engagements), idéalement de plusieurs centaines d'unités.
Sur base de ces informations, une analyse statistiques des données personnelles des clients sera réalisée. Le travail peut se révéler complexe, puisque cette analyse doit permettre d'identifier les combinaisons de données qui sont les plus fréquentes lors de défaillances, et à partir de là, construire une grille de score qui permettra de prédire la probabilité de défaillance (versus de remboursement) de chacun des clients.
Voici quelques illustrations qui rendront nos propos plus concrets.
Quant à la neutralité des données :3 :
En tant que telle, aucune d'entre elles n'est ni « bonne » ni « mauvaise » : elles seront chacunes plus ou moins fréquentes dans les situations de défaillances, en fonction de certaines combinatoires.
Exemple :
- une femme sera plus rarement défaillante qu'un homme;
- une femme célibataire sera plus rarement défaillante qu'un homme célibataire;/li>
- une femme célibataire sera plus souvent défaillante qu'une femme mariée;
- une mère célibataire sera plus souvent défaillante qu'un père célibataire
L'exemple ci-dessus ne reprend que les données « sexe – état civil – situation parentale », mais en réalité, il s'agit toujours de combinatoires complexes, puisqu'en permanence c'est au moins 15 données qui sont observées simultanément.
Quant aux types de données utilisées dans le score4 :
Caractéristiques du modèle | Sujet X | Score |
Age de l'emprunteur | 52 ans | 51 |
Situation maritale | Concubinage ou PACS | 19 |
Statut résidentiel | Locatire | 24 |
Lieu de résidence | Provence-Alpes-Côtes d'Azur | 20 |
Ancienneté à l'adresse actuelle | 9 ans | 17 |
Nature du contrat de travail ET ancienneté à l'emploi actuel de l'emprunteur | CDI ET 25 ans | 56 |
Fonction professionnelle de l'emprunteur | Agent de service | 31 |
Fonction professionnelle du conjoint | Agent de sécurité et de surveillance | 11 |
Nature du contrat de travail ET ancienneté à l'emploi actuel du conjoint | CDD ET 5 mois | 0 |
Revenu du ménage ET nombre de personnes du ménage | 2.200 € ET 2 personnes | 67 |
Pourcentage actuel des remboursements mensuels du ménage | 0% | 89 |
SCORE FINAL | 385 |
Les données reprises dans cet exemple sont particulièrement élémentaires. Parmi d'autres données qui sont recueillies et qui peuvent se révéler statistiquement significatives, on peut trouver aussi : le type d'habitat (certains formulaires proposent même les catégories « chalet », « caravane »,...), le type de magasin où la demande a été faite (Inno ou Carrefour), le type d'intermédiaire utilisé (le cas échéant)...
Dans les faits...on retiendra également...
Que la qualité prédictive des données n'est pas liée à leur « légitimité » dans le cadre d'une demande de crédit.
Si le type d'habitat se révèle très efficace d'un point de vue statistique, on peut s'étonner légitimement d'une telle question dans le cadre d'une demande de crédit : cet élément n'entretient pas de relation causale avec la fiabilité individuelle du client, sa capacité de remboursement ou son honnorabilité. Cet absence de lien causal entre la donnée collectée et l'objet de la demande soulève ce que nous désignons précisément par « légitimité ». Ne devrait-on pas se limiter à la collecte d'informations en lien avec l'objet sollicité : historique du remboursement de crédits, capacité financière, stabilité des revenus, niveau de dépenses incompressible...
Des dérives sont possibles sur ce point, et pour illustration supplémentaire, nous évoquerons celle qui se développe au Royaume-Uni concernant l'usage du domicile comme critère déterminant dans l'évaluation du risque (crédit, assurance,...) : ce dernier peut devenir tellement déterminant dans certaines transactions (il est vrai que cette donnée est par ailleurs très peu coûteuse à collecter et à vérifier) que des personnes sont soit amenées à déménager pour intégrer des quartiers « mieux côtés », soit à faire du lobbying pour que leur rue change de « catégorie de risque ».
Que le credit scoring est un sujet délicat pour l'industrie, car...
La construction d'un credit scoring représente un investissement lourd pour le prêteur. Il se construit sur base d'un traitement « manuel » d'un volume significatif de demandes et il n'atteint sa pleine puissance prédictive que si un volume suffisant de défaillances a pu être observé (ce qui signifie, autrement dit, des pertes significatives).
Un tel investissement requiert donc de l'entreprise qu'elle puisse amortir ce dernier par une rationnalisation de son process et une capacité de traitement futur importante, d'où le marketing agressif mis en oeuvre par certains.
Puisque le credit scoring est particulier à chaque « type de crédit », il permet aux prêteurs de dégager un avantage concurrentiel sur une niche qu'il se sera ainsi construite. Dans cette mesure, tenter de lever le voile sur ce qu'ils considèrent comme des secrets maisons à propos du contenu de « la boîte noire » relève de l'espionage industriel.
Une qualité prédictive et une objectivité limitées
En ce qui concerne la qualité prédictive...
Le credit scoring est donc un outil prédictif d'autant plus efficace que les demandeurs ont des profils proches de ceux qui composent l'échantillon d'origine. Mais ce dernier, bien qu'il soit élaboré sur une base large, n'est pas en soi représentatif de la population belge majeure : n'oublions pas que son but est de permettre un traitement industriel des demandes, pas d'éviter que certaines personnes n'accèdent pas au crédit parce que leur profil est trop éloigné de la norme de l'échantillon.
Il se révéle dès lors peu adéquat pour estimer le risque de défaillance de profils qu'il n'a pas intégrés, qu'il n'a pas « appris à reconnaître » dans sa phase de construction. Des refus peuvent naître d'une « non reconnaissance » plutôt que d'un lien effectif avec une probabilité de défaillance.
Ces refus sont particulièrement dommageables pour les candidats clients (et notamment ceux qui auraient mené à bien le remboursement de leur crédit), puisqu'ils n'y accèdent pas. Mais ils le sont aussi pour les prêteurs, puisqu'ils ratent autant d'occasion de ventes.
En ce qui concerne l'objectivité de la méthode...
Si on comprend assez aisément que la « boîte » que constitue la méthode statistique du credit scoring traite de manière neutre les données qu'on lui fournit, on perçoit moins intuitivement que l'échantillon sur lequel elle a été construite ne l'est pas. Cet échantillon repose sur des décisions prises par les membres du Comité de crédit dans la phase de création, et intégre donc leur subjectivité de manière structurelle !
Les profils refusés, les données considérées comme rédibitoires dans la phase de construction du scoring le seront aussi par la suite... Les données qui ne sont considérées dans l'analyse le seront donc pour longtemps, car la capacité « d'apprentissage » du système est toujours lente, et sur certaines dimensions, tout à fait impossible.
Exemples :
Apprentissage possible :
Si la donnée « type de contrat » associait, dans l'échantillon, le statut « intérim » , mais que très peu de dossier aient été accepté car les membres du Comité étaient en général défavorable, les quelques dossiers comprenant cette information ont été généralement défaillant. Toutefois, cette observation peut progressivement évoluer si dans les faits, les nouveaux clients en itérim remboursent adéquatement leur crédit.
Apprentissage impossible :
Prenons l'hypothèse que les pratiques de crédit social à la consommation mise en oeuvre par des projets « sociaux » confirment que, parmi les nombreuses données collectées dans leur analyse crédit, une des plus pertinente pour distinguer les bons payeurs des mauvais est l'analyse des « dettes hors crédit » et la transparence du client à leur propos.
Si un organisme bancaire souhaite profiter de cet enseignement en intégrant cette information dans son analyse risque, il devra tout bonnement construire un nouveau credit scoring, il ne pourra pas intégrer progressivement cette dernière. Compte tenu des coûts déjà évoqués d'une telle démarche, on comprend dès lors pourquoi l'accès au crédit, quand il repose sur certains a priori, peut générer pour longtemps des refus inadéquats.
Conclusion
Le credit scoring a fortement réformé l'analyse risque crédit des prêteurs. En rendant possible un traitement massif des demandes, il a rendu le crédit accessible à une plus large frange de la population.
Sa nature statistique en fait un outil prédictif fiable, pour autant que les profils des clients ciblés soient similaires à ceux des clients ayant composé l'échantillon d'origine. Mais même établit sur une base large, l'échantillon n'est toutefois pas construit pour garantir la représentativité de la population dans son ensemble.
Cette limite méthodologique impacte donc profondément et pour longtemps l'accessibilité du crédit aux profils « hors normes ». Dans quelle mesure l'industrie prendra-t-elle cette question en main ? Comment envisage-t-elle d'y apporter une solution ?
Il est en effet indispensable que les scores, d'une manière ou d'une autre , apprennent à reconnaître ces publics et à distinguer parmi ceux-ci les différents niveaux de risque... Car sans cela, ils resteront exclus pour de mauvaises raisons, simplement parce qu'ils n'ont pas intégré l'échantillon d'origine. Et cela, n'est-ce pas de la discrimination indirecte?
1Données extraites des rapports annuels de la Centrale des Crédits aus Particuliers, Banque Nationale de Belgique
2Ensembles des modalités liées à la procédure d'octroi d'un crédit par un prêteur.
3Il ne s'agit pas ici de cas réel, même s'ils sont réalistes.
4« Mémo technique Modèles Génériques de score de crédit ou le scoring de crédit « prêt à l'emploi » », www.softcomputing.com