investeerders

Ontwikkeling van een risicoscoremodel

De Covid-19 crisis heeft twee gevolgen: ten eerste een toename van het aantal leningaanvragen in verband met de introductie van staatsgaranties, ten tweede een toename van de onzekerheid over de kans op defaults, oftewel wanbetalingen.

Om risico’s te beperken, moeten banken en kredietverstrekkers over een betrouwbaar en snel risicoscoremodel beschikken. Ook October ontwikkelde risicoscoremodellen. Deze scoremodellen maakt October nu ook beschikbaar voor derde partijen met de lancering van October Connect, onze neolending-technologie voor bedrijfsfinanciering.

Maar, wat is een risicoscoremodel en hoe worden deze gemaakt? Hiervoor spraken we met Tejas Sherkar, Head of Data bij October.

 


Wat is een risicoscoremodel?

Een risicoscoremodel is een set regels voor het kwantificeren van het risico dat gepaard gaat met het verstrekken van krediet aan een kredietnemer. Deze regels en de gegevens die ze voeden, bepalen de aard, complexiteit en prestaties van het model.

Om kredietrisico te kwantificeren kan er gebruikt worden gemaakt van ratingmodellen en scoremodellen.

Ratingmodellen zijn vooral gericht op het voorspellen van de kredietwaardigheid van de kredietnemer. Terwijl scoremodellen kredietwaardigheid kunnen voorspellen en eventuele wanbetaling.

Binnen October richten wij ons op het bouwen van scoringsmodellen. Dat doen we door middel van voorspellende analyses.

Hoe bouw je een risicoscore model?

Om een model te bouwen moet je eerst goed weten welke vraag je wilt beantwoorden. En voor October is die vraag: “Hoe kunnen we financieringsaanvragen op een snelle, schaalbare en veilige manier afhandelen om zoveel mogelijk bedrijven te helpen en tegelijkertijd ons standaardrisico zo laag mogelijk houden?

We beginnen met het verzamelen van gegevens uit ons zogenoemde ‘data lake’. Een data lake is een verzamelplaats van gegevens uit verschillende bronnen. Dat zijn bijvoorbeeld gegevens over ingediende leningsaanvragen en de bijbehorende financiële gegevens. Maar ook het aflossingsgedrag van bedrijven uit ons portefeuille. Of indicatoren van defaults.

Na het verzamelen van alle gegevens volgt het beoordelen en opschonen van deze gegevens. Hierbij bekijken we of we gegevens missen, of dat er uitschieters tussen zitten. Hiermee krijgen we uiteindelijk duidelijk inzicht in ons klantenbestand en bouwen we een representatieve dataset waarop wij ons model kunnen baseren.

Wat is de levenscyclus van een risicoanalysemodel?

Nadat het model is getest en in productie is genomen, monitoren wij zogenoemde datapunten, die het model gebruikt voor het bepalen van de score, van de nieuwe leningaanvraag gedurende een bepaalde periode. Dat is doorgaans 3 tot 6 maanden. Indien de statistische eigenschappen van deze nieuwe gegevenspunten aanzienlijk zijn veranderd gedurende deze periode, zullen wij het model waarschijnlijk opnieuw testen en een verbeterde versie ervan in productie nemen. Dit is niet iets waar we lichtjes over doen. Het is heel belangrijk dat we begrijpen waarom iets veranderd en welke impact dat heeft.

Wij zoeken ook altijd naar nieuwe gegevenspunten die ons model kunnen verbeteren. Bijvoorbeeld door een combinatie van bestaande gegevens of met behulp van externe leveranciers.

Welke modellen gebruiken we bij October?

October heeft twee risicoscoringsmodellen ontwikkelt. Die hebben we Kea en Magpie genoemd.

Magpie en Kea zijn gebouwd op basis van hetzelfde type algoritme voor machine learning. Het verschil tussen Magpie en Kea zit in het soort informatie dat wordt geanalyseerd en het soort onderneming waar het model zich op richt.

Magpie is een instant scoringsmodel dat gebaseerd is op financiële informatie, de balans en resultatenrekening, en gedragsinformatie van MKB-ers. Magpie berekent met deze informatie de kans op een default van een bedrijf. Hier komt een score uit op een schaal van 1 tot 5.

Kea scoort zeer kleine bedrijven in Frankrijk en Italië. Het bedrag van de lening loopt tot 30.000 euro, met of zonder overheidsgarantie. Waar Magpie kijkt naar financiële en gedragsgegevens van leners om de kans op wanbetaling in te schatten analyseert Kea banktransacties en gedragsgegevens om de kans op wanbetaling van een onderneming te berekenen. Banktransacties geven een uniek inzicht in de dagelijkse activiteiten van een onderneming. En dankzij PSD2 kan een onderneming zijn zakelijke bankgegevens via een API in enkele seconden veilig delen met October. Kea kijkt naar alle indicatoren om het vermogen en de bereidheid van de onderneming om een potentiële lening terug te betalen. Deze indicatoren variëren van regelmatige betaling van kosten tot aflossingsschema’s van bestaande leningen, late betalingen en veranderingen in het banksaldo in de loop der tijd.

Welke impact hebben scoringsmodellen op het kredietproces?

Scoringsmodellen zoals Magpie en Kea verkorten de tijd die nodig is om een kredietbeslissing te nemen en helpen schaalvoordelen te realiseren.

Zij maken ons productaanbod nog meer voorspelbaar. We kunnen namelijk onze partners en kredietnemers al vroeg in het proces kunnen laten weten welke stappen ze moeten volgen of welke documenten ze bij de hand moeten hebben.

Maar in ons kredietproces blijft een ‘human touch’ onmisbaar. We blijven ook vertrouwen op de deskundigheid van ons operationele team om de klant te identificeren en bepaalde fraudebestrijdings- en nalevingscontroles uit te voeren voordat we een onderneming financieren.