" Toutes les entreprises qui utilisent des données rencontrent des problèmes dû à un manque de fiabilité. La mauvaise qualité des données, qui engendre de mauvaises décisions, coûte environ 13 milliards de dollars aux acteurs privés ", assure Salma Bakouk. Face à ce constat, cette ingénieur de formation, spécialisée initialement dans l’exploitation de données financières, s’est rapprochée d’un data analytics et d’un expert en data architecture pour fonder la startup Sifflet.
Ensemble, ils ont mis au point un outil permettant de détecter les anomalies pour fiabiliser les données. " Initialement, ces informations émanent de différentes sources, plus ou moins fiables. Puis, pour être exploitées, elles doivent être transformées par des data stack ", détaille la cofondatrice. Des outils dont la fiabilité n’est pas assurée non plus et qui génèrent des résultats pouvant être totalement erronés.
Du machine learning pour scanner la donnée
Pour répondre à cette problématique, Sifflet se positionne sur la chaîne de valeur de la data et monitore sa qualité du début à la fin. " Au niveau de la donnée brute, nous pouvons déjà détecter des anomalies. Dans une liste de codes postaux parisiens, par exemple, on va s’assurer que tous commencent par 75 et qu’ils comportent 5 chiffres, grâce à une technologie de machine learning qui va permettre de scanner la donnée ", précise Salma Bakouk. Sifflet s’intéresse ensuite à la métadonnée. Le logiciel va ainsi analyser le volume de données, le moment où elle est ingérée et son format. Enfin, l’outil est capable de vérifier si l’infrastructure de la data, c'est-à-dire le biais par lequel elle est transportée, est correcte. Grâce à ces analyses, la société va être en capacité de détecter la source d’un problème et d’en informer le producteur de la donnée mais également le consommateur, afin qu’il puisse comprendre comment il risque de se propager.
Avec cet outil, Sifflet fait partie des pionniers sur le marché naissant de la data observability. " Notre vision produit nous a permis d’aller vite. Nous avons sorti le logiciel il y a un an et nous travaillons déjà avec de grands comptes comme Carrefour ou le groupe BPCE ", indique la cofondatrice. Pour profiter de ce " momentum " et accélérer, Sifflet vient de réaliser une levée de fonds de 12 millions d’euros dans le cadre d'un financement en série A, mené par EQT Ventures, avec la participation de ses investisseurs historiques. Sifflet avait en effet levé des fonds lors d'un tour de table initial en novembre 2021, auprès de Bessemer Venture Partners (Alex Ferrara) et Mangrove Capital (Yannick Oswald).
" Les dépenses en big data devraient croître de 12,8 % "
La société veut ainsi renforcer ses équipes marketing et commerciales, continuer à innover mais également conquérir certaines géographies. Sifflet, qui a déjà recruté 30 personnes en un an, projette de doubler ses effectifs d’ici fin 2023. " Nous sommes déjà présents aux Etats-Unis mais l’objectif est d’investir davantage ce marché qui est mature. Les entreprises sont conscientes du problème, il y a de grosses opportunités pour nous ", souligne la dirigeante, qui veut également renforcer sa présence en Europe et notamment en Allemagne, au Royaume-Uni ou en Espagne. " Nous nous adressons à toutes les sociétés ayant une stratégie data, le marché est immense. " Et surtout en plein essor. " Chaque entreprise devient une société de données et investit des ressources considérables, poursuit la dirigeante. Selon International data corporation (IDC), les dépenses mondiales en solutions de big data et d'analyse ont atteint 200 milliards de dollars en 2021 et devraient croître de 12,8 % au cours des cinq prochaines années. "