Revue de TigerGraph, Plateforme Avancée d'Analyse de Graphes

Par Léon Levinas-Ménard

Dernière mise à jour : avril 2025

TigerGraph est une société de logiciels privée fondée en 2012 par le Dr Yu Xu à Redwood City, en Californie, qui propose une plateforme d’analyse de graphes en temps réel construite sur une architecture de graphe parallèle native. Conçue pour traiter des ensembles de données massifs et connectés, TigerGraph permet aux organisations d’effectuer des requêtes complexes à plusieurs sauts et des analyses avancées - avec des applications couvrant la détection de la fraude, la lutte contre le blanchiment d’argent, l’analyse client 360, la visibilité de la supply chain et la cybersécurité¹². Sa plateforme est conçue en C++ et utilise un langage de requête propriétaire complet appelé GSQL pour permettre à la fois des requêtes ad hoc et une science des données de graphe intégrée dans la base de données. En combinant une compression de données efficace avec un modèle de traitement massivement parallèle sur les sommets et les arêtes, TigerGraph prend en charge l’ingestion de données à grande vitesse (jusqu’à 100 Go/heure/noeud dans des configurations idéales) et des options de déploiement évolutives dans des environnements auto-gérés et son offre cloud-native “Savanna” sur AWS, GCP et Azure³⁴⁵. De plus, l’intégration d’une bibliothèque de science des données de graphe et d’un assistant en IA - TigerGraph CoPilot - relie des techniques avancées d’apprentissage automatique à des requêtes de graphe intuitives, transformant des relations complexes directement en insights exploitables pour les cadres techniques et de la supply chain.

Histoire et Financement

TigerGraph a été créé en 2012 (initialement lancé sous le nom de GraphSQL) et rebaptisé en 2017. La société a attiré d’importants capitaux-risque au fil des ans - sortant de l’ombre avec 33 millions de dollars de financement initial et clôturant plus tard une notable série C de 105 millions de dollars en février 2021, portant son financement cumulé à plus de 170 millions de dollars¹². Plutôt que de poursuivre une stratégie d’acquisition, TigerGraph s’est concentré sur l’innovation continue de ses produits et l’expansion de sa portée sur le marché.

Technologie de Base et Architecture

La fondation technique de TigerGraph repose sur son architecture de graphe parallèle native (NPG) :

Moteur et Implémentation Natifs : Le moteur de base est construit à partir de zéro en C++ en utilisant des techniques avancées de programmation système. Il comprend un moteur de stockage de graphe (GSE) et un moteur de traitement de graphe (GPE) conçus pour co-localiser la computation avec les données, exploitant ainsi la localité des données pour un traitement efficace³⁶.
Langage de Requête - GSQL : TigerGraph utilise son langage propriétaire similaire à SQL, GSQL, qui est complet en Turing et prend en charge des constructions procédurales telles que des boucles et des conditionnelles. Cela facilite non seulement les requêtes ad hoc, mais permet également la création de bibliothèques de science des données de graphe dans la base de données¹.
Compression de Données et Parallélisme : La plateforme propose une compression de données propriétaire qui réduit souvent de manière drastique les besoins de stockage, tandis que son modèle de traitement massivement parallèle traite chaque sommet et arête comme une unité de calcul, optimisant ainsi l’exécution des algorithmes de graphe sur de grands ensembles de données⁴.

Offre Produit et Cas d’Utilisation

TigerGraph est commercialisé pour l’analyse en temps réel dans une gamme diversifiée de domaines d’application :

Applications Clés : La plateforme est utilisée dans des domaines tels que la détection de la fraude, le blanchiment d’argent, l’analyse client 360, la visibilité de la supply chain, la cybersécurité et l’analyse de réseau. Sa force dans l’exécution de requêtes multi-sauts - souvent traversant 10 ou plus de sauts - permet aux organisations de découvrir des relations non évidentes dans leurs données¹².
Intégration de l’IA et de l’Apprentissage Automatique : TigerGraph s’intègre à l’IA grâce à sa bibliothèque de science des données de graphe dans la base de données, qui propose plus de 50 algorithmes de graphe incluant le clustering, la centralité, la similarité et le flux. De plus, sa fonctionnalité TigerGraph CoPilot agit comme un assistant IA qui traduit les requêtes en langage naturel en requêtes de graphe, démocratisant ainsi l’accès à l’analyse avancée de graphe pour les utilisateurs non experts⁷⁸.

Déploiement et Scalabilité

TigerGraph prend en charge plusieurs modèles de déploiement pour répondre à des besoins commerciaux variés :

Options Auto-gérées et Cloud-Natives : La plateforme peut être déployée sur des serveurs Linux, dans des conteneurs Docker, ou via Kubernetes pour des environnements auto-gérés. Pour le déploiement cloud, son offre Savanna propose une solution de base de données de graphe entièrement distribuée et cloud-native disponible sur les principaux fournisseurs de cloud tels que AWS, GCP et Azure⁵.
Fonctionnalités Opérationnelles : TigerGraph met l’accent sur des fonctionnalités telles que le partitionnement automatique, l’expansion/compression élastique de clusters, et le chargement de données optimisé, revendiquant des vitesses d’ingestion de données allant jusqu’à 100 Go par heure par nœud. Ces capacités en font une solution évolutive pour les entreprises traitant des données de graphe à grande échelle, bien que de telles performances soient mieux vérifiées de manière indépendante⁴⁵.

Intégration avec l’IA et la Science des Données de Graphe

TigerGraph relie l’analyse de graphe à l’intelligence artificielle :

Bibliothèque de Science des Données de Graphe : Cette suite dans la base de données contient une large gamme d’algorithmes qui convertissent des relations de graphe complexes en caractéristiques d’apprentissage automatique, prenant en charge des tâches telles que le clustering, l’analyse de centralité et la détection de similarité⁷.
TigerGraph CoPilot : Conçu comme un assistant IA, CoPilot exploite l’IA générative et le traitement du langage naturel pour permettre aux utilisateurs de tirer des insights des données de graphe sans nécessiter une expertise technique approfondie, facilitant ainsi l’intégration de l’analyse de graphe dans les pipelines de science des données conventionnels⁸.

Scepticisme Technique et Considérations Critiques

Bien que TigerGraph fasse des affirmations techniques étendues, une évaluation critique est nécessaire :

Métriques de Référence : Des affirmations telles que des réponses aux requêtes en moins d’une seconde sur des dizaines de millions d’enregistrements et des taux d’ingestion élevés doivent être évaluées dans leur contexte, car ces métriques dépendent souvent de configurations matérielles spécifiques et des conditions de charge de travail⁹.
Innovations Propriétaires : Les méthodes de compression de données et de traitement parallèle propriétaires, bien que prometteuses, peuvent produire des avantages variables dans des environnements réels. Des tests indépendants sont essentiels pour valider ces améliorations de performances.
Complexité et Courbe d’Apprentissage : L’ensemble de fonctionnalités avancées de GSQL, bien que puissant, peut présenter une courbe d’apprentissage abrupte pour les nouveaux utilisateurs, et l’adoption réussie dépendra de la capacité de l’organisation à intégrer les outils sophistiqués de TigerGraph dans les flux de travail existants.

TigerGraph vs Lokad

Bien que TigerGraph et Lokad exploitent tous deux le calcul et l’analyse avancés, leurs centres d’intérêt sont notablement différents. TigerGraph est une plateforme d’analyse de graphes native construite autour d’un moteur de traitement parallèle piloté par C++, optimisé pour explorer des données connectées à travers des requêtes multi-sauts et des algorithmes de graphes. En revanche, Lokad est dédié à l’optimisation prédictive de la supply chain à travers un modèle SaaS, utilisant son langage de script Envision propriétaire (construit avec F#, C# et TypeScript) pour générer des prévisions probabilistes et des décisions exploitables pour la gestion des stocks, la tarification et la planification de la production. Alors que TigerGraph met l’accent sur la science des données de graphes en temps réel et les insights basés sur l’IA (avec des fonctionnalités telles que GSQL et CoPilot), Lokad se concentre sur l’automatisation et le réglage fin des opérations de la supply chain. Les modèles de déploiement distinguent davantage les deux : TigerGraph propose à la fois des options auto-gérées et cloud-native, tandis que Lokad est strictement un service cloud multi-locataire. En essence, les organisations cherchant à exploiter une connectivité de données profonde et des analyses de relations complexes pour diverses applications, y compris la visibilité de la supply chain, peuvent se tourner vers TigerGraph, tandis que celles visant l’automatisation des décisions de bout en bout de la supply chain trouveront que l’approche ciblée de Lokad est plus alignée sur leurs besoins.

Conclusion

TigerGraph offre une plateforme d’analyse de graphes robuste et de pointe qui fusionne un traitement parallèle natif avec des capacités d’IA intégrées pour relever les défis de connectivité de données complexes. Son architecture évolutive, ses options de déploiement flexibles et son langage de requête avancé permettent aux organisations d’extraire des insights exploitables à partir de vastes ensembles de données interconnectées. Cependant, comme avec tout système haute performance, les utilisateurs potentiels devraient évaluer de manière critique les affirmations de performances, prendre en compte la courbe d’apprentissage associée aux outils propriétaires et vérifier que ses capacités sont alignées avec leur infrastructure technique existante. En comparaison avec des plateformes axées sur la supply chain comme Lokad, TigerGraph offre une approche distincte ancrée dans la science des données de graphes plutôt que dans l’optimisation de bout en bout de la supply chain.