Kairosium conçoit, déploie et transfère des infrastructures d'agents IA autonomes pour les entreprises qui exigent performance mesurable, souveraineté des données et gouvernance documentée — dès le premier jour.
Chaque cible est collectée via l'instrumentation GCP. Aucune assertion sans méthode de collecte documentée.
expected_score vs score produit sur golden_set.csv — accuracy = % concordance labels. Résultats importés dans BigQuery table test_runs via scripts/import_test_results.py.europe-west1. Vertex AI en europe-west4. VPC Service Controls perimeter — aucun appel LLM ne sort du VPC client.compliance_checks(requirement_id, status BOOL, evidence_url).
resolver_type (enum : internal / vendor / mixed) ; BigQuery table incident_resolution(month, resolver_type, count) ; alerte Cloud Monitoring si ratio < seuil sur 14 jours glissants.Verdict documenté, pas un pitch. Chaque ligne est un fait technique ou commercial vérifiable.
model_id paramètre Firestore, pas une constante dans le codeForfaits affichés. TJM de référence explicite. Conditions d'entrée formulées comme faits techniques, pas clauses de style.
compliance_checks(requirement_id, status BOOL, evidence_url)compliance_checks + Looker Studioroi_tracking, scheduled query M+3/M+6agent_events(trace_id, agent_name, tool_name, timestamp, latency_ms, success_flag, token_count)test_runs via scripts/import_test_results.py (pipeline Cloud Build prévu)expected_score vs score produit sur golden_set.csv — accuracy = % concordance labels. Résultats importés dans BigQuery table test_runs via scripts/import_test_results.py.Note : success_flag BOOL dans agent_events mesure la fiabilité des tool calls ADK (succès/échec d'un appel individuel) — métrique distincte de l'accuracy métier, non utilisée pour ce KPI.APPROX_QUANTILES(latency_ms, 100)[OFFSET(95)]Scheduled query horaire · alerte Cloud Monitoringtest_runs via scripts/import_test_results.py (pipeline Cloud Build prévu)Fenêtre glissante 7 joursexternal_costs + tco_snapshotScheduled query trimestrielleresolver_typeBigQuery incident_resolutioncomponent_catalog(vendor_lock, alternative_documented) · Revue trimestrielleApplicable pour tout système classé haut risque au sens de l'Annexe III de l'AI Act (deadline août 2026). Cas d'usage concernés : recrutement et sélection algorithmique, détection d'anomalies financières, maintenance d'infrastructures critiques.
Chaque jalon est déclenché par un fait technique vérifiable, pas par une décision unilatérale.
Les verdicts d'exclusion sont définitifs et documentés par ADR. Aucun ajout sans critère de succès chiffré.
model_id : paramètre de configuration Firestore — pas une constante dans le code. Commutation sans réécriture de l'agent.uv.model_id).europe-west1.success_flag. Activé à l'initialisation de chaque agent — aucune exception.europe-west1. Vertex AI en europe-west4.test_runs via scripts/import_test_results.py (pipeline Cloud Build prévu)
Une PME SaaS de 80 employés mobilisait 2 ETP par semaine pour la revue manuelle des flux de paiement.
Sur 6 mois, 3 fraudes avérées avaient échappé à la détection. Le pipeline déployé coordonne 3 agents ADK
(Orchestrateur, Ingestion Agent, Scoring Agent) et 250 transactions traitées sur golden set versionné (data/golden_set.csv),
avec un rapport d'audit écrit dans BigQuery à chaque exécution.
| Métrique | Cible contractuelle (T2) | Valeur mesurée | Statut |
|---|---|---|---|
| Accuracy globale | ≥ 85 % | 92 % | ✓ validé |
| Precision ALERTE | — | 100 % — 0 fausse alarme | ✓ validé |
| Recall ALERTE | — | 100 % — 23/23 alertes détectées | ✓ validé |
| Latence p95 end-to-end | ≤ 3 000 ms par tool | 455 ms production / 637 ms dev (BigQuery agent_events) |
✓ validé |
| CI pass rate | ≥ 95 % | 100 % — 16/16 pytest PASSED en 1.96s | ✓ validé |
| Transactions SUSPECT non détectées | — | 8/30 reclassées NORMAL | gap documenté |
92 % d'accuracy sur le golden set — 8 transactions SUSPECT sur 30 non détectées, documentées dans les ADRs du repo. La classe ALERTE (fraudes avérées) atteint 100 % de précision et de rappel : zéro fausse alarme, zéro fraude manquée.
| Composant | Statut dans ce pilote | Justification |
|---|---|---|
| Cloud Run | Exclu (ADR-007) | Vertex AI Agent Engine utilisé à la place pour ce pilote — Cloud Run pertinent pour exposer des APIs agents en T2/T3 client |
| Firestore (model_id config) | Exclu (ADR-006) | model_id hardcodé Gemini 2.5 Flash — paramètre Firestore applicable en production client multi-modèle |
| MCP (Model Context Protocol) | Exclu (ADR-008) | Aucune source de données externe à connecter dans ce périmètre fictif |
| Cloud Build CI | Différé (ADR-005) | Tests exécutés via make test en local — pipeline Cloud Build prévu en T2/T3 client |
| CMEK / VPC Service Controls | Non déployés | Pilote fictif sans données client réelles — obligatoires en déploiement production |
| Looker Studio | Non implémenté | Dashboard analytique prévu en T2/T3 — hors périmètre de ce pilote |
%%{init:{"theme":"base","themeVariables":{"background":"#111318","primaryColor":"#1a1e2a","primaryBorderColor":"#3b82f6","primaryTextColor":"#e8eaf0","secondaryColor":"#151820","lineColor":"#3b82f6","textColor":"#9aa3b2","clusterBkg":"#0c0f14","clusterBorder":"rgba(59,130,246,0.3)","edgeLabelBackground":"#0f1115","fontFamily":"JetBrains Mono,monospace","fontSize":"11px"}}}%%
flowchart LR
CS[("Cloud Storage\nCSV transactions")]
FS[("Firestore / JSON\nmodel_id · config")]
subgraph VERTEX ["Vertex AI Agent Engine · europe-west1"]
ORCH(["orchestrator\nGemini 2.5 Flash"])
IA(["ingestion_agent\ningest_transactions\n→ temp:transactions"])
SA(["scoring_agent\nscore_all_transactions\n5 règles déterministes\n→ temp:scored_transactions"])
GAR["generate_audit_report"]
TA["trigger_alert\n× N transactions ALERTE"]
end
BQ1[("BigQuery\naudit_reports")]
BQ2[("BigQuery\nagent_events")]
CM["Cloud Monitoring\nagent/anomaly_alert"]
SL["Slack\n#anomaly-alerts"]
CS -->|gcs_path| ORCH
FS -->|model_id / supplier_registry| ORCH
ORCH -- "① transfer_to_agent" --> IA
IA -- "② transfer_to_agent" --> SA
SA -- "③ transfer_to_agent" --> ORCH
ORCH --> GAR
GAR --> BQ1
GAR -->|alert_transactions| TA
TA --> CM
TA --> SL
ORCH -->|Agent Analytics Plugin| BQ2
before_model_callback
agent_events (~86 événements par run complet, mesuré sur runs golden set 250 tx)
agent/anomaly_alert + 3 politiques d'alerte
#anomaly-alerts (tool trigger_alert natif)
audit_reports (rapport d'audit écrit à chaque run)
La détection d'anomalies dans des flux financiers est classée système à haut risque au sens de l'Annexe III de l'AI Act. Le surcoût de 15–20 % appliqué sur le forfait de base couvre :
Chaque condition d'entrée protège l'intégrité des KPIs. Sans baseline contradictoire, aucune mesure de progression n'est défendable.
Golden set ≥ 200 cas représentatifs validé contradictoirement avant déploiement. Baseline Accuracy cosignée à M+0.
TCO initial cosigné avant démarrage : coûts GCP (Billing export) + licences vendor + headcount dédié ETP × coût journalier + maintenance curative.
La rétention de 10 % est libérée quand l'équipe interne atteint ≥ 80 % de résolution autonome L1/L2, mesurée sur fenêtre glissante 30 jours via BigQuery incident_resolution.
APIs, bases de données, SCADA selon verticale — accès garanti par le client dans les 5 jours suivant la signature.