Clodino — Observability stack

Lo stack Grafana Labs

Una piattaforma, sei progetti opensource, infinite sorgenti.

Mettiamo in piedi lo stack completo Grafana Labs — metriche, log, trace, profiling, alerting — e lo configuriamo nel modo che ti serve: on-prem, sul nostro Clodino Cloud, oppure in modalità ibrida con dati sensibili in casa e backend leggero in cloud.

Grafana DASHBOARDS · UI

Il single pane of glass dell'intero stack. Dashboard, Explore, IRM, OnCall, alerting unificato — la stessa UI sopra qualunque backend (Prometheus, Mimir, Loki, Tempo, ma anche InfluxDB, Elastic, CloudWatch). Versione enterprise con LDAP/SSO inclusa nella nostra offerta managed.

Dashboard as codeSSO/LDAPIRM / OnCallMulti-tenant

Approfondisci

Prometheus METRICS · SCRAPER

Lo standard de facto per le metriche cloud-native. Pull-based, PromQL, service discovery automatica su Kubernetes, Consul, EC2. Lo deployiamo ovunque ci siano applicazioni: ogni cluster K8s, ogni edge, ogni VM. È la base da cui Mimir riceve in remote_write.

PromQLService discovery100+ exporterCNCF graduated

Approfondisci

Mimir TSDB · LONG-TERM

Il backend metriche scalabile orizzontalmente. Riceve in remote_write da migliaia di Prometheus, archivia su S3/Ceph, mantiene 13+ mesi di storia con query veloci. Multi-tenant by design — perfetto per cluster condivisi e SaaS.

Multi-tenantremote_writeS3 / CephPetabyte scale

Approfondisci

Loki LOGS

Aggregazione log "à la Prometheus": indice solo sulle label, payload compresso su object storage. Costo storage 10× inferiore a ELK su volumi grandi. LogQL ti dà metriche derivate dai log al volo. Hot/warm/cold tiering per retention legali (GDPR, NIS2).

LogQLS3 / Ceph backendTiered retentionLive tail

Approfondisci

Tempo DISTRIBUTED TRACING

Backend per trace OpenTelemetry/Jaeger/Zipkin con 100% sampling e costi sotto controllo. TraceQL per cercare per attributi, durata, status. Correlazione automatica con log Loki e metriche Mimir — clicchi su uno span, vedi i log di quella richiesta.

OTLP nativoTraceQLExemplar linking100% sampling

Approfondisci

OpenTelemetry INSTRUMENTATION

Lo standard CNCF per instrumentare applicazioni vendor-neutral: SDK per Java/Go/.NET/Node/Python/Rust, auto-instrumentation per i framework più diffusi, OTel Collector come gateway unico per metriche+log+trace. Niente vendor lock-in: oggi Grafana, domani anche altro.

Auto-instrumentOTLPMulti-linguaVendor-neutral

Approfondisci

Tre modalità di deployment

Stesso stack, dove ti serve davvero.

01 · ON-PREM

Lo stack LGTM gira nel tuo datacenter. Storage su Ceph o NFS, air-gap ok, conformità totale ai requisiti di sovranità del dato. Operazioni gestite dal tuo team o da noi.

02 · CLODINO CLOUD

Stack managed SaaS in region italiana. Zero overhead operativo: tu spedisci dati in remote_write/OTLP, noi gestiamo retention, upgrade, scaling. Pricing per ingestion + retention.

03 · IBRIDO

Log con dati sensibili restano on-prem, metriche e trace su Clodino Cloud, una sola Grafana federa tutto. Il pattern preferito da PA, sanità, finanza.

Cosa monitoriamo

Qualsiasi cosa abbia un'API, una porta SNMP, un log file.

Fisico o software, in azienda o all'edge: se emette segnale, lo raccogliamo. Centinaia di exporter già pronti, o ne scriviamo uno custom.

SOFTWARE

Applicazioni Java/.NET/Go/Node/Python
Database Postgres/MySQL/Mongo/Redis
Message broker Kafka/RabbitMQ/NATS
Container Docker / Kubernetes
Cloud AWS/Azure/GCP — exporter nativi

HARDWARE

Server fisici (IPMI, Redfish, iLO, iDRAC)
Storage (Ceph, Pure, NetApp, EMC)
Switch / router / firewall via SNMP
UPS, PDU, sensori climatici
Hypervisor VMware / Proxmox / KVM

EDGE & IoT

Punti vendita retail (POS, kiosk)
PLC e SCADA via Modbus / OPC-UA
Sensori IoT via MQTT
Gateway 4G/5G, link satellitari
Veicoli e flotte (telemetria CAN)

BUSINESS

Synthetic check su utenti reali
Real User Monitoring (browser, mobile)
Funnel conversioni, SLA cliente
Costi cloud (FinOps dashboards)
SLO budget e error rate per servizio

Quando ha senso

Probabilmente ti serve se…

Hai metriche e log sparsi su tre o quattro tool.
Vuoi capire cosa sta succedendo prima che lo capiscano i tuoi utenti.
Stai pagando una soluzione SaaS proprietaria che ti sta strangolando.
Devi tenere log per legge ma non sai per quanto, dove, come.

Cosa facciamo

Concretamente, questo è quello che consegniamo.

Design di metriche custom, RED + USE per ogni servizio.
Integrazione con app standard e custom (instrumentazione OTEL).
Dashboarding Grafana, alerting con SLO budget.
Retention policy log: tier hot/warm/cold via Loki + S3.
Modalità SaaS gestita su Clodino Cloud.

In pratica

Com’è alla tastiera.

logql · ad-hoc~/clodino

› ProductionAPI · 5xx rate · last 15m
# LogQL
sum by (route) (rate({app="checkout"}
  |~ "status=5.." [5m]))

› Result
  /v1/checkout      4.2/s  ▲ 320%
  /v1/payment/sca   0.8/s  ▲  18%
  /v1/cart          0.2/s  ▼   3%

› SLO budget burn: 14× · paged @on-call

Output tipico

Quello che ti porti a casa.

Una sola dashboard per tutto. Niente tab opening al buio.
Allarmi che svegliano qualcuno solo quando serve davvero.
Costi storage prevedibili e linearmente scalabili.

“Non ti consegniamo una scatola nera. O prendi tu le operations, o le teniamo noi — ma sai sempre come è fatta.”

PROSSIMO SERVIZIO — 04 / 06

DevOps & CI/CD

Parla di Observability stack Continua →