Home / Servizi / Observability stack
Servizio 04 di 07

Observability stack

Una piattaforma di osservabilità per qualsiasi dispositivo fisico o software aziendale, dal datacenter all'edge — self-hosted, sul Clodino Cloud o in modalità ibrida.

GrafanaPrometheusLokiTempoMimirOpenTelemetryAlertmanager
SORGENTI · ovunque SOURCES · everywhere on-prem · edge · cloud · IoT Applicazioni Applications Java · .NET · Go · Node · Python Database Databases Postgres · MySQL · Mongo · Redis Kubernetes RKE2 · K3s · OpenShift · EKS Host & rete Hosts & network Linux · Windows · switch · firewall IoT & industrial SNMP · Modbus · MQTT · OPC-UA Cloud SaaS AWS · Azure · GCP · Stripe · CDN AGENT · ad ogni location AGENT · at every location Grafana Alloy HQ · datacenter Modena metrics · logs · traces · profiles Alloy edge · 120 store retail · offline-buffering Alloy plant · 24 stabilimenti industrial · Modbus/OPC-UA OTel collector · cluster k8s OTLP gateway · auto-instrument SNMP exporter · rete switch · firewall · UPS + N exporter custom CLODINO CLOUD · SaaS managed Grafana LGTM stack Mimir metrics · 13mo Loki logs · 24mo Tempo traces · 30g Pyroscope profiling continuo continuous profiling Alertmanager PagerDuty · Slack · MS Grafana — single pane of glass dashboard · explore · IRM · OnCall ON-PREM · self-hosted Stesso LGTM stack nel tuo DC Same LGTM stack in your DC helm chart · Ceph object store · air-gap ok IBRIDO · split per dato HYBRID · data split Log sensibili on-prem · metriche su cloud Sensitive logs on-prem · metrics on cloud stessa Grafana federa entrambi same Grafana federates both remote_write · OTLP · push PIPELINE OBSERVABILITY · sorgente → agente → backend OBSERVABILITY PIPELINE · source → agent → backend
Lo stack Grafana Labs

Una piattaforma, sei progetti opensource, infinite sorgenti.

Mettiamo in piedi lo stack completo Grafana Labs — metriche, log, trace, profiling, alerting — e lo configuriamo nel modo che ti serve: on-prem, sul nostro Clodino Cloud, oppure in modalità ibrida con dati sensibili in casa e backend leggero in cloud.

Grafana

Grafana DASHBOARDS · UI

Il single pane of glass dell'intero stack. Dashboard, Explore, IRM, OnCall, alerting unificato — la stessa UI sopra qualunque backend (Prometheus, Mimir, Loki, Tempo, ma anche InfluxDB, Elastic, CloudWatch). Versione enterprise con LDAP/SSO inclusa nella nostra offerta managed.

Dashboard as codeSSO/LDAPIRM / OnCallMulti-tenant
Approfondisci
Prometheus

Prometheus METRICS · SCRAPER

Lo standard de facto per le metriche cloud-native. Pull-based, PromQL, service discovery automatica su Kubernetes, Consul, EC2. Lo deployiamo ovunque ci siano applicazioni: ogni cluster K8s, ogni edge, ogni VM. È la base da cui Mimir riceve in remote_write.

PromQLService discovery100+ exporterCNCF graduated
Approfondisci
Mimir

Mimir TSDB · LONG-TERM

Il backend metriche scalabile orizzontalmente. Riceve in remote_write da migliaia di Prometheus, archivia su S3/Ceph, mantiene 13+ mesi di storia con query veloci. Multi-tenant by design — perfetto per cluster condivisi e SaaS.

Multi-tenantremote_writeS3 / CephPetabyte scale
Approfondisci
Loki

Loki LOGS

Aggregazione log "à la Prometheus": indice solo sulle label, payload compresso su object storage. Costo storage 10× inferiore a ELK su volumi grandi. LogQL ti dà metriche derivate dai log al volo. Hot/warm/cold tiering per retention legali (GDPR, NIS2).

LogQLS3 / Ceph backendTiered retentionLive tail
Approfondisci
Tempo

Tempo DISTRIBUTED TRACING

Backend per trace OpenTelemetry/Jaeger/Zipkin con 100% sampling e costi sotto controllo. TraceQL per cercare per attributi, durata, status. Correlazione automatica con log Loki e metriche Mimir — clicchi su uno span, vedi i log di quella richiesta.

OTLP nativoTraceQLExemplar linking100% sampling
Approfondisci
OpenTelemetry

OpenTelemetry INSTRUMENTATION

Lo standard CNCF per instrumentare applicazioni vendor-neutral: SDK per Java/Go/.NET/Node/Python/Rust, auto-instrumentation per i framework più diffusi, OTel Collector come gateway unico per metriche+log+trace. Niente vendor lock-in: oggi Grafana, domani anche altro.

Auto-instrumentOTLPMulti-linguaVendor-neutral
Approfondisci
Tre modalità di deployment

Stesso stack, dove ti serve davvero.

01 · ON-PREM

Lo stack LGTM gira nel tuo datacenter. Storage su Ceph o NFS, air-gap ok, conformità totale ai requisiti di sovranità del dato. Operazioni gestite dal tuo team o da noi.

02 · CLODINO CLOUD

Stack managed SaaS in region italiana. Zero overhead operativo: tu spedisci dati in remote_write/OTLP, noi gestiamo retention, upgrade, scaling. Pricing per ingestion + retention.

03 · IBRIDO

Log con dati sensibili restano on-prem, metriche e trace su Clodino Cloud, una sola Grafana federa tutto. Il pattern preferito da PA, sanità, finanza.

Cosa monitoriamo

Qualsiasi cosa abbia un'API, una porta SNMP, un log file.

Fisico o software, in azienda o all'edge: se emette segnale, lo raccogliamo. Centinaia di exporter già pronti, o ne scriviamo uno custom.

SOFTWARE
  • Applicazioni Java/.NET/Go/Node/Python
  • Database Postgres/MySQL/Mongo/Redis
  • Message broker Kafka/RabbitMQ/NATS
  • Container Docker / Kubernetes
  • Cloud AWS/Azure/GCP — exporter nativi
HARDWARE
  • Server fisici (IPMI, Redfish, iLO, iDRAC)
  • Storage (Ceph, Pure, NetApp, EMC)
  • Switch / router / firewall via SNMP
  • UPS, PDU, sensori climatici
  • Hypervisor VMware / Proxmox / KVM
EDGE & IoT
  • Punti vendita retail (POS, kiosk)
  • PLC e SCADA via Modbus / OPC-UA
  • Sensori IoT via MQTT
  • Gateway 4G/5G, link satellitari
  • Veicoli e flotte (telemetria CAN)
BUSINESS
  • Synthetic check su utenti reali
  • Real User Monitoring (browser, mobile)
  • Funnel conversioni, SLA cliente
  • Costi cloud (FinOps dashboards)
  • SLO budget e error rate per servizio

Quando ha senso

Probabilmente ti serve se…

  • Hai metriche e log sparsi su tre o quattro tool.
  • Vuoi capire cosa sta succedendo prima che lo capiscano i tuoi utenti.
  • Stai pagando una soluzione SaaS proprietaria che ti sta strangolando.
  • Devi tenere log per legge ma non sai per quanto, dove, come.

Cosa facciamo

Concretamente, questo è quello che consegniamo.

  • Design di metriche custom, RED + USE per ogni servizio.
  • Integrazione con app standard e custom (instrumentazione OTEL).
  • Dashboarding Grafana, alerting con SLO budget.
  • Retention policy log: tier hot/warm/cold via Loki + S3.
  • Modalità SaaS gestita su Clodino Cloud.

In pratica

Com’è alla tastiera.

logql · ad-hoc~/clodino
 ProductionAPI · 5xx rate · last 15m
# LogQL
sum by (route) (rate({app="checkout"}
  |~ "status=5.." [5m]))

 Result
  /v1/checkout      4.2/s  ▲ 320%
  /v1/payment/sca   0.8/s  ▲  18%
  /v1/cart          0.2/s  ▼   3%

 SLO budget burn: 14× · paged @on-call

Output tipico

Quello che ti porti a casa.

  • Una sola dashboard per tutto. Niente tab opening al buio.
  • Allarmi che svegliano qualcuno solo quando serve davvero.
  • Costi storage prevedibili e linearmente scalabili.
“Non ti consegniamo una scatola nera. O prendi tu le operations, o le teniamo noi — ma sai sempre come è fatta.”
PROSSIMO SERVIZIO — 04 / 06

DevOps & CI/CD

Parla di Observability stack Continua →