Facebook Pixel
Searching...
Español
EnglishEnglish
EspañolSpanish
简体中文Chinese
FrançaisFrench
DeutschGerman
日本語Japanese
PortuguêsPortuguese
ItalianoItalian
한국어Korean
РусскийRussian
NederlandsDutch
العربيةArabic
PolskiPolish
हिन्दीHindi
Tiếng ViệtVietnamese
SvenskaSwedish
ΕλληνικάGreek
TürkçeTurkish
ไทยThai
ČeštinaCzech
RomânăRomanian
MagyarHungarian
УкраїнськаUkrainian
Bahasa IndonesiaIndonesian
DanskDanish
SuomiFinnish
БългарскиBulgarian
עבריתHebrew
NorskNorwegian
HrvatskiCroatian
CatalàCatalan
SlovenčinaSlovak
LietuviųLithuanian
SlovenščinaSlovenian
СрпскиSerbian
EestiEstonian
LatviešuLatvian
فارسیPersian
മലയാളംMalayalam
தமிழ்Tamil
اردوUrdu
Observability Engineering

Observability Engineering

Achieving Production Excellence
por Charity Majors 2022 318 páginas
3.78
100+ calificaciones
Escuchar

Puntos clave

1. La observabilidad revoluciona la comprensión de los sistemas de software

La observabilidad es una medida de cuán bien puedes entender y explicar cualquier estado en el que tu sistema pueda encontrarse, sin importar cuán novedoso o extraño sea.

Cambio de paradigma. La observabilidad adapta conceptos de la teoría de control a los sistemas de software modernos, permitiendo a los ingenieros comprender los estados internos a través de salidas externas. A diferencia del monitoreo tradicional, que se basa en métricas y umbrales predefinidos, la observabilidad permite consultas ad-hoc y exploración del comportamiento del sistema.

Abordando la complejidad. A medida que los sistemas se vuelven más distribuidos y dinámicos, las limitaciones del monitoreo tradicional se hacen evidentes. La observabilidad brilla en entornos donde:

  • Las arquitecturas de microservicios crean dependencias complejas
  • Los despliegues nativos de la nube introducen recursos efímeros
  • Las prácticas de entrega continua conducen a cambios frecuentes

Impacto cultural. Adoptar prácticas de observabilidad transforma la forma en que los equipos abordan los sistemas de producción:

  • Fomenta la exploración proactiva en lugar de la lucha reactiva contra incendios
  • Democratiza la comprensión del sistema entre los miembros del equipo
  • Rompe los silos entre desarrollo y operaciones

2. Los eventos, no las métricas, son los bloques de construcción de la observabilidad

Si aceptas nuestra definición de observabilidad—que se trata de lo desconocido-desconocido, que significa poder hacer cualquier pregunta, entender cualquier estado interno del sistema, sin anticiparlo o predecirlo de antemano—hay una serie de requisitos técnicos que debes cumplir para satisfacer esta definición.

Contexto rico. Los eventos capturan el contexto completo de una interacción del sistema, incluyendo:

  • Parámetros de solicitud
  • Estado del sistema
  • Métricas de rendimiento
  • Identificadores de usuario
  • Puntos de datos específicos del negocio

Flexibilidad. A diferencia de las métricas pre-agregadas, los eventos permiten:

  • Cortes y análisis arbitrarios de datos
  • Consultas de alta cardinalidad y alta dimensionalidad
  • Descubrimiento de patrones y correlaciones previamente desconocidos

Implementación. Los eventos estructurados deben ser:

  • Emitidos para cada interacción significativa del sistema
  • Diseñados para ser amplios, con muchos campos
  • Capaces de capturar tanto el contexto técnico como el empresarial

3. Los trazos proporcionan contexto crucial al unir eventos

En un sistema observable, los trazos son simplemente una serie interrelacionada de eventos.

Visibilidad de extremo a extremo. Los trazos conectan eventos a través de sistemas distribuidos, revelando:

  • Dependencias de servicio
  • Cuellos de botella en el rendimiento
  • Propagación de errores

Componentes clave:

  • ID de trazo: Identificador único para todo el flujo de solicitud
  • ID de span: Identificador para cada paso en el trazo
  • ID padre: Establece la relación jerárquica entre los spans
  • Marca de tiempo y duración: Capturan información temporal

Más allá de los casos de uso tradicionales. Los conceptos de trazado pueden aplicarse a:

  • Sistemas no distribuidos para análisis de rendimiento
  • Trabajos por lotes para entender los pasos de procesamiento
  • Funciones Lambda para trazar flujos de trabajo sin servidor

4. La observabilidad permite la depuración desde los primeros principios

Un primer principio es una suposición básica sobre un sistema que no fue deducida de otra suposición.

Enfoque científico. Las herramientas de observabilidad apoyan un proceso de depuración metódico:

  1. Comienza con una visión general del sistema
  2. Verifica el comportamiento observado contra las expectativas
  3. Explora sistemáticamente dimensiones para identificar patrones
  4. Filtra y profundiza para aislar problemas
  5. Repite hasta descubrir la causa raíz

Automatización. Las herramientas avanzadas de observabilidad pueden:

  • Comparar comportamientos anómalos contra líneas base
  • Resaltar diferencias significativas en los atributos de los eventos
  • Sugerir áreas potenciales de investigación

Cambio cultural. Depurar desde los primeros principios:

  • Reduce la dependencia del conocimiento tribal
  • Empodera a los miembros del equipo menos experimentados
  • Fomenta la curiosidad y la exploración

5. Los SLOs y los presupuestos de error crean alertas accionables

Las alertas de quema de presupuesto de error están diseñadas para proporcionar una advertencia temprana sobre futuras violaciones de SLO que ocurrirían si la tasa de quema actual continúa.

Definiendo la fiabilidad. Los Objetivos de Nivel de Servicio (SLOs) proporcionan:

  • Objetivos claros para la fiabilidad del sistema
  • Un lenguaje compartido entre los interesados en ingeniería y negocios
  • Un marco para tomar decisiones sobre la fiabilidad y el desarrollo de características

Presupuestos de error. Al cuantificar niveles aceptables de falta de fiabilidad, los presupuestos de error:

  • Crean un recurso finito que debe ser gestionado
  • Fomentan mejoras proactivas en la fiabilidad
  • Proporcionan una medida objetiva para cuándo priorizar la estabilidad sobre nuevas características

Alertas accionables. Las alertas basadas en SLO:

  • Se centran en problemas que impactan al cliente
  • Reducen la fatiga de alertas al eliminar el ruido
  • Proporcionan contexto para la priorización y la toma de decisiones

6. Estrategias de muestreo optimizan el uso de recursos mientras mantienen la fidelidad

A gran escala, la necesidad de refinar tu conjunto de datos para optimizar los costos de recursos se vuelve crítica. Pero incluso a una escala más pequeña, donde la necesidad de reducir recursos es menos apremiante, refinar los datos que decides conservar aún puede proporcionar valiosos ahorros de costos.

Acto de equilibrio. Las estrategias de muestreo buscan:

  • Reducir el volumen de datos y los costos asociados
  • Mantener la precisión estadística para el análisis
  • Preservar eventos importantes y atípicos

Técnicas clave:

  • Muestreo de probabilidad constante: Simple pero puede perder eventos raros
  • Muestreo de tasa dinámica: Se ajusta según el volumen de tráfico
  • Muestreo basado en contenido: Prioriza eventos según atributos
  • Muestreo basado en cabeza vs. muestreo basado en cola: Considera cuándo se toman decisiones de muestreo

Consideraciones de implementación:

  • Muestreo consistente entre servicios
  • Propagación de decisiones de muestreo en trazas distribuidas
  • Capacidad para reconstruir la distribución de datos original

7. La observabilidad es un imperativo empresarial en la era de los sistemas distribuidos

El caso empresarial para introducir la observabilidad en tus sistemas es reducir tanto el tiempo de detección (TTD) como el tiempo de resolución (TTR) de los problemas dentro de tus servicios.

Beneficios tangibles:

  • Resolución más rápida de incidentes
  • Mejora de la satisfacción del cliente
  • Reducción del agotamiento de los ingenieros
  • Aumento de la velocidad de desarrollo de características

Transformación cultural. Las prácticas de observabilidad:

  • Empoderan a los ingenieros para entender y hacerse cargo de sus sistemas
  • Rompen los silos entre desarrollo, operaciones y equipos de negocio
  • Fomentan una cultura de mejora continua y aprendizaje

Estrategia de implementación:

  1. Comienza con servicios de alto impacto y puntos críticos
  2. Demuestra valor a través de victorias rápidas
  3. Invierte en herramientas y capacitación
  4. Establece métricas claras para la mejora (por ejemplo, TTD, TTR)
  5. Expande gradualmente a toda la organización

Última actualización:

Reseñas

3.78 de 5
Promedio de 100+ calificaciones de Goodreads y Amazon.

La Ingeniería de Observabilidad recibe críticas mixtas, con una calificación promedio de 3.78 sobre 5. Los lectores valoran la introducción del libro a los conceptos de observabilidad y su énfasis en los sistemas socio-técnicos. Sin embargo, muchos lo encuentran repetitivo, carente de ejemplos prácticos y demasiado centrado en distinguir la observabilidad del monitoreo. Algunos elogian sus ideas revolucionarias, mientras que otros critican su extensión y falta de profundidad técnica. El libro se considera un buen punto de partida para entender la observabilidad, pero no logra ofrecer una guía detallada de implementación para los ingenieros.

Sobre el autor

Charity Majors es una figura destacada en el ámbito de la observabilidad y la ingeniería de software. Es reconocida por su experiencia en sistemas distribuidos, ingeniería de producción y prácticas de DevOps. Majors es cofundadora y CTO de Honeycomb, una empresa especializada en herramientas de observabilidad. Con frecuencia, participa como ponente en conferencias y escribe sobre observabilidad, microservicios y prácticas modernas de desarrollo de software. Majors tiene una fuerte presencia en las redes sociales, especialmente en Twitter, donde comparte ideas y participa en discusiones sobre tecnología y cultura de ingeniería. Su trabajo se centra en mejorar la fiabilidad y el rendimiento de sistemas de software complejos a través de la observabilidad.

0:00
-0:00
1x
Dan
Andrew
Michelle
Lauren
Select Speed
1.0×
+
200 words per minute
Create a free account to unlock:
Requests: Request new book summaries
Bookmarks: Save your favorite books
History: Revisit books later
Ratings: Rate books & see your ratings
Unlock Unlimited Listening
🎧 Listen while you drive, walk, run errands, or do other activities
2.8x more books Listening Reading
Today: Get Instant Access
Listen to full summaries of 73,530 books. That's 12,000+ hours of audio!
Day 4: Trial Reminder
We'll send you a notification that your trial is ending soon.
Day 7: Your subscription begins
You'll be charged on Jan 25,
cancel anytime before.
Compare Features Free Pro
Read full text summaries
Summaries are free to read for everyone
Listen to summaries
12,000+ hours of audio
Unlimited Bookmarks
Free users are limited to 10
Unlimited History
Free users are limited to 10
What our users say
30,000+ readers
"...I can 10x the number of books I can read..."
"...exceptionally accurate, engaging, and beautifully presented..."
"...better than any amazon review when I'm making a book-buying decision..."
Save 62%
Yearly
$119.88 $44.99/year
$3.75/mo
Monthly
$9.99/mo
Try Free & Unlock
7 days free, then $44.99/year. Cancel anytime.
Settings
Appearance
Black Friday Sale 🎉
$20 off Lifetime Access
$79.99 $59.99
Upgrade Now →