Cómo Funciona el Sistema de Monitoreo de PingPuffin
Versión: 1.5
Última actualización: 20 de febrero de 2026
Tabla de Contenidos
- Resumen
- Intervalos y Frecuencia de Verificación
- Detección de Errores
- Recuperación y Cambios de Estado
- Actualizaciones Manuales
- Códigos de Estado HTTP Esperados
- Protección Contra Fallos del Monitor
- Sistema de Notificaciones
- Páginas de Estado Públicas
- Actualizaciones Automáticas del Panel
- Recopilación y Almacenamiento de Datos
- Especificaciones Técnicas
- Privacidad y Seguridad
- Confiabilidad del Sistema
- Escenarios Comunes y Ejemplos
Resumen
PingPuffin monitorea endpoints HTTP y HTTPS 24/7 para asegurar que tus sitios web estén disponibles. Nuestro sistema está construido con un enfoque en confiabilidad, precisión y transparencia.
Características Principales
- ✅ Verificaciones automáticas cada 3 minutos – todos los monitores se verifican en un horario regular
- ✅ Verificación de 2 checks para evitar falsas alarmas
- ✅ Monitoreo 24/7/365 sin interrupciones
- ✅ Notificaciones por email, Slack, SMS, WhatsApp y webhook (tiempo de inactividad, recuperación, advertencias, vencimiento SSL, respuesta lenta)
- ✅ Alertas de certificado SSL – notificación 8 días y 2 días antes de que venza tu certificado
- ✅ Alertas de respuesta lenta – opción de aviso cuando tu sitio responde demasiado lento (Ajustes)
- ✅ Páginas de estado públicas – comparte una página de estado con tu nombre y logo
- ✅ Recuperación instantánea cuando tu sitio vuelve
- ✅ Actualizaciones manuales para verificación rápida
- ✅ Protección contra errores internos en el sistema de monitoreo
Por Qué Importa la Transparencia
Creemos en la apertura sobre cómo funciona nuestro monitoreo. Este documento explica exactamente cómo detectamos el tiempo de inactividad, cómo evitamos falsas alarmas y cómo nos aseguramos de que recibas notificaciones lo más rápido posible cuando hay un problema real.
Intervalos y Frecuencia de Verificación
Verificaciones Automáticas
Todos los monitores activos se verifican automáticamente cada 3 minutos. Las verificaciones se ejecutan en paralelo para que todos tus monitores se comprueben con rapidez y de forma uniforme.
- Las verificaciones se realizan a intervalos fijos las 24 horas
- Sin pausas, sin fines de semana, sin días festivos
- No tienes que hacer nada: el monitoreo funciona automáticamente
Actualizaciones Manuales
Siempre puedes activar una verificación instantánea mediante el botón "Actualizar ahora" en tu panel:
- Resultado mostrado inmediatamente
- Omite el umbral de 2 checks para retroalimentación rápida
- Útil después de despliegues o cambios de configuración
Cobertura
- Disponibilidad: 24/7/365
- Verificaciones paralelas: Todos los monitores verificados simultáneamente
- Timeout: Estándar 30 segundos (configurable)
- Redirecciones máximas: Hasta 5 solicitudes de seguimiento
Detección de Errores
Sistema de Verificación de 2 Checks
Para evitar falsas alarmas, requerimos 2 fallos consecutivos antes de marcar un sitio como caído.
Cómo Funciona
Primer Fallo (00:00):
- Contador de fallos establecido en 1
- Estado permanece sin cambios (ej., UP)
- No se envía notificación
- El sistema registra el fallo para monitoreo interno
Segundo Fallo (00:05):
- Contador de fallos actualizado a 2
- Estado cambia a DOWN
- Incidente creado automáticamente
- Notificación enviada a todos los canales configurados
Tiempo total: ~5-10 minutos desde el primer fallo hasta el estado DOWN.
¿Por Qué 2 Checks?
Los problemas de red transitorios (fallos de DNS, timeouts breves, errores temporales del servidor) ocurren incluso en sitios estables. Al requerir 2 fallos:
- ✅ Eliminamos falsas alarmas de problemas breves
- ✅ Confirmamos que hay un problema real
- ✅ Mejoramos la confianza del usuario en las notificaciones
¿Qué Cuenta como un Fallo?
Las siguientes situaciones se marcan como fallos:
Códigos de Error HTTP
- Errores 4xx del Cliente: 400, 403, 404, 405, etc. (a menos que se permitan explícitamente)
- Errores 5xx del Servidor: 500, 502, 503, 504, etc.
Errores de Red
- Timeout: Sin respuesta dentro del período de timeout (por defecto: 30 segundos)
- Conexión Rechazada: El servidor rechaza activamente las conexiones
- Fallo de DNS: No se puede resolver el nombre de dominio
- Red Inalcanzable: El host no está disponible en la red
Errores SSL/TLS
- Certificado Inválido: El certificado es inválido
- Certificado Expirado: El certificado ha expirado
- Certificado No Confiable: El certificado no es de una CA confiable
- Desajuste de Nombre de Host: El nombre de host del certificado no coincide con la URL
Tiempo de respuesta lento
- Tiempo de respuesta sobre umbral: Si has activado “Notificar cuando la respuesta sea lenta” (Ajustes), un chequeo cuenta como fallo cuando el tiempo de respuesta supera tu umbral (5–15 segundos). La misma lógica de 2 chequeos se aplica: dos chequeos lentos consecutivos dan estado down y notificación.
Manejo de Diferentes Tipos de Error
Importante: TODOS los tipos de error cuentan hacia el contador de fallos.
Ejemplo:
Check 1: HTTP 500 → Contador de fallos: 1, Estado: UP (esperando confirmación)
Check 2: Timeout → Contador de fallos: 2, Estado: DOWN (fallo confirmado)
Razonamiento:
- Si un servidor cambia entre diferentes tipos de error, indica inestabilidad
- No es menos serio si cambia el tipo de error
- Cualquier fallo significa que el sitio no está funcionando correctamente
Recuperación y Cambios de Estado
Recuperación Instantánea
Cuando tu sitio vuelve, reaccionamos inmediatamente – sin umbral de 2 checks para la recuperación.
Flujo de recuperación:
Estado: DOWN
Check 1: El sitio responde con HTTP 200 → Contador de fallos reiniciado, Estado: UP
Resultado: Recuperación instantánea, notificación enviada
¿Por qué recuperación instantánea?
- ✅ Los usuarios quieren retroalimentación rápida cuando su sitio vuelve
- ✅ No hay razón para esperar confirmación de que algo funciona
- ✅ Mejor práctica en monitoreo
- ✅ Reduce la preocupación y el tiempo de espera
Estados de Estado
🟢 UP (En Línea)
Significado:
- El sitio responde con un código de estado HTTP esperado (por defecto: 2xx y 3xx habituales)
- Tiempo de respuesta dentro del rango aceptable
- No se detectan errores
Notificaciones:
- Enviadas en recuperación del estado DOWN
🔴 DOWN (Desconectado)
Significado:
- El sitio falló 2+ checks consecutivos
- Incidente creado y rastreado
- Todos los canales de notificación configurados alertados
Duración:
- Registrada desde el primer check DOWN hasta la recuperación
- Mostrada en el registro de incidentes con duración precisa
🟡 WARNING (Advertencia)
Significado:
- El sitio responde pero con advertencias
- Ejemplos: Tiempo de respuesta lento, desafío de Cloudflare detectado
- El monitoreo continúa normalmente
Notificaciones:
- Pueden configurarse por usuario
🔵 REDIRECT (Redirección)
Significado:
- Redirección permanente (301) detectada a otra URL
- El sitio es funcional pero la URL ha cambiado
- Puedes elegir actualizar la URL o continuar monitoreando la original
Notificaciones:
- Pueden configurarse por usuario
Sitios Protegidos por Cloudflare
Manejo Automático:
PingPuffin maneja automáticamente los sitios detrás de Cloudflare. El comportamiento depende del código de estado HTTP:
5xx (ej. 503 Service Unavailable): Todos los errores de servidor (500, 502, 503, 504, etc.) se marcan siempre como "Down" y generan notificaciones y tiempo de inactividad en el gráfico – incluso cuando la respuesta contiene texto de Cloudflare. Cloudflare suele reenviar el 503 de tu origen y envolverlo en su propia página de error; interpretamos 5xx como que el servicio no está disponible.
4xx (ej. 403 Forbidden, 429 Too Many Requests): Si el servidor responde con 403 o 429 y detectamos Cloudflare (encabezados o contenido), el monitor se marca como "Problematic" (advertencia) en lugar de "Down". Suele indicar protección de bots o límite de tasa de Cloudflare – no podemos saber si tu sitio está realmente caído, solo que la protección bloquea nuestro chequeo.
¿Por qué "Problematic" para 4xx con Cloudflare?
Si recibimos una respuesta HTTP (ej. 403), el servidor es alcanzable. El monitoreo de tiempo de actividad trata sobre disponibilidad – para 4xx con Cloudflare asumimos que la protección bloquea el chequeo, no que el sitio esté caído. Mostramos "Problematic" para que sepas que hay protección activa.
Opcional: Configurar Cloudflare para Mejor Monitoreo
Si deseas evitar el estado "Problematic" para tu sitio protegido por Cloudflare, puedes:
-
Reglas WAF: Crea una regla que permita solicitudes del User-Agent de PingPuffin:
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36 -
Verificación de Integridad del Navegador: Considera desactivar esto para IPs de monitoreo
-
Limitación de Tasa: Ajusta la limitación de tasa para que las solicitudes de monitoreo no sean bloqueadas
IP de Monitoreo de PingPuffin: 188.245.198.146 (para whitelisting si es necesario)
Actualizaciones Manuales
Checks Iniciados por el Usuario
Siempre puedes activar un check instantáneo mediante el botón "Actualizar ahora" en el panel.
Comportamiento:
- Omite umbral de 2 checks: El resultado se muestra y aplica inmediatamente
- Actualización de estado instantánea: Si el estado cambia, se actualiza inmediatamente
- "Última verificación" actualizada: El panel muestra la nueva hora de check al instante; en la vista general puede mostrarse "Actualizado hace un momento" para el monitor que actualizaste
- Notificación: Enviada si el estado cambia
- Contador de fallos actualizado: El contador se actualiza según el resultado
Casos de Uso
- ✅ Verificación rápida después del despliegue de correcciones
- ✅ Prueba de nueva configuración de monitor
- ✅ Check de estado instantáneo sin esperar la próxima verificación automática
- ✅ Depuración de problemas de conexión
Ejemplo:
00:00 - Check automático falla → Contador de fallos: 1, Estado: UP
00:02 - Haces clic en "Actualizar ahora" → Check falla → Estado: DOWN instantáneamente
Resultado: El check manual omite el umbral de 2 checks para retroalimentación rápida
Códigos de Estado HTTP Esperados
Un monitor se considera UP cuando el servidor devuelve un código de estado HTTP que has marcado como aceptable. Por defecto, PingPuffin trata estos códigos como éxito:
Códigos aceptados por defecto
2xx Éxito
- 200 OK
- 201 Created
- 202 Accepted
- 203 Non-Authoritative Information
- 204 No Content
- 205 Reset Content
- 206 Partial Content
3xx Redirecciones (tras seguir las redirecciones, se evalúa la respuesta final)
- 301 Moved Permanently
- 302 Found
- 303 See Other
- 304 Not Modified
- 307 Temporary Redirect
- 308 Permanent Redirect
Cualquier otro código (p. ej. 4xx o 5xx) se considera fallo a menos que lo añadas explícitamente a los códigos de estado esperados del monitor.
Códigos de estado esperados personalizados
Puedes definir qué códigos cuentan como éxito por monitor. Por ejemplo:
- 401 Unauthorized para una página de login o protegida que devuelve correctamente "auth required"
- 403 Forbidden si esa respuesta es la esperada para la URL que monitoreas
- 404 Not Found solo si monitoreas intencionadamente una página "not found"
Al crear o editar un monitor puedes indicar una lista de códigos esperados separados por comas (p. ej. 200,201,401). Si lo dejas por defecto, se usa la lista completa anterior.
Dónde se aplica
- Todos los checks de uptime HTTP(S) usan esta regla (verificaciones automáticas y "Actualizar ahora" manual).
- El estado se determina comparando el código de la respuesta final (tras redirecciones) con tu lista esperada.
- Consulta Especificaciones Técnicas para timeouts, límite de redirecciones y otros detalles de la solicitud.
Protección Contra Fallos del Monitor
Errores Internos vs. Externos
Es crítico distinguir entre errores en tu sitio y errores en nuestro sistema de monitoreo.
Errores del Sitio (Monitoreados)
Estos errores de tu sitio cuentan como fallos:
- ✅ HTTP 500 del sitio objetivo → Cuenta como fallo
- ✅ Timeout conectando al sitio objetivo → Cuenta como fallo
- ✅ Error de DNS para el dominio objetivo → Cuenta como fallo
Errores del Sistema de Monitoreo (Protegidos)
Estos errores en el código de PingPuffin NO marcan tu sitio como caído:
- ❌ Excepción PHP en el código de PingPuffin → NO marca el sitio como caído
- ❌ Error de conexión a la base de datos → NO marca el sitio como caído
- ❌ Error de lógica interna → NO marca el sitio como caído
Alertas del Administrador
Cuando el sistema de monitoreo falla:
Registro:
- Errores críticos registrados con stack trace completo
- Marca de tiempo e ID del monitor registrados
- Todos los detalles guardados para depuración
Alarma por Email:
- Email enviado al administrador del sistema
- Contiene mensaje de error, stack trace y contexto
- Limitado por tasa: Máximo 1 email por hora por error único
- Previene inundación de emails durante problemas del sistema
Base de Datos:
- El estado permanece sin cambios (sin falsos downs)
- No se crea incidente
- Los usuarios no se ven afectados
Ejemplo:
El verificador del monitor se ejecuta
→ Error interno detectado en el sistema de monitoreo
→ Error registrado con contexto completo
→ Email enviado al administrador del sistema
→ Base de datos NO actualizada
→ El estado de tu sitio permanece sin cambios
Sistema de Notificaciones
Cuándo se Envían las Notificaciones
- Tiempo de inactividad (DOWN): Tras 2 fallos consecutivos confirmados (~5–10 min)
- Recuperación (UP): Al instante cuando tu sitio vuelve de DOWN
- Advertencia y redirección: Configurable por usuario (redirección, advertencia)
- Respuesta lenta: Si lo has activado en Ajustes – dos checks lentos consecutivos dan estado DOWN y notificación
- Certificado SSL por vencer: Te avisamos 8 días antes y 2 días antes del vencimiento (mismos canales que el resto de notificaciones)
- Actualización manual: Notificación al instante si el estado cambia al hacer clic en "Actualizar ahora"
Canales de Notificación
Puedes activar uno o más canales en Integraciones (Apps). Todos los canales activados reciben los mismos eventos (tiempo de inactividad, recuperación, vencimiento SSL, respuesta lenta, etc.).
- Notificaciones directas por email
- Incluye: nombre del sitio, estado, mensaje de error, marca de tiempo y enlace al panel
Slack
- Mensaje al canal o DM configurado
- Formateado con colores (rojo = caído, verde = en línea) y enlace al monitor
SMS
- Mensaje corto a tu número móvil por tiempo de inactividad, recuperación, vencimiento SSL y respuesta lenta
- Requiere añadir y activar SMS en Integraciones
- Mensaje a tu número de WhatsApp por tiempo de inactividad, recuperación, vencimiento SSL y respuesta lenta
- Requiere añadir y activar WhatsApp en Integraciones
Webhook
- Solicitud POST a tu endpoint con JSON (estado, tiempo de respuesta, mensaje de error, etc.)
- Útil para integrar con otros sistemas
Pausa de Notificaciones
Puedes desactivar temporalmente las notificaciones (pausar) por 24 horas:
Durante la Pausa:
- ✅ El monitoreo continúa normalmente
- ✅ Las actualizaciones de estado en el panel
- ❌ No se envían notificaciones a ningún canal
- ⏰ Automáticamente se reanuda después de 24 horas
Casos de Uso:
- Mantenimiento planificado
- Problema conocido durante el despliegue
- Cierre temporal
Páginas de Estado Públicas
Para cada monitor (o grupo) puedes mostrar una página de estado pública que cualquiera puede abrir sin iniciar sesión. La página muestra el estado actual (en línea/caído/advertencia) e historial.
- Personalización: Puedes definir un nombre para mostrar y un logo (URL) para el grupo, para que la página de estado refleje tu marca. Los cambios se aplican tanto en el panel como en la página pública.
- Idioma: La página de estado puede mostrarse en danés, inglés o español (según la configuración del visitante).
- Compartir el enlace: Obtienes un enlace estable a la página de estado para compartir con usuarios o incrustar en tu sitio.
Actualizaciones Automáticas del Panel
Mecanismo de Auto-Actualización
Tu panel se actualiza automáticamente cada 30 segundos con los últimos datos y no activa nuevos checks: siempre ves el estado más reciente sin recargar la página.
¿Qué se Actualiza?
El panel siempre muestra los últimos datos de la última verificación automática:
- 🎨 Indicador de estado: Badge de color (verde/rojo/amarillo/azul)
- ⏰ Última verificación: Marca de tiempo precisa del último check
- ⚡ Tiempo de respuesta: Tiempo de respuesta en milisegundos
- 🔢 Contador de fallos: Número de fallos consecutivos
- 📊 Información de incidentes: Incidentes activos y duración
Importante: La auto-actualización respeta la lógica de 2 checks porque solo muestra datos de las verificaciones automáticas; no activa nuevos checks.
Recopilación y Almacenamiento de Datos
Registros de Checks
Cada check individual se guarda en la base de datos con la siguiente información:
- ID único para el check
- Referencia al monitor
- Marca de tiempo (cuándo se realizó el check)
- Código de estado HTTP o tipo de error
- Tiempo de respuesta en milisegundos
- Estado de éxito/fallo
- Mensaje de error (si es relevante)
- Información de redirección (si es relevante)
- Detalles de error SSL (si es relevante)
Uso:
- Cálculos de porcentaje de tiempo de actividad
- Gráficos y reportes históricos
- Análisis de errores y depuración
- Seguimiento de rendimiento a lo largo del tiempo
Seguimiento de Incidentes
Cuando el estado cambia a DOWN, se crea un incidente con los siguientes datos:
- ID único para el incidente
- Referencia al monitor
- Marca de tiempo de inicio
- Marca de tiempo de fin (cuando se resuelve)
- Duración total
Características:
- Creación automática en estado DOWN
- Cálculo continuo de duración
- Resolución automática en recuperación
- Historial completo mantenido
- Exportable a CSV
Registro de Actividad
Todos los eventos significativos se registran:
- ✅ Cambios de estado (UP → DOWN, DOWN → UP, etc.)
- ✅ Checks manuales realizados por usuarios
- ✅ Cambios de configuración
- ✅ Actualizaciones de URL
- ✅ Actualizaciones de metadatos
Funcionalidad:
- Exportable a formato CSV
- Buscable y filtrable
- Muestra detalles para cada evento
- Marcas de tiempo en todas las entradas
Especificaciones Técnicas
Parámetros de Solicitud HTTP
Cuando PingPuffin verifica tu sitio, se envía la siguiente solicitud:
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36
Accept: */*
Connection: close
[Opcional: Header de Authorization para Basic Auth]
Nota: Usamos un user agent estándar de Chrome para evitar ser bloqueados por sitios que filtran user agents personalizados.
Configuración:
- Timeout: Puede configurarse por monitor (por defecto: 30 segundos)
- Seguir Redirecciones: Sí, hasta 5 redirecciones máximo
- Verificación SSL: Habilitada (valida certificados)
- Reutilización de Conexión: Deshabilitada (conexión nueva para cada check)
Códigos de Estado HTTP Esperados
Los monitores consideran un check exitoso cuando el estado de la respuesta está en la lista de códigos de estado esperados de ese monitor. Por defecto aceptamos un conjunto amplio de códigos 2xx y 3xx. Para la lista completa y cómo personalizarla, ver Códigos de Estado HTTP Esperados.
Medición del Tiempo de Respuesta
Qué se Mide:
- Tiempo de búsqueda DNS
- Tiempo de conexión (handshake TCP)
- Tiempo de handshake SSL (si HTTPS)
- Tiempo hasta el primer byte (TTFB)
Qué NO se Mide:
- Tiempo de descarga del cuerpo (solo leemos headers)
- Tiempo de ejecución de JavaScript
- Tiempo de carga de recursos
Almacenamiento:
- Medido en milisegundos
- Guardado en cada check
- Usado para seguimiento de rendimiento
- Mostrado en el panel
Configuración Avanzada de Monitoreo
Para usuarios avanzados, ofrecemos:
Método HTTP
- GET: Método estándar
- POST: Para endpoints que requieren POST
Cuerpo de Solicitud
- Enviar JSON o datos de formulario con solicitudes POST
- Útil para endpoints de API que requieren datos específicos
Autenticación Básica
- Nombre de usuario y contraseña para endpoints protegidos
- Contraseñas encriptadas con AES-256-CBC
- Nunca almacenadas en texto plano
Características Futuras
- Headers personalizados
- Parámetros de solicitud
- Autenticación avanzada (OAuth, Bearer tokens)
Información del Servidor
Dirección IP Pública
El servidor de monitoreo de PingPuffin usa la siguiente dirección IP pública para realizar checks:
Dirección IP: 188.245.198.146
Si necesitas incluir la dirección IP de PingPuffin en la lista blanca de tu firewall o configuración del servidor, puedes usar esta dirección IP.
Nota: La dirección IP puede cambiar durante migraciones de servidor o actualizaciones de infraestructura. Recomendamos usar el header User-Agent para identificación en lugar de reglas basadas en IP, si es posible.
Identificación User-Agent:
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36
Privacidad y Seguridad
Encriptación de Datos
Credenciales Sensibles:
- Todas las contraseñas (Basic Auth) encriptadas en almacenamiento
- Algoritmo: AES-256-CBC (estándar de la industria)
- Clave: Almacenada de forma segura en variables de entorno
- IV: Vector de inicialización único por encriptación
- La desencriptación solo ocurre en memoria durante los checks
- Nunca expuesta en logs o respuestas API
Acceso a Datos
Control de Acceso:
- Resultados de checks solo visibles para el propietario del monitor
- No se comparten datos con terceros
- Registro de actividad solo exportable por el propietario
- Endpoints API seguros con autenticación
Seguridad de Base de Datos:
- Declaraciones preparadas (previene inyección SQL)
- Autenticación basada en sesión
- Protección CSRF en todos los formularios
Aplicación de HTTPS
SSL/TLS:
- Todos los checks de monitor soportan HTTPS
- Validación de certificado SSL habilitada
- Advierte sobre problemas de certificado
- Detecta certificados expirados
Panel:
- Siempre accedido vía HTTPS
- Cookies seguras (flags HttpOnly, Secure)
- Headers HSTS recomendados
Confiabilidad del Sistema
Salud del Sistema de Monitoreo
Nuestro sistema de monitoreo se monitorea a sí mismo:
Detección de Errores:
- Detección automática de errores internos
- Registro completo de todas las excepciones
- Stack traces para depuración
Alertas del Administrador:
- Errores críticos enviados por email al administrador del sistema
- Limitado por tasa para evitar spam
- Detalles incluidos para resolución rápida
Recuperación Automática:
- El sistema continúa comprobando el resto de monitores aunque falle uno
- Sin fallos en cascada entre monitores
- Las transacciones de base de datos aseguran integridad de datos
Objetivos de Tiempo de Actividad
Buscamos la siguiente confiabilidad:
Tiempo de Actividad del Sistema de Monitoreo:
- Objetivo: 99.9% (menos de 9 horas de inactividad por año)
- Monitoreado: Mediante registros internos y métricas del sistema
Tasa de Ejecución de Checks:
- Objetivo: 99.5% de tasa de éxito para ejecución de checks
- Monitoreado: Tasa de error en logs
Confiabilidad de las verificaciones: El monitoreo se ejecuta de forma continua; ante problemas técnicos se alerta al administrador para mantener el sistema estable.
Escenarios Comunes y Ejemplos
Escenario 1: Problema de Red Transitorio
Situación: Problema breve de red, el sitio está realmente en línea.
00:00 - Check falla (timeout) → Contador de fallos: 1, Estado: UP
00:05 - Check tiene éxito → Contador de fallos: 0, Estado: UP
Resultado:
✅ No se envía notificación
✅ No hay cambio de estado
✅ No hay falsa alarma
Por qué funciona: El umbral de 2 checks captura problemas breves.
Escenario 2: Tiempo de Inactividad Real
Situación: El servidor está realmente caído (ej., problema de hosting).
00:00 - Check falla (HTTP 500) → Contador de fallos: 1, Estado: UP
→ El sistema registra el primer fallo para monitoreo interno
00:05 - Check falla (timeout) → Contador de fallos: 2, Estado: DOWN
→ Incidente creado automáticamente
→ Notificación enviada vía email/Slack/webhook
00:10 - Check falla (timeout) → Contador de fallos: 3, Estado: DOWN
→ Duración del incidente actualizada continuamente
Resultado:
✅ Estado DOWN confirmado a las 00:05
✅ Notificación enviada ~5 minutos después del primer fallo
✅ Diferentes tipos de error (500 + timeout) ambos cuentan
Por qué funciona: Dos fallos consecutivos confirman un problema real.
Escenario 3: Recuperación Rápida
Situación: Sitio caído, vuelve rápidamente.
00:00 - El estado es DOWN (de fallo anterior)
00:05 - Check tiene éxito (HTTP 200) → Contador de fallos: 0, Estado: UP
→ Incidente marcado como resuelto automáticamente
→ Notificación de recuperación enviada
Resultado:
✅ Recuperación instantánea en el primer check exitoso
✅ Duración del incidente calculada (00:00 a 00:05 = 5 min)
✅ Eres informado rápidamente sobre la recuperación
Por qué funciona: No hay umbral de 2 checks para recuperación.
Escenario 4: Actualización Manual Durante el Primer Fallo
Situación: Check automático falló una vez, el usuario quiere verificar.
00:00 - Check automático falla → Contador de fallos: 1, Estado: UP
→ El estado permanece UP (esperando confirmación)
00:02 - Haces clic en "Actualizar ahora" → Check falla → Estado: DOWN inmediatamente
→ El check manual omite el umbral de 2 checks para retroalimentación rápida
→ Notificación enviada
Resultado:
✅ El check manual da retroalimentación instantánea
✅ El estado se actualiza sin esperar el próximo check automático
✅ Útil para depuración y verificación
Por qué funciona: Los checks manuales están diseñados para retroalimentación instantánea.
Escenario 5: Error del Sistema de Monitoreo
Situación: Error interno en el propio código de PingPuffin.
00:00 - El sistema de monitoreo ejecuta check automático
→ Error interno detectado
→ Error capturado automáticamente
Registro:
→ Error registrado con contexto completo para monitoreo interno
→ Información técnica completa guardada para depuración
Alarma del Administrador:
→ Email enviado al administrador del sistema (máx. 1 por hora)
→ Contiene detalles del error y contexto
Base de Datos:
→ No hay actualización al estado de tu sitio
→ El estado de tu sitio permanece sin cambios
→ El contador de fallos no se ve afectado
Resultado:
✅ El error del monitor NO afecta el estado de tu sitio
✅ El administrador alertado para arreglar el problema
✅ No hay estado DOWN falso
Por qué funciona: Distinción entre errores del monitor y errores del sitio.
Escenario 6: Diferentes Tipos de Error Consecutivamente
Situación: Servidor inestable, diferentes errores cada vez.
00:00 - Check falla (HTTP 500) → Contador de fallos: 1, Estado: UP
00:05 - Check falla (Timeout de conexión) → Contador de fallos: 2, Estado: DOWN
00:10 - Check falla (HTTP 503) → Contador de fallos: 3, Estado: DOWN
Resultado:
✅ Diferentes tipos de error TODOS cuentan
✅ Estado DOWN después de 2 fallos (independientemente del tipo)
✅ Indica servidor inestable (tal vez peor que un error consistente)
Por qué funciona: Cualquier error significa que el sitio no está funcionando correctamente.
Preguntas Frecuentes
¿Qué tan rápido recibo notificación de tiempo de inactividad?
Check automático: ~5-10 minutos después del primer fallo (requiere 2 fallos).
Check manual: Instantáneamente si actualizas manualmente.
¿Puedo recibir falsas alarmas?
Muy raramente. El sistema de 2 checks elimina la mayoría de los problemas breves. Si recibes una alarma, casi siempre hay un problema real.
¿Qué pasa si mi servidor es temporalmente lento?
Si el tiempo de respuesta excede el timeout (por defecto 30 seg), cuenta como fallo. Puedes aumentar el valor de timeout para tu monitor.
¿Cómo se maneja el mantenimiento planificado?
Usa la función "Pausar" para desactivar notificaciones por 24 horas. El monitoreo continúa, pero no recibes alarmas.
¿Puedo ver el historial de todos los checks?
Sí, el registro de actividad muestra todos los checks y cambios de estado. También puedes exportar a CSV.
¿Qué pasa si PingPuffin mismo se cae?
Nuestros monitores se ejecutan en infraestructura confiable. En errores críticos del sistema, el administrador es alertado, pero tu sitio NO se marca como caído.
Contacto y Soporte
¿Tienes preguntas sobre cómo funciona el monitoreo?
📧 Email: support@pingpuffin.com
🐛 Reportes de errores: Vía email
📚 Documentación: Ver sección de documentación para más información
Registro de Cambios
v1.5 (20 de febrero de 2026)
- SMS y WhatsApp añadidos como canales de notificación (en Integraciones)
- Alertas de certificado SSL: notificación 8 días y 2 días antes del vencimiento (todos los canales)
- Alertas de respuesta lenta: opción de aviso cuando el sitio responde demasiado lento (Ajustes, 5–15 seg)
- Páginas de estado públicas: descrita la personalización con nombre para mostrar y logo, e idiomas
- Detalles técnicos de implementación eliminados de la documentación para usuarios (enfoque en lo que ves y puedes configurar)
v1.3 (14 de febrero de 2026)
- Actualización de versión y fecha de documentación
v1.2 (9 de febrero de 2026)
- Nueva sección: Códigos de Estado HTTP Esperados con lista por defecto completa (200, 201, 202, 203, 204, 205, 206, 301, 302, 303, 304, 307, 308) y personalización
- "Actualizar ahora" manual: documentado el feedback de "Última verificación" y "Actualizado hace un momento" en el panel
v1.1 (17 de enero de 2026)
- Las verificaciones se ejecutan en paralelo (mayor rapidez)
- Intervalo de check reducido de 5 a 3 minutos
- Cada categoría puede verificar hasta 200 monitores por ejecución
- Documentación actualizada con detalles de procesamiento en paralelo
v1.0 (21 de noviembre de 2024)
- Primera versión de documentación
- Sistema de verificación de 2 checks implementado
- Protección contra fallos del monitor agregada
- Alertas del administrador limitadas por tasa
Este documento se actualiza continuamente. Revisa "Última actualización" en la parte superior para ver si hay nuevas versiones.