Análisis de Logs con awk, grep y sed

Introducción

El análisis de logs es una habilidad fundamental para administradores de sistemas, ingenieros DevOps y profesionales de seguridad. Aunque las herramientas gráficas de análisis de logs ofrecen características poderosas, las utilidades de línea de comandos como awk, grep y sed proporcionan velocidad, flexibilidad y disponibilidad incomparables para el análisis de logs en tiempo real, resolución de problemas y extracción de patrones directamente en servidores de producción.

Estas tres utilidades forman la piedra angular del procesamiento de texto en Unix: grep sobresale en búsqueda y filtrado, sed se especializa en edición de flujos y transformación de texto, y awk proporciona potentes capacidades de extracción de datos y generación de informes. Juntas, te permiten analizar gigabytes de datos de logs en segundos, extraer información procesable, identificar patrones y automatizar tareas de procesamiento de logs sin instalar software adicional.

Esta guía completa te enseña cómo dominar el análisis de logs usando awk, grep y sed, desde filtrado básico hasta coincidencia avanzada de patrones, extracción de datos, análisis estadístico y generación automatizada de informes. Aprenderás técnicas prácticas para analizar logs de servidores web, logs del sistema, logs de aplicaciones y logs de seguridad, permitiendo una rápida resolución de problemas y profundos conocimientos operacionales.

Prerrequisitos

Antes de sumergirte en el análisis de logs con estas herramientas, asegúrate de tener:

Un servidor o estación de trabajo Linux (cualquier distribución)
Acceso a archivos de logs (típicamente en /var/log/)
Acceso root o sudo para archivos de logs protegidos
Comprensión básica de expresiones regulares
Familiaridad con formatos comunes de logs

Herramientas Requeridas: Las tres utilidades vienen preinstaladas en prácticamente todas las distribuciones Linux:

grep (se recomienda GNU grep)
sed (GNU sed)
awk (GNU awk/gawk)

Verificar Instalación:

grep --version
sed --version
awk --version

Entendiendo los Formatos de Logs

Formatos Comunes de Logs

Formato Syslog:

Jan 11 10:30:45 server1 sshd[1234]: Accepted password for user from 192.168.1.100 port 12345 ssh2

Formato Combinado de Apache:

192.168.1.100 - - [11/Jan/2024:10:30:45 +0000] "GET /index.html HTTP/1.1" 200 1234 "https://example.com" "Mozilla/5.0"

Log de Acceso de Nginx:

192.168.1.100 - user [11/Jan/2024:10:30:45 +0000] "GET /api/v1/users HTTP/1.1" 200 567 "-" "curl/7.68.0"

Log de Aplicación JSON:

{"timestamp":"2024-01-11T10:30:45Z","level":"ERROR","message":"Database connection failed","user_id":123}

Dominando grep para Análisis de Logs

Uso Básico de grep

Buscar un término específico:

# Encontrar todos los mensajes de error
grep "error" /var/log/syslog

# Búsqueda sin distinción de mayúsculas
grep -i "error" /var/log/syslog

# Buscar en múltiples archivos
grep "failed" /var/log/*.log

# Búsqueda recursiva
grep -r "connection refused" /var/log/

Mostrar contexto:

# Mostrar 3 líneas antes de la coincidencia
grep -B 3 "error" /var/log/syslog

# Mostrar 3 líneas después de la coincidencia
grep -A 3 "error" /var/log/syslog

# Mostrar 3 líneas antes y después
grep -C 3 "error" /var/log/syslog

# Mostrar números de línea
grep -n "error" /var/log/syslog

Conteo y estadísticas:

# Contar líneas coincidentes
grep -c "error" /var/log/syslog

# Mostrar solo la parte coincidente
grep -o "ERROR.*" /var/log/app.log

# Listar archivos que contienen coincidencias
grep -l "error" /var/log/*.log

# Listar archivos que NO contienen coincidencias
grep -L "error" /var/log/*.log

Patrones Avanzados de grep

Patrones de expresiones regulares:

# Coincidir direcciones IP
grep -E '\b([0-9]{1,3}\.){3}[0-9]{1,3}\b' /var/log/syslog

# Coincidir direcciones de correo
grep -E '\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b' /var/log/mail.log

# Coincidir fechas (formato YYYY-MM-DD)
grep -E '[0-9]{4}-[0-9]{2}-[0-9]{2}' /var/log/app.log

# Coincidir horas (HH:MM:SS)
grep -E '[0-9]{2}:[0-9]{2}:[0-9]{2}' /var/log/syslog

Múltiples patrones:

# Coincidir cualquier patrón (OR)
grep -E "error|warning|critical" /var/log/syslog

# Coincidir múltiples patrones (AND)
grep "error" /var/log/syslog | grep "database"

# Excluir patrón
grep "error" /var/log/syslog | grep -v "debug"

# Coincidir límites de palabra
grep -w "error" /var/log/syslog  # No coincidirá "errors"

Ejemplos Prácticos de grep

Encontrar intentos fallidos de inicio de sesión SSH:

grep "Failed password" /var/log/auth.log

# Con direcciones IP
grep "Failed password" /var/log/auth.log | grep -oE '\b([0-9]{1,3}\.){3}[0-9]{1,3}\b' | sort | uniq -c | sort -rn

# Contar por usuario
grep "Failed password" /var/log/auth.log | awk '{print $(NF-5)}' | sort | uniq -c | sort -rn

Analizar códigos de error HTTP:

# Encontrar errores 404
grep " 404 " /var/log/nginx/access.log

# Encontrar errores 5xx
grep -E " 5[0-9]{2} " /var/log/nginx/access.log

# Contar errores por tipo
grep -oE " [4-5][0-9]{2} " /var/log/nginx/access.log | sort | uniq -c | sort -rn

Buscar errores de aplicación con contexto:

# Encontrar errores con stack traces
grep -A 20 "Exception" /var/log/app/error.log

# Encontrar errores de base de datos
grep -B 5 -A 10 "SQLException" /var/log/app/app.log

Filtrado basado en tiempo:

# Encontrar logs de una hora específica
grep "Jan 11 14:" /var/log/syslog

# Encontrar logs de una fecha específica
grep "2024-01-11" /var/log/app.log

# Encontrar logs de hoy
grep "$(date '+%b %d')" /var/log/syslog

Dominando sed para Procesamiento de Logs

Uso Básico de sed

Imprimir líneas específicas:

# Imprimir línea 10
sed -n '10p' /var/log/syslog

# Imprimir líneas 10-20
sed -n '10,20p' /var/log/syslog

# Imprimir cada línea 10
sed -n '0~10p' /var/log/syslog

# Imprimir última línea
sed -n '$p' /var/log/syslog

Eliminar líneas:

# Eliminar líneas en blanco
sed '/^$/d' /var/log/syslog

# Eliminar líneas que contienen un patrón
sed '/debug/d' /var/log/syslog

# Eliminar líneas 1-10
sed '1,10d' /var/log/syslog

# Eliminar última línea
sed '$d' /var/log/syslog

Sustituir texto:

# Reemplazar primera aparición
sed 's/error/ERROR/' /var/log/app.log

# Reemplazar todas las apariciones (global)
sed 's/error/ERROR/g' /var/log/app.log

# Reemplazo sin distinción de mayúsculas
sed 's/error/ERROR/gi' /var/log/app.log

# Reemplazar solo en líneas que coinciden con un patrón
sed '/WARNING/s/error/ERROR/g' /var/log/app.log

Patrones Avanzados de sed

Extraer campos específicos:

# Extraer direcciones IP
sed -n 's/.*\([0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\).*/\1/p' /var/log/nginx/access.log

# Extraer marcas de tiempo
sed -n 's/.*\[\([^]]*\)\].*/\1/p' /var/log/nginx/access.log

# Eliminar marcas de tiempo (primeros 3 campos)
sed 's/^[^ ]* [^ ]* [^ ]* //' /var/log/syslog

Operaciones multilínea:

# Unir líneas que terminan con barra invertida
sed -e :a -e '/\\$/N; s/\\\n//; ta' /var/log/app.log

# Agregar línea después del patrón
sed '/ERROR/a\--- Error detected ---' /var/log/app.log

# Insertar línea antes del patrón
sed '/ERROR/i\--- Warning: Error follows ---' /var/log/app.log

Procesamiento condicional:

# Procesar solo líneas entre patrones
sed -n '/START/,/END/p' /var/log/app.log

# Eliminar todo después del primer ERROR
sed '/ERROR/,$d' /var/log/app.log

# Reemplazar solo en un rango de líneas específico
sed '10,20s/old/new/g' /var/log/app.log

Ejemplos Prácticos de sed

Limpiar y formatear logs:

# Eliminar códigos de color ANSI
sed 's/\x1b\[[0-9;]*m//g' /var/log/app.log

# Eliminar retornos de carro
sed 's/\r$//' /var/log/app.log

# Normalizar espacios en blanco
sed 's/[[:space:]]\+/ /g' /var/log/app.log

# Agregar prefijo a cada línea
sed 's/^/[APP] /' /var/log/app.log

Extraer y transformar datos:

# Convertir log de Apache a CSV
sed 's/\([^ ]*\) - - \[\([^]]*\)\] "\([^"]*\)" \([0-9]*\) \([0-9]*\).*/\1,\2,\3,\4,\5/' /var/log/apache2/access.log

# Extraer solo URLs del log de acceso
sed -n 's/.*"\w* \([^ ]*\) HTTP.*/\1/p' /var/log/nginx/access.log

# Extraer solo mensajes de error
sed -n 's/.*ERROR - \(.*\)$/\1/p' /var/log/app.log

Filtrar por rango de tiempo:

# Extraer logs de 10:00 a 11:00
sed -n '/Jan 11 10:00/,/Jan 11 11:00/p' /var/log/syslog

# Extraer logs de una fecha específica
sed -n '/2024-01-11/,/2024-01-12/p' /var/log/app.log

Dominando awk para Análisis de Logs

Uso Básico de awk

Imprimir columnas específicas:

# Imprimir primera columna
awk '{print $1}' /var/log/syslog

# Imprimir primera y quinta columna
awk '{print $1, $5}' /var/log/syslog

# Imprimir todas las columnas excepto la primera
awk '{$1=""; print $0}' /var/log/syslog

# Imprimir última columna
awk '{print $NF}' /var/log/syslog

# Imprimir penúltima columna
awk '{print $(NF-1)}' /var/log/syslog

Coincidencia de patrones:

# Imprimir líneas que coinciden con un patrón
awk '/error/ {print}' /var/log/syslog

# Imprimir líneas que NO coinciden con un patrón
awk '!/debug/ {print}' /var/log/syslog

# Imprimir si la columna coincide
awk '$5 == "error" {print}' /var/log/syslog

# Imprimir si la columna contiene
awk '$5 ~ /error/ {print}' /var/log/syslog

Separadores de campo:

# Separador de campo personalizado (dos puntos)
awk -F':' '{print $1, $2}' /etc/passwd

# Múltiples separadores de campo
awk -F'[: ]' '{print $1}' /var/log/syslog

# Cambiar separador de salida
awk -F':' 'BEGIN{OFS=","} {print $1, $2}' /etc/passwd

Operaciones Avanzadas de awk

Aritmética y estadísticas:

# Contar líneas
awk 'END {print NR}' /var/log/syslog

# Sumar valores de columna
awk '{sum+=$1} END {print sum}' numbers.log

# Calcular promedio
awk '{sum+=$1; count++} END {print sum/count}' numbers.log

# Encontrar mínimo y máximo
awk 'NR==1{max=$1; min=$1} $1>max{max=$1} $1<min{min=$1} END {print "Min:", min, "Max:", max}' numbers.log

Procesamiento condicional:

# Declaraciones if-else
awk '{if ($1 > 100) print "HIGH:", $0; else print "LOW:", $0}' numbers.log

# Múltiples condiciones
awk '{if ($1 > 100 && $2 == "error") print $0}' /var/log/app.log

# Operador ternario
awk '{print ($1 > 100) ? "HIGH" : "LOW"}' numbers.log

Arrays y agregación:

# Contar ocurrencias
awk '{count[$1]++} END {for (ip in count) print ip, count[ip]}' /var/log/nginx/access.log

# Sumar por clave
awk '{sum[$1]+=$2} END {for (key in sum) print key, sum[key]}' data.log

# Rastrear valores únicos
awk '{if (!seen[$1]++) print $1}' /var/log/access.log

Bloques BEGIN y END:

# Imprimir encabezado y pie
awk 'BEGIN {print "=== Log Analysis ==="} {print $0} END {print "=== Total Lines:", NR, "==="}' /var/log/syslog

# Inicializar variables
awk 'BEGIN {count=0} /error/ {count++} END {print "Errors:", count}' /var/log/syslog

Ejemplos Prácticos de awk

Análisis de logs Apache/Nginx:

# Contar solicitudes por IP
awk '{print $1}' /var/log/nginx/access.log | sort | uniq -c | sort -rn | head -10

# Contar por código de estado HTTP
awk '{print $9}' /var/log/nginx/access.log | sort | uniq -c | sort -rn

# Calcular ancho de banda total
awk '{sum+=$10} END {print "Total MB:", sum/1024/1024}' /var/log/nginx/access.log

# Tiempo de respuesta promedio
awk '{sum+=$NF; count++} END {print "Avg:", sum/count}' /var/log/nginx/access.log

# Solicitudes por hora
awk '{print substr($4,14,2)}' /var/log/nginx/access.log | sort | uniq -c

# URLs más solicitadas
awk '{print $7}' /var/log/nginx/access.log | sort | uniq -c | sort -rn | head -20

# Errores 404 con URLs
awk '$9 == 404 {print $7}' /var/log/nginx/access.log | sort | uniq -c | sort -rn

# Percentiles de tiempo de respuesta
awk '{print $NF}' /var/log/nginx/access.log | sort -n | awk 'BEGIN{c=0} {a[c++]=$1} END {print "50th:", a[int(c*0.5)], "90th:", a[int(c*0.9)], "99th:", a[int(c*0.99)]}'

Análisis de syslog:

# Contar mensajes por hora
awk '{print $3}' /var/log/syslog | cut -d: -f1 | sort | uniq -c

# Contar por programa/servicio
awk '{print $5}' /var/log/syslog | sed 's/\[.*\]://' | sort | uniq -c | sort -rn

# Servicios fallidos
awk '/failed|error/ {print $5}' /var/log/syslog | sort | uniq -c | sort -rn

# Extraer solo mensajes de error
awk '/error|ERROR/ {for(i=6;i<=NF;i++) printf "%s ", $i; print ""}' /var/log/syslog

Análisis de logs de autenticación:

# Intentos fallidos de inicio de sesión por IP
awk '/Failed password/ {print $(NF-3)}' /var/log/auth.log | sort | uniq -c | sort -rn

# Intentos fallidos de inicio de sesión por usuario
awk '/Failed password/ {print $(NF-5)}' /var/log/auth.log | sort | uniq -c | sort -rn

# Inicios de sesión exitosos
awk '/Accepted password/ {print $(NF-3), $(NF-5)}' /var/log/auth.log

# Contar eventos de autenticación por hora
awk '{print $3}' /var/log/auth.log | cut -d: -f1 | sort | uniq -c

# Uso de comandos sudo
awk '/sudo.*COMMAND/ {for(i=1;i<=NF;i++) if($i=="COMMAND=") {for(j=i+1;j<=NF;j++) printf "%s ", $j; print ""}}' /var/log/auth.log

Análisis de logs de aplicación (JSON):

# Extraer campo JSON específico (requiere alternativa jq en awk)
awk -F'"' '/timestamp/ {print $4}' /var/log/app.json

# Contar por nivel de log
awk -F'"' '/"level"/ {print $4}' /var/log/app.json | sort | uniq -c

# Errores con mensaje
awk -F'"' '/"level":"ERROR"/ {for(i=1;i<=NF;i++) if($i=="message") print $(i+2)}' /var/log/app.json

Combinando grep, sed y awk

Ejemplos Poderosos de Pipelines

Análisis completo de log de acceso:

# IPs principales accediendo a una URL específica
grep "/api/login" /var/log/nginx/access.log | \
    awk '{print $1}' | \
    sort | uniq -c | sort -rn | head -10

# Extraer y analizar errores 404
grep " 404 " /var/log/nginx/access.log | \
    awk '{print $7}' | \
    sort | uniq -c | sort -rn | \
    sed 's/^ *//' | \
    awk '{print $2, ":", $1, "times"}'

# Analizar solicitudes lentas (tiempo de respuesta > 1s)
awk '$NF > 1.0 {print $0}' /var/log/nginx/access.log | \
    sed 's/.*"\([A-Z]*\) \([^ ]*\) .*/\1 \2/' | \
    sort | uniq -c | sort -rn

Análisis de seguridad:

# Identificar intentos de fuerza bruta
grep "Failed password" /var/log/auth.log | \
    awk '{print $(NF-3)}' | \
    sort | uniq -c | \
    awk '$1 > 10 {print "WARNING:", $2, "attempted", $1, "times"}' | \
    sed 's/^/[SECURITY] /'

# Analizar intentos de acceso no autorizado
grep -E "unauthorized|forbidden|denied" /var/log/syslog | \
    awk '{print $5}' | \
    sed 's/\[.*\]://' | \
    sort | uniq -c | sort -rn

# Extraer comandos sospechosos
grep "sudo" /var/log/auth.log | \
    awk '/COMMAND/ {for(i=1;i<=NF;i++) if($i=="COMMAND=") print $(i+1)}' | \
    grep -vE "^/usr/bin/(ls|cat|less|grep)" | \
    sort | uniq -c

Análisis de rendimiento:

# Rendimiento de consultas de base de datos
grep "Query took" /var/log/app/app.log | \
    sed 's/.*Query took \([0-9.]*\)ms.*/\1/' | \
    awk '{sum+=$1; count++; if($1>max) max=$1} END {print "Avg:", sum/count, "ms, Max:", max, "ms, Total queries:", count}'

# Tasa de errores a lo largo del tiempo
grep "ERROR" /var/log/app/app.log | \
    awk '{print substr($1,12,5)}' | \
    uniq -c | \
    awk '{print $2, $1}' | \
    sed 's/^/Time: /' | \
    sed 's/ / - Errors: /'

Scripts de Análisis Automatizado de Logs

Script de Análisis Completo

#!/bin/bash
# log-analyzer.sh - Análisis automatizado de logs

LOG_FILE="/var/log/nginx/access.log"
REPORT_FILE="/tmp/log-analysis-$(date +%Y%m%d-%H%M).txt"

{
    echo "========================================="
    echo "Log Analysis Report"
    echo "Date: $(date)"
    echo "Log File: $LOG_FILE"
    echo "========================================="
    echo ""

    echo "--- Total Requests ---"
    wc -l < "$LOG_FILE"
    echo ""

    echo "--- Top 10 IP Addresses ---"
    awk '{print $1}' "$LOG_FILE" | sort | uniq -c | sort -rn | head -10
    echo ""

    echo "--- HTTP Status Code Distribution ---"
    awk '{print $9}' "$LOG_FILE" | sort | uniq -c | sort -rn
    echo ""

    echo "--- Top 20 Requested URLs ---"
    awk '{print $7}' "$LOG_FILE" | sort | uniq -c | sort -rn | head -20
    echo ""

    echo "--- 404 Errors ---"
    grep " 404 " "$LOG_FILE" | awk '{print $7}' | sort | uniq -c | sort -rn | head -10
    echo ""

    echo "--- 5xx Errors ---"
    grep -E " 5[0-9]{2} " "$LOG_FILE" | wc -l
    if [ $(grep -cE " 5[0-9]{2} " "$LOG_FILE") -gt 0 ]; then
        grep -E " 5[0-9]{2} " "$LOG_FILE" | awk '{print $7}' | sort | uniq -c | sort -rn | head -10
    fi
    echo ""

    echo "--- Requests per Hour ---"
    awk '{print substr($4,14,2)}' "$LOG_FILE" | sort | uniq -c
    echo ""

    echo "--- User Agents (Top 10) ---"
    awk -F'"' '{print $6}' "$LOG_FILE" | sort | uniq -c | sort -rn | head -10
    echo ""

    echo "========================================="
    echo "Report generated: $(date)"
    echo "========================================="

} > "$REPORT_FILE"

echo "Analysis complete. Report saved to: $REPORT_FILE"
cat "$REPORT_FILE"

Monitoreo de Logs en Tiempo Real

#!/bin/bash
# realtime-monitor.sh - Monitoreo de logs en tiempo real con análisis

LOG_FILE="/var/log/syslog"

echo "Monitoring $LOG_FILE for errors..."
echo "Press Ctrl+C to stop"
echo ""

tail -f "$LOG_FILE" | while read line; do
    # Verificar errores
    if echo "$line" | grep -qi "error"; then
        echo "[ERROR] $line" | sed 's/error/\x1b[31mERROR\x1b[0m/i'
    fi

    # Verificar advertencias
    if echo "$line" | grep -qi "warning"; then
        echo "[WARN] $line" | sed 's/warning/\x1b[33mWARNING\x1b[0m/i'
    fi

    # Verificar autenticación fallida
    if echo "$line" | grep -q "Failed password"; then
        IP=$(echo "$line" | awk '{print $(NF-3)}')
        echo "[SECURITY] Failed login from $IP" | sed 's/SECURITY/\x1b[35mSECURITY\x1b[0m/'
    fi
done

Script de Auditoría de Seguridad

#!/bin/bash
# security-audit.sh - Análisis automatizado de logs de seguridad

AUTH_LOG="/var/log/auth.log"
REPORT="/tmp/security-audit-$(date +%Y%m%d).txt"

{
    echo "Security Audit Report"
    echo "====================="
    echo "Date: $(date)"
    echo ""

    echo "--- Failed Login Attempts by IP ---"
    grep "Failed password" "$AUTH_LOG" | \
        awk '{print $(NF-3)}' | \
        sort | uniq -c | sort -rn | \
        awk '$1 > 5 {print "WARNING:", $2, "failed", $1, "times"}'
    echo ""

    echo "--- Failed Login Attempts by User ---"
    grep "Failed password" "$AUTH_LOG" | \
        awk '{print $(NF-5)}' | \
        sort | uniq -c | sort -rn
    echo ""

    echo "--- Successful Root Logins ---"
    grep "Accepted.*root" "$AUTH_LOG" | wc -l
    if [ $(grep -c "Accepted.*root" "$AUTH_LOG") -gt 0 ]; then
        grep "Accepted.*root" "$AUTH_LOG"
    fi
    echo ""

    echo "--- Sudo Commands ---"
    grep "sudo.*COMMAND" "$AUTH_LOG" | \
        awk '{for(i=1;i<=NF;i++) if($i=="USER=") print $(i+1)}' | \
        sort | uniq -c
    echo ""

    echo "--- New User Additions ---"
    grep "useradd" "$AUTH_LOG"
    echo ""

} > "$REPORT"

echo "Security audit complete. Report: $REPORT"
cat "$REPORT"

Mejores Prácticas

Optimización del Rendimiento

Para archivos grandes:

# Usar grep primero para filtrar, luego procesar
grep "ERROR" huge.log | awk '{print $5}'

# Procesar archivos comprimidos sin descomprimir
zgrep "pattern" file.log.gz
zcat file.log.gz | awk '{print $1}'

# Usar mawk para mejor rendimiento con grandes conjuntos de datos
mawk '{print $1}' huge.log

# Limitar procesamiento con head
grep "ERROR" huge.log | head -1000 | awk '{print $5}'

Procesamiento eficiente en memoria:

# No cargar todo el archivo en memoria
awk 'NR % 1000 == 0 {print "Processed", NR, "lines"}' huge.log

# Usar procesamiento de flujo
tail -f /var/log/app.log | grep --line-buffered "ERROR" | awk '{print $0}'

Consejos de Expresiones Regulares

Patrones comunes:

# Dirección IP: \b([0-9]{1,3}\.){3}[0-9]{1,3}\b
# Email: [A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}
# URL: https?://[^\s]+
# UUID: [0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{12}
# Fecha (YYYY-MM-DD): [0-9]{4}-[0-9]{2}-[0-9]{2}
# Hora (HH:MM:SS): [0-9]{2}:[0-9]{2}:[0-9]{2}

Conclusión

Dominar grep, sed y awk para análisis de logs proporciona herramientas potentes, flexibles y eficientes para extraer conocimientos de logs del sistema y aplicaciones. Estas utilidades son rápidas, universalmente disponibles y capaces de procesar gigabytes de datos de logs con un mínimo consumo de recursos.

Puntos clave:

grep - Búsqueda y filtrado rápidos de patrones
sed - Edición de flujos y transformación de texto
awk - Extracción de datos, análisis y generación de informes
Pipelines - Combinar las tres para flujos de trabajo de análisis potentes
Automatización - Crear scripts de tareas de análisis comunes para ejecución regular

Mejores prácticas:

Comenzar con grep para filtrar grandes conjuntos de datos
Usar awk para extracción de datos estructurados y estadísticas
Aplicar sed para transformación y limpieza de texto
Combinar herramientas en pipelines para análisis complejos
Probar patrones primero en muestras pequeñas de datos
Documentar one-liners complejos para referencia futura
Considerar el rendimiento con archivos de logs grandes
Automatizar análisis de rutina con scripts

Aunque las plataformas modernas de análisis de logs ofrecen características avanzadas, las herramientas de línea de comandos siguen siendo indispensables para resolución rápida de problemas, análisis ad-hoc y situaciones donde instalar software adicional no es factible. Estas habilidades fundamentales se trasladan a todos los sistemas tipo Unix y te servirán a lo largo de tu carrera en administración de sistemas y DevOps.

Análisis de Logs con awk, grep y sed

Análisis de Logs con awk, grep y sed

Introducción

Prerrequisitos

Entendiendo los Formatos de Logs

Formatos Comunes de Logs

Dominando grep para Análisis de Logs

Uso Básico de grep

Patrones Avanzados de grep

Ejemplos Prácticos de grep

Dominando sed para Procesamiento de Logs

Uso Básico de sed

Patrones Avanzados de sed

Ejemplos Prácticos de sed

Dominando awk para Análisis de Logs

Uso Básico de awk

Operaciones Avanzadas de awk

Ejemplos Prácticos de awk

Combinando grep, sed y awk

Ejemplos Poderosos de Pipelines

Scripts de Análisis Automatizado de Logs

Script de Análisis Completo

Monitoreo de Logs en Tiempo Real

Script de Auditoría de Seguridad

Mejores Prácticas

Optimización del Rendimiento

Consejos de Expresiones Regulares

Conclusión

Latest Video

Get $20 Free Credit