Production горит
Когда алерт пришёл в 03:17, а в описании только “something went wrong”.
DevOpsim.pro — место, где падающий production превращается в мем, а полезные практики CI/CD, Linux, Docker, Kubernetes и мониторинга объясняются простым языком.
Ситуации, которые знакомы каждому: ночные алерты, странные деплои, внезапные хотфиксы и вечное “а что в логах?”.
Когда алерт пришёл в 03:17, а в описании только “something went wrong”.
До тех пор, пока контейнер не собирается, volume не монтируется, а сеть живёт своей жизнью.
Просто Pod, Deployment, Service, Ingress, ConfigMap, Secret, HPA, RBAC и три часа в документации.
“У нас есть staging”. На деле это production, только без мониторинга.
Коммит удалили, историю переписали, но токен уже видел весь интернет.
Зелёный pipeline ещё не значит, что приложение работает. Но звучит уверенно.
Короткие практики, которые снижают хаос в инфраструктуре, ускоряют расследования и помогают не ломать production.
Контейнер может быть запущен, но приложение внутри уже не отвечает. Healthcheck помогает оркестратору понять реальное состояние сервиса.
HEALTHCHECK CMD curl -f http://localhost:8080/health
Пароли, токены, ключи API и приватные сертификаты должны храниться в secret manager, а не в Git.
git-secrets, trufflehog, gitleaks
Хороший деплой — это не только быстрое обновление, но и быстрый возврат на стабильную версию.
kubectl rollout undo deployment/app
Добавляй request ID, пользователя, сервис, код ошибки и контекст. Без этого расследование превращается в гадание.
trace_id, user_id, service, error_code
Следи за latency, error rate, saturation, очередями, временем ответа БД и бизнес-метриками.
RED / USE / SLI / SLO
Если команда выполнялась руками больше двух раз — скорее всего, ей место в скрипте, Ansible, Terraform или pipeline.
make deploy ENV=prod
DevOpsim.pro создан для инженеров, администраторов, SRE, разработчиков и всех, кто хоть раз говорил: “Сейчас быстро задеплоим”.
Что тут будет?