SRE Archives ⋆ Página 4 de 4 ⋆ OpServices

SRE

SLI: catálogo de exemplos por tipo de serviço e como definir

abril 20, 2022 Pedro Tebaldi

Definir um SLI errado é pior do que não ter nenhum. Um time que monitora o percentual de uptime do servidor acredita estar medindo confiabilidade — mas se os usuários enfrentam timeouts de 30 segundos nas respostas da API, o dashboard permanece verde enquanto a experiência degrada. O Service Level Indicator (SLI) é a métrica […]

SRE

SLO: guia de implementação por vertical de serviço

janeiro 24, 2022 Pedro Tebaldi

Times que tentam implementar SLOs pela primeira vez quase sempre cometem o mesmo erro: definem o objetivo antes de entender o serviço. O resultado são SLOs de 99,99% que consomem o error budget em horas, ou SLOs de 90% que nunca disparam nenhum alerta porque o serviço já opera melhor que isso naturalmente. Um SLO […]

SRE

SRE: o que é Site Reliability Engineering e como implementar

novembro 18, 2021 Pedro Tebaldi

Times de engenharia que crescem rapidamente enfrentam um problema estrutural: à medida que os sistemas se tornam mais complexos, a lacuna entre desenvolvimento e operações se alarga. Desenvolvedores querem lançar features rápido. Operações quer estabilidade. O conflito é real e tem custo concreto — em velocidade de entrega, em incidentes e em retrabalho. O SRE […]

CI/CD - Continuous Integration & Continuous Delivery|Continuous Delivery & Continuous Deployment

SRE

CI/CD: Continuous Integration e Continuous Delivery

agosto 2, 2021 Pedro Tebaldi

Entregar software com qualidade e velocidade ao mesmo tempo era, até pouco tempo, um paradoxo no mercado de tecnologia. Times de desenvolvimento acumulavam semanas de mudanças antes de integrar código, e os lançamentos viravam eventos de alto risco — lentos, manuais e repletos de conflitos. O CI/CD resolve exatamente esse problema. Ao automatizar integração, testes […]

SRE

O que é um downtime, quais são suas causas e como evitá-las?

dezembro 17, 2018 Pedro Tebaldi

Você sabe o que é um downtime? Quando o sistema apresenta problemas como lentidão e paradas inesperadas, sua empresa pode ser severamente prejudicada. Isso porque os impactos negativos de uma parada não agendada podem gerar perda de produtividade e até de receita. Neste artigo, você conhecerá as principais causas e impactos que um downtime provoca […]

o que é MTTR e MTBF|MTTR e MTBF | Relatórios OpMon|ebook observabilidade e monitoramento by Google

SRE

MTTR e MTBF, o que são e quais suas diferenças?

agosto 18, 2015 Pedro Tebaldi

Quando um sistema falha, o tempo que leva para voltar ao ar não é apenas um número técnico: é impacto direto no negócio. Cada minuto de downtime tem custo mensurável, e as equipes de SRE e NOC que não rastreiam métricas de confiabilidade com precisão operam no escuro. MTTR e MTBF são as duas métricas […]

SRE

DevOps: Como criar uma TI de alta perfomance

julho 1, 2015 Pedro Tebaldi

Times de desenvolvimento e operações que trabalhavam em silos separados, lançamentos de software que levavam meses e incidentes em produção que demoravam dias para ser resolvidos — esse era o cenário padrão da TI corporativa até meados dos anos 2000. O DevOps surgiu como resposta a esse problema. Em 2026, é a base operacional de […]

SRE

Custo de downtime: quanto custa a indisponibilidade de TI para o seu negócio

abril 27, 2015 Pedro Tebaldi

Gestores de TI frequentemente enfrentam resistência ao justificar investimentos em monitoramento e alta disponibilidade. O argumento mais comum da liderança é que o sistema “raramente cai”. O problema é que esse raciocínio ignora o custo real de quando o sistema cai — e esse número, na maioria dos casos, é muito maior do que qualquer […]

SLI: catálogo de exemplos por tipo de serviço e como definir

SLO: guia de implementação por vertical de serviço

SRE: o que é Site Reliability Engineering e como implementar

CI/CD: Continuous Integration e Continuous Delivery

O que é um downtime, quais são suas causas e como evitá-las?

MTTR e MTBF, o que são e quais suas diferenças?

DevOps: Como criar uma TI de alta perfomance

Custo de downtime: quanto custa a indisponibilidade de TI para o seu negócio

Quer receber novidades e atualizações?

Soluções

Plataformas

Conteúdo

Redes Sociais

Vamos conversar?

Quer receber novidades e atualizações?

Soluções

Plataformas

Conteúdo

Redes Sociais