ITIL v3 – Operação de Serviço – Parte 1

É na “Operação de Serviço” que se coordena e realiza as atividades e processos necessários para fornecer e gerenciar serviços em níveis acordados com o usuário e clientes do negócio.

Irei abordar nesta parte os seguintes Gerenciamentos:

  • de Incidente;
  • de Evento;
  • de Problema;
  • de Acesso;

Gerenciamento de Incidentes

Antes de entendermos o que este processo faz, devemos entender o conceito de “incidente”, que é uma interrupção não planejada ou redução na qualidade de um serviço de TI. Vejamos alguns exemplos:

  • Sistema com lentidão;
  • Mensagem de erro em um aplicativo;
  • Informações erradas na tela do sistema;
  • Impressora não imprime;
  • Sem conexão com internet;
  • Falha de um disco rígido, mesmo que de um conjunto de discos espelhados;
  • O computador não liga;
  • Backup falhou;
  • Vírus que corrompeu arquivos;

O Gerenciamento de Incidentes tem como objetivo principal restaurar a operação do serviço normal o mais rápido possível e minimizar o impacto causado sobre as operações do negócio, visando sempre uma ótima qualidade de serviço e disponibilidade. Dentro da “Operação de Serviços”, este é um dos processos mais importante.

Este processo vai lidar com todos os incidentes, que podem ser questões, falhas ou consultas dos usuários, que são realizadas através de telefone para a central de serviço, ou pela equipe técnica.

Ao implantar este tipo de gerenciamento, devemos levar em consideração:

  1. Limites de Tempo – Eles precisam ser acordados para todas as fases  do processo, baseados nas metas de tempo de resposta e resolução dentro do ANS (Acordos de Nível de Serviço), e usados como metas nos ANO (Acordos de Nível Operacional) e nos contratos com fornecedores;
  2. Modelos de Incidentes – Determinam os passos para tratar os incidentes;
  3. Incidentes Graves – São aqueles que tem um alto impacto nas áreas de negócio. Procedimentos separados são necessários para tratar incidentes graves, com limites de tempo menores e com alta prioridade.

O Gerenciamento de Incidentes tem relação com:

  • Ger. de Problemas – Incidentes são causados por problemas que precisam ser resolvidos, que serão reportados. Além disso, os erros conhecidos documentados pelo Ger. de Problemas serão utilizados para agilizar a resolução de incidentes;
  • Ger. de Configuração – utilizado para identificar os componentes associados ao serviço e avaliar o impacto de um incidente;
  • Ger. de Mudança – para implantar uma solução de contorno pode ser necessário abrir uma Requisição de Mudança (RDM);
  • Ger. de Capacidade – O Ger. de Incidente pode Incidente pode solicitar o monitoramento de desempenho. O Ger. de Capacidade fornece soluções de contorno para os incidentes;
  • Ger. de Disponibilidade – usa dados dos incidentes para determinar a disponibilidade dos serviços (ciclo expandido do incidente);
  • Ger. de Nível de Serviços (GNS) – O Ger. de Incidentes fornece relatórios para o GNS, fazendo com que ele estabeleça metas para o Ger. de Incidentes funcionar.

O Gerente de Incidente tem os seguintes papéis:

  • Buscar a eficiência e eficácia do processo;
  • Produzir informações gerenciais, como relatórios de atendimento e de tipos de incidentes;
  • Gerenciar o trabalho das equipes de suporte nível I e II;
  • Gerenciar os incidentes graves;
  • Desenvolver e manter processos e procedimentos;

Gerenciamento de Evento

A definição de “Evento” é qualquer ocorrência que tem significado para o gerenciamento de uma infraestrutura de TI ou entrega de serviço de TI, e a avaliação de impacto que um desvio pode causar aos serviços. Já um “Alerta”, significa um aviso de que um limite foi alcançado, alguma coisa mudou, ou ocorreu uma falha, sendo estes criados por ferramentas de monitoramento.

Podemos separar os eventos em três tipos:

  • Operação regular – Usuário se logou no aplicativo, o job agendado foi executado com sucesso, etc;
  • Exceção – Software de inventário identificou um software não autorizado no PC de um usuário, o usuário fez mais de 3 tentativas de acesso ao aplicativo, etc;
  • Operação não usual, mas que não são exceção – operação levou o triplo de tempo para executar, uso da memória está 10% acima do nível aceitável de desempenho, etc;

A Operação de Serviço eficiente depende da situação da infraestrutura e de se detectar qualquer desvio da normalidade ou esperada. É necessário ter bons sistemas de monitoração e controles implantados, que são baseados em dois tipos de ferramentas:

  • Ferramentas ativas de monitoração que avaliam os principais pontos de configuração, determinando sua situação e disponibilidade, gerando um alerta quando necessário, para que a equipe tome uma ação corretiva;
  • Ferramentas passivas de monitoração que detectam e correlacionam alertas operacionais ou comunicações geradas por Itens de Configuração.

Basicamente o objetivo aqui é detectar os eventos, entendê-los e determinar ações de controle apropriada para cada um deles.

Dentro da infraestrutura de TI vão ocorrer muitos eventos, onde os servidores irão gerar os logs de eventos, os aplicativos geram os eventos, o software antivírus gera eventos, as ferramentas de redes monitoramento de rede podem gerar eventos. Ou seja, podem existir várias fontes de eventos, inclusive eventos fora dos padrões esperados, ou simplesmente os eventos que foram gerados por terem seguido a rota padrão.

Seus objetivos são:

  • Detectar e analisar eventos;
  • Determinar ações de controle apropriadas;
  • Automatizar atividades do Ger. de Operações;
  • Fornecer um ponto de entrada para execução de processos e atividades;
  • Comparar o desempenho atual e comprometido X padrões de desenho e Acordos de Nível de Operação (ANOs) e Acordos de Nível de Serviço (ANSs).

O Ger. de Evento pode ser aplicado a qualquer coisa dentro do Ger. de Serviços que precisem ser controlados e que pode ser automatizado, como: Itens de Configuração (Switch, etc); Condição do ambiente (detector de fumaça); Monitoramento das licenças de softwares; Atividade normal (monitoramento de aplicativo, desempenho do servidor, etc).

Não é necessário ter um Gerente de Evento, pois as atividades são delegadas às áreas de TI como a central de serviços e Ger. de Operações.

  • Central de Serviço:
    • Comunica as informações para quem for necessário;
    • Investiga e resolve eventos – escala para o grupo de operações apropriado;
  • Desenho de Serviço:
    • Classifica e define mecanismos de correlações e auto-respostas;
  • Transição de Serviço:
    • Assegura o funcionamento apropriado;
  • Operação de Serviço:
    • Executa o Gerenciamento de Eventos para os sistemas que estão sob os seus controles;
  • Gerenciamento de Aplicativo e Técnico:
    • São envolvidos em eventos relacionados;

Gerenciamento de Problema

O objetivo principal do Gerenciamento de Problema acompanhar todo o ciclo de vida dos problemas identificando as causas principais dos problemas e minimizar ao máximo seus impactos na infraestrutura de TI do negócio, e prevenir que estes mesmos problemas voltem a acontecer novamente.

Vejamos alguns conceitos para entendermos melhor este Gerenciamento:

  • Problema – é uma causa subjacente de um ou mais incidentes;
  • Solução de Contorno – serve para reduzir ou eliminar o impacto de um incidente ou problema para qual ainda não existe um solução definitiva documentada;
  • Base de Dados de Erros Conhecidos (BDEC) – Onde são armazenados os tipos de problemas e incidentes que já foram e como foram enfrentados, dando uma solução rápida caso se repitam;
  • Erro Conhecido – é um problema diagnosticado com sucesso, onde a sua solução de contorno já está documentada.

Temos aqui também um elemento proativo de resolução de problemas. O conceito é identificar e facilitar a remoção de erros antes que eles se manifestem como reclamações ou perguntas de usuários finais. Com isso, o Gerenciamento do Conhecimento tem uma relação estreita com o Ger. de Problema, já que utilizam uma base de dados de erros conhecidos que serão usados por ambos.

Principais diferenças entre o Ger. de Problema e o de Incidente:

  • O Ger. de Incidente tem foco na recuperação do serviço de forma rápida, utilizando soluções de contorno disponíveis na base de erros conhecidos. Estas soluções de contorno são produzidas pelo Ger. de Problema;
  • O Ger. de Incidente não faz a investigação para encontrar a causa do problema, o que é função do Ger. de Problema, com o objetivo de encontrar uma solução definitiva para o problema;
  • O Ger. de Incidente é totalmente reativo, ou seja, só é iniciado quando for reportado algum incidente. Já o Ger. de Problema pode ser reativo ou proativo;
Suas atividades consistem em:
  1. Identificação;
  2. Registro;
  3. Classificação;
  4. Priorização;
  5. Investigação e diagnóstico;
  6. Identificação e erros conhecidos;
  7. Resolução de problemas;
  8. Encerramento;
  9. Revisão de problema grave.
Veja abaixo com quais outros Gerenciamentos o de Problema tem relação e como acontece:
  • Ger. de Mudança – o Ger. de Problema levanta Requisição De Mudanças (RDMs) para corrigir erros;
  • Ger. de Configuração – o Sistema de Gerenciamento de Configuração (SGC) é usado para identificar se existe alguma coisa errada em relação aos Itens de Configuração (ICs) usados no serviço;
  • Ger. da Liberação e Implantação – é responsável pelo lançamento de correções de problemas no ambiente de produção;
  • Ger. de Disponibilidade – vai trabalhar em conjunto com o Ger. de Problema de forma proativa para identificar formas de reduzir o downtime;
  • Ger. de Capacidade – alguns problemas vão requerer investigação pelo Ger. de Capacidade, auxiliando em medidas proativas;
  • Ger. da Continuidade do Serviço de TI – se um problema não for resolvido a tempo, pode ser necessário invocar o plano de continuidade;
  • Ger. de Nível de Serviço – O Ger. de Problema contribui para alcançar as metas de qualidade, ajudando a prevenir acidentes e problemas;
  • Ger. Financeiro – O Ger. de Problema fornece informações de custos para resolver e prevenir problemas.
O Gerente de Problema tem as atribuições de o grupo de resoluções de problemas (grupo de suporte técnico ou fornecedores externos) para assegurar que os problemas sejam solucionados dentro das metas do Acordo de Nível de Serviço (ANS), proteger e ter propriedade do BDEC, controlar o registro de todos os erros conhecidos, acompanhar o encerramento formal de todos os registros de problemas e organizar, conduzir, documentar e acompanhar todas as atividades de revisão.

Gerenciamento de Acesso / de Direito / de Perfis

Basicamente sua função é conceder ou negar o acesso de determinados usuários a certos serviços ou grupos de serviços disponíveis. Também tem a função de executar as políticas de segurança estabelecidas no processo de Ger. de Segurança da Informação.

Um “acesso” refere-se ao nível e extensão de funcionalidades de um serviço ou dados que um usuário tem permissão para usar.

Uma “identidade” é a informação que distingue cada usuário dentro da organização, sendo única para cada usuário.

Os “Direitos” ou “Privilégios” são as configurações que o usuário pode acessar um serviço ou grupo de serviços. Serviços que incluem o direito à leitura, escrita, execução e exclusão de dados.

Os “Serviços” ou “Grupo de Serviços” são os serviços disponibilizados a um usuário ou grupo de usuários, sendo convencional criar um perfil-padrão (ou grupo) e associar usuários a este perfil. Ao invés de dar acesso ao usuário para cada serviço, ele é associado a um determinado grupo do qual herda todos os privilégios de acesso.

Os “Serviços de Diretório” é um tipo de ferramenta específica que é usada para gerenciar acessos e direitos. Exemplo: Active Directory (Windows) e OpenLDAP (Linux).

Suas atividades são:

  1. Requisição de acesso ou restrição – este requisição pode ser feita no processo “Cumprimento de Serviço”;
  2. Verificação – verificar cada requisição por um serviço de TI para identificar sua legitimidade de uso;
  3. Fornecimento de direitos – este processo não decide quem ganha acesso a qual serviço, apenas executa a política e as regras definidas na Estratégia de Serviço e no Desenho de Serviço;
  4. Monitoramento do status da identidade – No caso de um funcionário for demitido ou promovido, seu perfil de acesso deve ser alterado de acordo com o fato;
  5. Registro (log) e rastreamento de acesso – este processo não responde às requisições de acesso, mas garante que os direitos foram concedidos de forma correta;
  6. Remoção e restrições de direitos – Assim como é responsável por conceder acesso a um serviço, o Ger. de Acesso é responsável por remover este direito. Ele não toma a decisão, apenas executa.

Neste Gerenciamento, não há necessidade de se ter um Gerente de Acesso, pois normalmente é função do Gerenciamento de Segurança e da Disponibilidade, mas cabe a eles criar as definições das políticas, práticas e procedimentos, e comunicados para outros grupos e indivíduos.

Alguns dos envolvidos nas atividades deste processo são:

  • Central de Serviços – Atuando na parte inicial, verificando a validade das requisições de acesso com a tabela de autoridades. A Central de Serviço pode conceder os níveis mais baixos de privilégios. Já os mais altos, precisam ser escalados para um grupo funcional mais específico,  como acesso a sistemas críticos ou de segurança.
  • Gerenciamento Técnico e de Aplicativo – Estas duas executam partes diferentes para o Gerenciamento de Acesso durante o ciclo de vida:
    • No Desenho de Serviço, garantir que controles foram criados e definir contramedidas para abusos;
    • Na Transição de Serviço, testar os controles projetados;
    • Nas Operações de Serviços, executar o Ger. de Acesso para os sistemas dentro das suas áreas de controle, e vai lidar com incidentes e problemas relacionados a acesso;
  • Ger. de Operação de TI – o Gerente de Operações de TI precisa assegurar que procedimentos de operações-padrão atendem às questões do Gerenciamento de Acesso. Também irão reportar acessos existentes e requisições que foram rejeitadas.

Sou bacharel em Sistemas de Informação pela Estácio de Sá (Alagoas), especialista em Gestão Estratégica da Tecnologia da Informação pela Univ. Gama Filho (UGF) e pós-graduando em Gestão da Segurança da Informação pela Univ. do Sul de Santa Catarina (UNISUL). Certificações que possuo: EC-Council CEH, CompTIA (Security+, CySA+ e Pentest+), EXIN (EHF e ISO 27001), MCSO, MCRM, ITIL v3. Tenho interesse por todas as áreas da informática, mas em especial em Gestão e Governança de TI, Segurança da Informação e Ethical Hacking.

7 Responses to “ITIL v3 – Operação de Serviço – Parte 1”

  1. DÉBORAH SUELLEN FERREIRA GONÇALVES disse:

    Gostei do seu post.Estou desenvolvendo minha monografia sobre Gerenciamento de Incidentes ITILV3. Na minha pesquisa vou falar sobre Operação de serviços em especifico vou explorar uma ferramenta livre com as boas práticas ITIL V3 falando de gerenciamento de incidentes e mostrando o funcionamento da ferramenta. Se poder me indicar algumas ferramentas livres e fontes de pesquisas ficarei muito grata. Obrigada.

  2. Morgana Almeida disse:

    Olá, caro Diego!

    Gostaria de tirar uma dúvida.

    Supomos que um usuário solicita o acesso a um sistema. O mesmo foi criado e dado o acesso solicitado, porém este usuário não consegue alterar a senha provisória enviada a ele. Além disso, estão aparecendo outros projetos dentro do sistema que não diz respeito a esse usuário.

    Nesse caso, essa solicitação de serviço feita na Central de Atendimento foi concluída por completo?
    Mesmo o usuário alegando essa falha, pode ser dado como concluída a sua solicitação?

Deixe um comentário para Diego Macêdo Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *