AIOps: o futuro das operações em Telecom, parte II

aiops-o-futuro-das-operacoes-em-telecom-parte-ii

Ao contrário do que ocorreu com o 2G, 3G e 4G, a operação de uma rede 5G não poderá ser entregue e suportada com sucesso sem o apoio de um Centro de Operações de Rede Inteligente. Ele deverá estar baseado em um modelo AIOps onde juntamos os avanços das tecnologias de AI/ML e de Automação, com toda experiência de operação armazenada pelas operadoras. O AIOps prevê um alto nível de automação assistida por AI (Artificial Intelligence) ou orientada por AI para as operações de TI e Rede:  um salto radical, mas essencial, para os provedores de serviços de Telecomunicação que desejarem alcançar seus objetivos de reduzir custos operacionais e, ao mesmo tempo, aumentar a eficiência. Neste segundo artigo sobre o tema, veremos como e onde aplicamos AIOps, seus benefícios, desafios e as estratégias para sua adoção.

Caso você não tenha visto, confira a primeira parte do artigo – AIOps: o futuro das operações em Telecom.

Como e onde aplicamos AIOps?

Ao olhar para AIOps pela primeira vez, não fica muito claro como e onde ele se encaixa nas categorias, ferramentas ou sistemas existentes nem exatamente quando deve ser usado. O motivo é simples: o AIOps não substitui as ferramentas de monitoramento existentes ou os sistemas de gerenciamento de logs e de tickets, de orquestração e topologia ou de BI.

O que o AIOps propõe é a integração destes diferentes domínios, consumindo e consolidando as informações de todos eles, para fornecer uma imagem final única, mais simplificada e sincronizada para o usuário. As ferramentas atuais já são valiosas por si só, mas as empresas de Telecom têm, por exemplo, entre 6 e 40 diferentes sistemas de monitoramento, que geralmente entregam uma enxurrada de alertas sem contexto e acabam se tornando parte do problema, levando a confusão e atrasos. Com esse enorme volume de dados gerados em diversas ferramentas, costuma ser muito difícil acessar a informação certa em todas as ferramentas ao mesmo tempo, requerendo muito esforço e tempo precioso dos usuários apenas para consolidar e entender. Para complicar um pouco mais estes sistemas estão sempre em constante mudança, o que também exige uma constante adaptação dos usuários! Este é o cenário em que o AIOps entra! 

O AIOps é a melhor opção para processar e combinar esses conjuntos de dados extremamente grandes e heterogêneos, oriundos de várias fontes e onde a correlação multidomínio ou multifuncional é necessária. O AIOps fornece a abordagem mais flexível e completa, ao reunir todas essas diferentes visualizações parciais de um mesmo problema em um único entendimento, extraindo o que realmente é importante para as equipes de operações. Além disso, através do uso do AI/ML o AIOps também relaciona as possíveis causas do problema, sua provável localização e apresenta sugestões das soluções, baseadas nos históricos de problemas ocorridos.

Adicionalmente, quando algum sistema muda, a AI/ML “aprende” sobre esta mudança e se adapta ao novo cenário, o que reduz o impacto de mudanças nos sistemas.

No entanto, o AIOps não se restringe apenas aos serviços de operação de TI & Rede! 

Em todos os departamentos em que temos uma quantidade muito grande de informações sendo gerada, sejam eles sistemas de suporte ao faturamento, sistemas de suporte comerciais, financeiros, jurídicos etc. e que também possuem um histórico considerável de dados já armazenados, o AIOps pode cair como uma luva. É por isso que esta nova abordagem é tão fundamental para as empresas enfrentarem a era da Transformação Digital! 

Quais os benefícios de aplicarmos o AIOps?

A utilização do AIOps traz muitos benefícios para uma empresa, mas ao procurar razões para justificar um projeto, dê uma olhada no que ele pode fornecer para os negócios em geral:

  • Maior satisfação do usuário: o AIOps, ao ajudar de forma proativa a reduzir o tempo necessário para detectar, diagnosticar e corrigir problemas que levam a um aumento na qualidade dos serviços prestados, fornece aos clientes finais grandes experiências, atendendo e excedendo suas expectativas, e com isso aumentado o NPS.
  • Melhoria de Indicadores: com AIOps se aproveitando das capacidades de entender o estado dos serviços, reduzir o que é “ruído” e separar os “alertas” válidos, realizar a análise do problema e propor as soluções, um dos resultados esperados para o suporte de TI e de Rede são a redução dos indicadores do tipo:

O Tempo Médio para Detectar (MTTD) um problema uma vez que o AIOps pode, através da análise em tempo real dos dados recebidos das diversas ferramentas de monitoramento, detectar um problema e identificar mais rapidamente quem deve ser acionado baseado na natureza do problema. o Tempo Médio para Identificar (MTTI) e Tempo médio para diagnosticar (MTTD) o problema e a causa raiz já que o AIOps consolida a informação relevante para o usuário e faz a busca no histórico e na topologia para apontar a possível causa e localização do problema. o Tempo Médio para Reparar (MTTR) e fazer um serviço voltar a funcionar uma vez que o AIOps já traz as possíveis soluções para o usuário aplicar, podendo ser em alguns casos até automatizado a ponto de já executar a ação.

  • Redução de OpEx: um dos principais benefícios do AIOps é que ele ajuda as organizações a aumentar a eficiência operacional, o que economiza tempo e dinheiro. Ao mesmo tempo, melhora a experiência dos usuários ao fornecer análises mais aprimoradas e certeiras, além de permitir uma melhor colaboração na resolução dos problemas.

Quais os desafios para aplicarmos o AIOps?

Grande parte das Telcos afirma que a falta de familiaridade de seus gestores e equipes com a tecnologia de IA/ML representa hoje o maior desafio para a implementação do AIOps. Mudar o pensamento de suas equipes de operações não apenas para experimentar novas ferramentas de AI, mas também para adotar novas abordagens e maneiras de se resolver os problemas é uma dificuldade importante que precisa ser endereçada.

Embora existam alguns executivos que avaliam que, ainda levará uma década ou mais para que usando dados e AI se consiga melhorar a forma como os negócios são feitos e os serviços são entregues aos clientes, é fundamental que as grandes organizações invistam desde já, não apenas em treinamento e formação de desenvolvedores e cientistas de dados, mas também na conscientização cultural e tecnológica de suas equipes nas tecnologias de AI/ML, de modo que suas organizações possam se adaptar com mais facilidade ao uso da AI na operação do dia a dia.

Um outro elemento que desafia a implantação de uma operação AIOps nas empresas está relacionado com a ingestão, normatização e qualidade dos dados oriundos dos diversos sistemas de operação. Para resolver este problema as Telcos precisam criar equipes para gerenciar os projetos relacionados à coleta dos dados para AI, estabelecer processos, fluxos de trabalho e de governança focados em AI para que se consiga lidar com esse aspecto fundamental do AIOps. Além disso, é importante que essa equipe também seja capaz de identificar conjuntos de dados que permitam desenvolver vários casos de uso onde pequenas melhorias obtidas através do AIOps tenham um grande impacto no CapEx e OpEx. 

Outro desafio que as Telcos estão enfrentando é como controlar o comportamento das instâncias de AI que serão implantadas em suas redes e ambientes de TI. A introdução de modelos de AI nas operações transforma o ambiente de produção em um ambiente intrinsecamente dinâmico.

Ao contrário do software tradicional, a AI pode “aprender e evoluir” de forma autônoma quando exposta a novos dados de entrada. Os modelos de IA tendem a ser “caixas pretas”, expostos a vieses e por natureza “não determinísticos”. A possibilidade, por exemplo de que dados corruptos conduzam a comportamentos de AI não intencionais, mas consequentes, é um risco muito sério a ser encarado. Portanto, novos processos de governança são necessários para se avaliar e controlar o comportamento da AI, que deve ser “responsável” e auditável e onde os humanos devem ser capazes de impor sua autoridade nas decisões finais para contornar quaisquer vieses nos conjuntos de dados e no aprendizado, que possam resultar em comportamentos inconsequentes e imprevisíveis.

Quais as estratégias para aplicarmos AIOps?

É fundamental entender que qualquer nova iniciativa de AIOps precisa fazer mais do que apenas focar na tecnologia.  Na verdade, a parte da tecnologia é muitas vezes a parte mais fácil! 

Alinhar os objetivos de negócios à tecnologia, aos processos e às pessoas são onde estão os maiores desafios. Claro que, a situação em cada operador de Telecom é diferente, mas existem alguns pontos que são críticos na definição de uma boa estratégia para se implementar um projeto de AIOps bem-sucedido, onde se constrói confiança e segurança ao longo do caminho. Vejamos: 

  • Comece pequeno, vá devagar e acelere depois 

Comece sua jornada de AIOps identificando uma única área de negócios em que já se pode melhorar drasticamente a experiência de usuários dos clientes. Desta forma você poderá obter resultados relevantes para o negócio com risco mínimo. Escolha fontes de dados relevantes, aplique o AIOps usando estes dados e obtenha conquistas graduais e mensuráveis com várias interações. O progresso poderá até parecer lento no início, mas, começando pequeno, capturando conhecimento e sendo cauteloso, não arriscamos a integridade do serviço. Acertando na primeira implementação, irá te ajudar a obter a adesão dos outros departamentos ao ver os benefícios que o AIOps traz. Engatinhe antes de andar e correr.

  • Defina bem os casos de uso

Definir os casos de uso é uma etapa importante na implementação de qualquer nova tecnologia ou processo. Portanto, uma vez definida a área de negócios escolha um ou dois casos de uso/cargas de trabalho que precisam de melhorias e pergunte:

  • Como o AIOps será usado para atender às metas de negócios?
    • Que desafios serão enfrentados e quais problemas o AIOps ajudará a resolver?  o Dependemos de outros processos ou sistemas de negócios? o Quem são os usuários e como eles interagirão? 

Os casos mais comuns na operação de Telcos estão relacionados à detecção de anomalias/falhas, correlação de eventos, roteamento de tíquetes, redução de notificações e/ou supressão de alarmes/alertas. Novamente, concentre-se naqueles que têm maior probabilidade de entregar resultados rápidos, que não terão efeitos negativos nas operações e que fornecem ganhos para os usuários e para sua equipe. Lembre-se que, definir casos de uso para AIOps envolve a coleta de informações da liderança executiva (por exemplo, o CIO e o CTO), membros das equipes de operações e de atendimento, das equipes de Gerenciamento de Serviços, membros da equipe DevOps e dos proprietários dos serviços ou de aplicativos. 

O envolvimento destas equipes é fundamental, pois reúne um conhecimento essencial das operações e do negócio, tais como quais sistemas envolvidos, tipos de infraestrutura e aplicativos que compõem um serviço etc. 

  • Selecione os indicadores-chave de desempenho (KPIs) e como medi-los

Já que os casos de uso estarão alinhados aos objetivos de negócios, ficará mais fácil identificar os indicadores de desempenho (KPIs) para se avaliar as melhorias. As KPIs típicas de operações podem incluir, por exemplo Tempo Médio para Detectar (MTTD), Tempo Médio para Reconhecer (MTTA), Tempo Médio para Reparar (MTTR), Disponibilidade Mensal, número de interrupções devido a mudanças planejadas ou não planejadas e outros mais. Muitas dessas KPIs já fazem parte do universo das Telcos, mas se uma nova KPI for criada, também estabeleça o processo de medição. E não devemos esquecer: compartilhe os resultados! 

  • Faça o AI ser parte integrante da estratégia de dados

Todos AIOps são alimentados por dados (muitos dados), então as necessidades dos dados para os processos que usam AI/ML precisam ser consideradas como uma parte fundamental na definição da estratégia de dados de cada organização. Para fornecer o combustível necessário para o AIOps, as Telcos precisam implementar ou ajustar as formas de expor os dados nativamente, removê-los dos silos e tornar esses dados acessíveis a para toda a empresa e de preferência em Real Time. Simples de dizer, mas difícil de se realizar.

  • Prepare sua equipe e escolha seu parceiro

O AIOps é uma evolução, não uma revolução, ou seja, apenas maximizará a eficácia de suas operações. Monte uma equipe que entenda a necessidade de ter uma base sólida para que os projetos de AIOps sejam bem-sucedidos. Avalie quais habilidades esta equipe já possui e onde será necessário complementar, seja através de treinamentos específicos para a equipe, ou através da ajuda de um parceiro, com experiência não apenas em AI/ML, BI e Automação, mas também em DevOps, Integração Contínua e Gerenciamento de Mudanças. A nova equipe de operações precisará no mínimo entender como funciona uma AI/ML para que, quando passarem o controle para da operação para o AIOps, essa equipe possa auditar as atividades para ver como o controle automatizado está fazendo seu trabalho.

Com o uso das novas ferramentas de AI/ML estamos falando de conceitos novos para operação, que muitas empresas já começaram a aplicar, mesmo que de forma muito tímida, para tentar prever as falhas de rede e de equipamentos, de uma forma mais rápida e precisa.

O AIOps vem para realizar todo o potencial dessas ferramentas de IA/ML e ajudar a apoiar a evolução da maturidade operacional e organizacional das empresas de Telecom, mas sem esquecer que não se trata apenas da tecnologia, mas também de pessoas e processos que precisam mudar.

Por Claudson Aguiar, Executivo de Desenvolvimento de Negócios e Projetos na IBM