Gama de Produtos
Artigo Técnico
Gerenciamento Eficiente da Infraestrutura de Engenharia do Datacenter
Escalando a Diversidade
Dois circuitos de controle podem ser distintos na infraestrutura de engenharia de um datacenter. Um deles lida com o resfriamento e a distribuição de energia no nível do gabinete, enquanto o outro trabalha no nível de toda a instalação e lida não apenas com energia e ar condicionado, mas também com vários subsistemas auxiliares (supressão de incêndio, controle de acesso e outros). Frequentemente, esses circuitos e até seus componentes são independentes um do outro e são operados por diferentes equipes de operadores.
As empresas nem sempre estão dispostas a comprar soluções integradas para gerenciamento de infraestrutura de engenharia. Geralmente, os datacenters comerciais não têm essa opção. No entanto, no segmento corporativo, não é incomum a administração da empresa tentar economizar dinheiro e concordar em incluir apenas sistemas fragmentados para aparelhos de ar condicionado e UPS na estimativa. A falta de comunicação entre os circuitos de controle, os diferentes níveis de automação dos subsistemas do datacenter e uma frota de diferentes fornecedores de equipamentos complicam o trabalho coordenado de todas as partes da instalação, impossibilitando a otimização.
Modos de Controle
No pior cenário de pequena escala, os subsistemas do datacenter são controlados manualmente e a instalação e a movimentação de equipamentos são documentadas usando o Microsoft Excel. Muitas vezes, a papelada é uma bagunça, o que é bastante natural, pois manter um banco de dados correto usando planilhas é uma tarefa muito desafiadora. Quando a quantidade de gabinetes é medida em dezenas, problemas com a contabilidade manual são inevitáveis. A substituição de equipamentos em um datacenter ocorre apenas quando ocorre uma falha, o que aumenta os custos indiretos e o tempo de inatividade em caso de acidente.
Se o tempo de inatividade for crítico para os proprietários do datacenter, o modelo de controle reativo será usado. Nesse caso, o procedimento de solução de problemas é regulamentado e a documentação que o acompanha é mantida. No entanto, o processo é baseado na experiência dos colaboradores e no conhecimento de um datacenter específico. Em caso de acidente, o problema é eliminado com rapidez suficiente, mas existem sérias dificuldades no que diz respeito à prevenção devido à falta de oportunidades para uma análise abrangente das causas de um mau funcionamento. Em uma situação em que apenas alguns especialistas sabem como lidar com todos os processos de gerenciamento de instalações e, no caso, por exemplo, de um especialista ser demitido, surgem novos problemas.
Um modelo de gerenciamento mais avançado é sempre orientado a serviços. Ele pressupõe a presença de papelada completa, cobrindo todos os subsistemas de uma instalação. Ele define claramente as regras e procedimentos para substituição e manutenção preventiva de equipamentos e mantém uma contabilidade completa de sua instalação e movimentação, enquanto os serviços operacionais preparam relatórios sobre os parâmetros de sistemas de engenharia, acidentes e ações executadas pelo pessoal para eliminá-los.
A principal característica da abordagem orientada a serviços para gerenciamento de datacenter é a proatividade. Esse modelo não apenas permite analisar as causas dos erros, mas também antecipar problemas antes que eles ocorram. Soluções alternativas para restaurar rapidamente a disponibilidade de serviços podem ser estabelecidas. Obviamente, essa abordagem é impossível sem a introdução de um único sistema automatizado de monitoramento e despacho para todos os subsistemas críticos de datacenter. A prática mostra que as ações dos colaboradores costumam causar falhas. Sempre há uma escassez de especialistas altamente qualificados, mas se o centro de expedição for automatizado e todas as regras e regulamentos de manutenção da instalação forem formalizados, a maioria do pessoal precisará apenas de conhecimentos básicos.
Monitoramento e Despacho
Há cerca de dez anos, as soluções de DCIM (sigla em inglês para Gerenciamento de Infraestrutura em Datacenters), que combinam todos os subsistemas de engenharia em uma única estrutura lógica, apareceram no mercado. As primeiras versões do DCIM permitiram elaborar esquemas/planos de objetos e manter a papelada, mas agora sua funcionalidade mudou significativamente. Soluções modernas podem interagir com as ferramentas de monitoramento integradas aos equipamentos de diferentes fabricantes e conectar sensores, controladores, conversores de sinal e sistemas de coleta de dados adicionais. Na maioria das vezes, são coletadas informações sobre o consumo de energia em todos os níveis, até o nível do gabinete, temperatura e umidade em gabinetes, sistemas de refrigeração e dutos internos, além de dados sobre vazamentos de fluidos. É o mínimo necessário para atingir o objetivo pretendido.
Quando o DCIM está em vigor, o cliente recebe um ambiente integrado de monitoramento e controle que inclui todos os subsistemas críticos e até equipamentos de TI em alguns casos. Sua principal tarefa é combinar os fluxos de dados provenientes do número máximo de fontes disponíveis. As informações são coletadas e processadas em tempo real, o que fornece ao pessoal de serviço uma imagem completa do funcionamento de todos os subsistemas do datacenter, incluindo, se necessário, sua potência de computação. É aqui que vemos outra vantagem do DCIM, que está reduzindo o impacto de fatores humanos no desempenho dos subsistemas de datacenter.
O Problema da Escolha
Pode haver diferentes cenários para sua introdução, mas é melhor definir o DCIM no estágio de design da instalação. Existem também opções para integrar subsistemas independentes existentes usando equipamentos de diferentes fabricantes. A escolha de uma solução no estágio de design do datacenter não causa problemas; isso geralmente é feito por um integrador de sistemas que ajuda a escolher o hardware e o software necessários.
A situação com um datacenter existente é muito mais complicada. Nesse caso, é necessário reunir um grupo de trabalho, incluindo representantes de todos os departamentos interessados. É necessário fazer uma lista de todos os parâmetros e nós da infraestrutura que serão monitorados e organizá-los em ordem decrescente de importância. Em seguida, é necessário auditar os protocolos e os meios de comunicação suportados pelo equipamento de infraestrutura, bem como considerar quais sensores e controladores adicionais terão que ser instalados.
Com todas essas informações, você pode selecionar as soluções de software necessárias, listar equipamentos adicionais e calcular o orçamento do projeto. É uma excelente ideia terceirizar completamente a introdução do DCIM no objeto existente. Erros no estágio de design custarão mais do que os serviços do integrador de sistemas. Inicialmente, os sistemas DCIM eram locais, mas agora muitos desenvolvedores começam a oferecê-los como um serviço (SaaS). Essa abordagem permite uma redução significativa nas despesas de capital.
Pontos de Otimização
O principal item na estrutura das despesas operacionais do datacenter é o custo da eletricidade. A operação de equipamentos de TI e sistemas de refrigeração gera altas contas de energia elétrica. Portanto, otimizar o consumo de energia é uma prioridade. Isso depende de um vasto número de fatores externos e internos. Por exemplo, condições climáticas e atmosféricas, incluindo mudanças sazonais, afetam diretamente os sistemas de resfriamento. Pode-se também adicionar picos e quedas na carga de equipamentos de computação e telecomunicações e dezenas de outras nuances. É impossível levar todas elas em consideração manualmente, mas o sistema DCIM permitirá que você acumule estatísticas operacionais reais e as analise, identificando áreas problemáticas na infraestrutura da instalação.
Um dos indicadores mais críticos para um datacenter é o coeficiente de Eficiência na Utilização de Energia (PUE), que mostra quanta energia é gasta na operação de carga de TI e quanto é gasta em necessidades auxiliares, como resfriamento e operação do UPS, e perdas no sistema de distribuição. É calculado dividindo o consumo total de energia pelo consumo de equipamentos de TI. Até recentemente, o fator de PUE de 1,6 a 2,0 era considerado aceitável. Agora, no entanto, o mercado exige datacenters mais eficientes; portanto, a luta pelos valores a partir de 1,1 a 1,2 continua. Na maioria das vezes, o consumo é medido na saída do UPS, na saída da unidade de distribuição de energia e no uso real de equipamentos de TI.
Com base nos dados obtidos, é possível determinar a eficiência energética do datacenter com bastante precisão. No entanto, a PUE não reflete todas as nuances associadas a ela. Esse fator ainda é importante, mas não permite, por exemplo, levar em consideração o tempo de inatividade dos servidores ou identificar pontos de acesso problemáticos. Além disso, reduzir a PUE a valores próximos de um geralmente ocorre em detrimento da confiabilidade do datacenter - acidentes e uma redução da vida útil dos equipamentos podem negar o efeito da economia de energia.
Os modernos sistemas de controle coletam dados de consumo de energia de servidores, gabinetes e equipamentos de distribuição. É ainda possível monitorar cada tomada. As estatísticas sobre o consumo de recursos críticos podem ser visualizadas de forma fácil de entender, o que facilita a localização das áreas com maior consumo de energia e a otimização de custos. Os períodos de redução de carga também podem ser identificados para agendar a manutenção durante esses períodos. A análise de pico de consumo permite manter a reserva de energia na faixa de 10%-15% em vez de 30%-40%, como no caso do controle manual. Além disso, é uma economia significativa também.
As soluções da classe DCIM também monitoram outros subsistemas de engenharia. Por exemplo, eles ajudam a mapear o fluxo de ar para identificar áreas problemáticas do sistema de ar condicionado e controle climático, que perdem apenas para os equipamentos de TI em termos de consumo de eletricidade no datacenter. Não se esqueça da solução de problemas antes que ocorram problemas sérios, e da prevenção e eliminação rápida dos problemas, o que aumenta a confiabilidade da infraestrutura e também reduz os custos. O controle manual é possível apenas no caso de uma pequena sala de servidores, mas quando existem dezenas ou mesmo centenas de gabinetes na sala de servidores, a introdução do DCIM se torna uma necessidade.
Panorama da Indústria
Até o momento, falamos apenas sobre a infraestrutura de engenharia, porque o gerenciamento da infraestrutura de TI é considerado uma tarefa separada. Geralmente, isso é feito usando sistemas que não estão relacionados ao DCIM. Quando se trata de datacenters comerciais, o trabalho dos equipamentos de TI é de responsabilidade dos clientes. No entanto, o desenvolvimento da virtualização e da arquitetura convergente/hiperconvergente está gradualmente mudando a situação. Hoje, os desenvolvedores estão desenvolvendo as soluções que permitem o monitoramento em tempo real do status dos servidores virtuais em dispositivos físicos individuais, e os fornecedores de TI estão incorporando um grande número de sensores aos seus produtos para monitorar o consumo de energia e a temperatura.
O planejamento eficaz da carga em ambientes virtuais deve cobrir todos os níveis: sistemas operacionais e aplicativos, servidores, sistemas de armazenamento, equipamentos de telecomunicações e canais de comunicação e, é claro, recursos físicos, como energia, refrigeração, umidificação e outros. As soluções DCIM não são mais uma “coisa em si” nos grandes datacenters corporativos. Sua estreita integração com plataformas de virtualização e sistemas de gerenciamento de infraestrutura de TI é apenas uma questão num futuro próximo.