Nesta série de artigos, aspectos importantes das normas da série ISO/IEC 22237 serão abordados. Nesta primeira parte, veremos os conceitos, princípios e classificações da ISO/IEC 22237-1 (parte1).
Porque a ISO/IEC 22337 foi adotada no Brasil?
O comitê do CONMETRO que é o órgão que dá diretrizes sobre a normalização no Brasil, definiu adotar para a avaliação da conformidade e do desempenho da infraestrutura de data centers, a série de normas ISO/IEC 22237-X e ficou a cargo das comissões de estudo da ABNT, a responsabilidade de traduzi-las na forma de norma ABNT NBR-ISO/IEC 22237-X.
Quando se fala em normas para infraestrutura de Data centers, hierarquicamente no topo da cadeia vem a ISO/IEC22237, posto que é uma norma originada em fórum internacional. Em seguida, vem a norma regional europeia, EN50600 e abaixo as normas nacionais acreditadas, ANSI-TIA-942 e ANSI-BICSI-002, ambas originadas em fóruns de associações nacionais americanas. Encontram-se outras normas emitidas por associações de países, porém sem a legitimação de fóruns de normalização e por isso, são pouco utilizadas, ou são usadas apenas localmente nos países de onde surgiram.
Afirmações em ”papers”, ditados por empresas privadas, sem a legitimação de fóruns de normalização, não tem qualquer valor normativo, pois para a utilização em certificação é necessário que a base técnica, seja uma norma acreditada, que cumpra com o padrão internacional de formatação e conteúdo e que tenham sido legitimadas pela sociedade em fóruns de normalização. (veja nosso artigo sobre a “Hierarquia das normas”)
Escopo da ISO/IEC 22237-1
descreve os princípios gerais para data centers, sobre os quais os requisitos da série ABNT NBR ISO/IEC 22237 são baseados;
define os aspectos comuns de data centers incluindo terminologia, parâmetros e modelos de referência (elementos funcionais e suas acomodações) abordando tanto tamanho e complexidade e do seu propósito pretendido;
descreve aspectos gerais das instalações e infraestrutura necessárias para dar suporte aos data centers;
especifica o sistema de classificação, baseado sob o critério de “disponibilidade”, “segurança” e “eficiência energética” sobre o tempo de vida planejado para o data center, para o fornecimento efetivo de instalações e infraestrutura;
detalha as questões a serem abordadas em uma análise de riscos do negócio e do custo operacional, permitindo sua aplicação para a classificação do data center;
fornece referências para operação e gestão de data centers;
A ISO/IEC 22237-X considera que os Data Centers variam em termos de:
propósito (corporativo/uso próprio, co-location, co-hosting ou instalações para operador de rede);
nível de segurança;
tamanho e padrão construtivo (construções móveis/temporárias, ou permanentes).
que os serviços em nuvem podem ser fornecidos por todos os tipos de data center mencionados acima.
A partir destas necessidades e objetivos, para demonstrar a conformidade dos data centers, a série define os requisitos a serem atendidos, em várias normas separadas (“partes”), conforme abaixo.
O objetivo da série ISO/IEC 22237 é orientar aos envolvidos no projeto, planejamento, aquisições, integração, instalações operação e manutenção das instalações e infraestrutura de um data center, através de requisitos e recomendações específicas.
A parte1, NBR-ISO/IEC 22237-1, define os conceitos gerais para o projeto e operação dos data centers. Isto inclui uma análise de riscos do negócio e seus custos operacionais, bem como, um sistema de classificação para data centers com relação a “disponibilidade”, “segurança física” e “habilitação em eficiência energética”.
As NBR-ISO/IEC 22237-2 até a NBR-ISO/IEC 22237-6, especificam os requisitos e recomendações para instalações e infraestrutura particulares para suporte a classificação relevante de “disponibilidade”, “segurança física” e “habilitação em eficiência energética” selecionados da NBR ISO/IEC 22237-1. A NBR-ISO/IEC 22237-7 aborda a parte operacional e de gestão de informação.
Nota do autor: no momento deste artigo (maio/24), algumas das normas acima citadas ainda estavam em processo de tradução na CE da ABNT.
O que deve ser considerado na Análise de Risco
A disponibilidade geral do data center é uma medida da continuidade de suas funções de processamento, armazenamento e transporte de dados. O nível aceitável da disponibilidade geral do data center é determinado por uma série de fatores, incluíndo : análise de impacto no negócio, envolvendo custos associados com a falha na prestação dos serviços, que irá depender de diversos fatores incluindo a função e importância do data center e pressões comerciais originadas externamente (por exemplo, custos de seguros).
Existe uma correspondência direta entre a disponibilidade das infraestruturas especificadas na série ABNT NBR ISO/IEC 22237 e a disponibilidade geral (todos os sistemas inclusos), mas convém reconhecer que a recuperação esperada das funcionalidades do processamento, armazenamento e transporte de dados, como consequência do reparo em falhas na infraestrutura, depende de muitos fatores relacionados à configuração do hardware e software que fornecem essa funcionalidade.
A classificação de cada infraestrutura, na análise de risco do negócio é descrita como capacidade baixa, média, alta e extra alta de prover disponibilidade.
Outras abordagens no mercado, aplicam “porcentagem da disponibilidade” para infraestruturas, mas a série ABNT NBR ISO/IEC 22237 não considera esta abordagem como válida e o Anexo A da norma explica as razões. Abordaremos esta tema especifico em um artigo dedicado.
Visão geral do projeto do Data Center
Data centers diferem em função de seu propósito e também podem diferir bastante entre si, em função da variação de seu tamanho físico, desde um data center em uma edificação abrigando uma pequena quantidade de equipamentos de armazenamento e servidores, para prover serviços de tecnologia da informação aos ocupantes desta edificação; até um data center, abrigando uma grande quantidade desses equipamentos e serviços de tecnologia da informação, por meio de várias redes de telecomunicações internas e externas, que requerem instalações sofisticadas de distribuição de energia e de controle ambiental, abrigadas em uma, ou mais edificações dedicadas, para assegurar a operação do data center.
Espaços e instalações
Abaixo uma visão dos espaços recomendados de um data center de grande porte.
Classe de Disponibilidade X Topologia
As Classes de disponibilidade foram definidas em função da topologia utilizada no projeto, supondo um determinado risco com relação às interrupções de fornecimento da infraestrutura.
Para que o conjunto de instalações e infraestruturas de um data center seja considerado de uma determinada Classe de Disponibilidade, o projeto de cada instalação e infraestrutura, deve atender, ou exceder os objetivos de projeto dessa Classe de Disponibilidade, como definidas abaixo:
Uma solução Classe 1 (caminho único) é apropriada onde o resultado da avaliação de riscos considerar aceitável que:
uma única falha em um elemento funcional pode resultar na perda de capacidade funcional;
uma manutenção planejada pode requerer o desligamento da carga:
Uma solução Classe 2 (caminho único com redundância) é apropriada onde o resultado da avaliação de riscos considerar necessário que:
uma única falha em um dispositivo não pode resultar na perda da capacidade funcional desse caminho, (via dispositivos redundantes).
uma manutenção planejada de rotina em um dispositivo redundante não deve exigir o desligamento da carga.
NOTA Uma falha de um caminho pode resultar em um desligamento não programado da carga, e uma manutenção de rotina em um dispositivo não redundante pode exigir o desligamento planejado da carga.
Uma solução Classe 3 (múltiplos caminhos fornecendo uma solução de operação e/ou reparo concorrente) é apropriada onde o resultado da avaliação de riscos considerar necessário que:
uma falha de um elemento funcional não deve resultar na perda de capacidade funcional
para controle ambiental: embora uma falha em um caminho possa resultar em um desligamento não planejado das cragas, as manutenções de rotina não devem exigir o desligamento planejado da carga, pois o caminho passivo serve para atuar como facilitador da manutenção concorrente, além de reduzir o tempo de recuperação de serviço (minimizando o tempo médio de inatividade) após a falha de um caminho;
manutenção planejada não deve exigir o desligamento da carga.
Todos os caminhos devem ser projetados para sustentar a máxima carga .
Uma solução Classe 4 (solução tolerante a falha, exceto durante manutenção) é apropriada quando o resultado da avaliação de riscos considerar necessário que:
uma falha de um elemento funcional não deve resultar na perda de capacidade funcional
para fornecimento e distribuição de energia: qualquer evento que impacte um elemento funcional não deve resultar no desligamento da carga.
para controle ambiental: uma falha de um caminho não deve resultar no desligamento não planejado da carga;
manutenção planejada não deve exigir o desligamento da carga
Todos os caminhos devem ser projetados para sustentar a máxima carga.
Além do projeto e instalação de soluções técnicas mais sofisticadas, a implementação de Classe de Disponibilidade superior implica na aplicação de estruturas organizacionais efetivas para gerenciar a operação destas soluções técnicas que incluem, mas não estão limitadas a:
disponibilidade de pessoal de serviços treinados;
disponibilidade de peças críticas sobressalentes;
estabelecimento de contratos de manutenção com acordos de níveis de serviços;
acesso rápido a instruções precisas definindo as ações e comunicações requeridas em qualquer caso de falhas.
Segurança física
Cada um dos espaços do data center, independentemente do seu porte ou finalidade, é designado como tendo uma Classe de Proteção específica. Não existe o conceito de classificação de um data center para uma Classe de Proteção determinada.
A segurança física fornecida para o data center influencia tanto a probabilidade quanto o impacto dos eventos de risco já que o objetivo da segurança física é proteger contra:
acesso não autorizado: controle e restrição do acesso;
intrusão: uso de barreiras de proteção às áreas do data center e seu entorno;
eventos ambientais internos: proteção contra incêndios, superaquecimentos, descargas eletrostáticas, água, etc;
eventos ambientais externos: proteção contra enchentes, incêndios, explosões, descargas atmosféricas, perturbações eletromagnéticas e outras.
Habilitação de eficiência energética
A capacidade de medir o consumo de energia e permitir o cálculo e a geração de relatórios de gerenciamento de recursos (por exemplo, eficiência energética, diversidade de fontes) das várias instalações e infraestruturas que suportam a operação de um data center é crítico para o alcance de quaisquer objetivos relacionados.
O proprietário do data center deve definir o nível habilitação de eficiência energética apropriado antes do projeto do data center.
O nível de habilitação de eficiência energética desejado pode ser determinado por:
uma análise operacional de custos;
a aplicação de processos de gestão de recursos e energia de acordo com a ISO/IEC TS 22237-7;
a seleção e aplicação de um ou mais KPIs apropriados para gestão de recursos de acordo com a série ISO/IEC 30134;
requisitos regulamentares locais;
regras definidas pelo usuário.
Três níveis de granularidade para a medição são definidos:
Nível 1 – um regime de medição que fornece informações globais simples para o data center como um todo;
Nível 2 – um regime de medição que fornece informações detalhadas para as instalações e infraestruturas especificas dentro do data center.
Nível 3 – um regime de medição que fornece dados granulares para sistemas dentro dos espaços do data center;
NOTA Estes três níveis de granularidade não são relacionados a nenhuma classe de um determinado KPI.
Processos Operacionais e KPIs
A ISO/IEC TS 22237-7 descreve os processos e os Indicadores Chave de Desempenho (KPIs) para os recursos e gestão de energia que analisa os dados fornecidos pelo monitoramento das infraestruturas de distribuição energia e controle ambiental. As normas da série ISO/IEC 30134 especificam os requisitos detalhados para este tipo de KPI.
Os conceitos operacionais também devem descrever as interfaces de processo entre proprietário, operador, clientes e fornecedores. Processos, papéis e responsabilidades devem ser definidos antes do início da operação. A equipe operacional deve ser instruída sobre a infraestrutura técnica e treinada em procedimentos operacionais, ainda durante a fase de testes de aceitação (veja ISO/IEC TS 22237-7 para mais informações).
Construção
A obra deve ser supervisionada durante toda a construção. A verificação de aceitação (testes e comissionamento) para toda as infraestruturas e para todo o data center é executado, até que o data center esteja operacional. Mais detalhes sobre teste e comissionamento podem ser encontrados na ISO/IEC TS 22237-7.
Princípios de Projeto - Excelência operacional, disponibilidade, confiabilidade e resiliência
O projeto do data center deve considerar como objetivo principal atender a todas as partes da ISO/IEC 22237 e a excelência operacional como objetivo principal independente da Classe de Disponibilidade a ser aplicada.
O projeto do data center deve permitir o fornecimento de informações gerenciais e operacionais requeridas pela ISO/IEC TS 22237-7.
A indústria de data center enfatiza a importância da Disponibilidade das aplicações de TI, sistemas de TI que suportam as aplicações e sistemas de instalações que suportam os sistemas de TI. Além da Disponibilidade, a indústria de data center também deve reconhecer a importância da Confiabilidade e da Resiliência. Em toda a série ISO/IEC 22237, o termo Disponibilidade é utilizado para representar a capacidade geral de um elemento para desempenhar sua função pretendida. Isto inclui não apenas a Disponibilidade do elemento, mas também a Confiabilidade de um elemento e a Resiliência do data center.
Disponibilidade é a capacidade de um elemento de estar em situação de desempenhar a função pretendida, em um momento específico do tempo. Além disto, Disponibilidade é normalmente utilizada para representar o desempenho passado de um elemento através da medição do período de tempo que o elemento esta operando como pretendido e da medição do tempo que um elemento não operou como pretendido.
Confiabilidade é a capacidade de um elemento estar em situação de realizar sua função pretendida por um determinado intervalo de tempo.
Resiliência é a capacidade de um data center de resistir a falhas em um ou mais elementos e a capacidade de atender seu nível de serviço especificado, durante a falha de um ou mais elementos.
O projeto e a implementação de data centers devem considerar a Resiliência como um objetivo principal, independente da Classe de Disponibilidade aplicada. A Resiliência pode ser aprimorada pela otimização estrutural, com o uso de elementos funcionais mais resilientes, e pela excelência operacional. Para determinar os diferentes aspectos da Resiliência, são necessários KPIs dedicados. Para a otimização da Resiliência, análises quantitativas baseadas em KPIs devem estar envolvidas no processo de projeto e implementação.
Fonte: o texto foi baseado em uma tradução livre da ISO/IEC 22237-1.
Comments