Os dados não estruturados são os dados de crescimento mais rápido. Eles estão aumentando a uma taxa composta de crescimento anual de 61%, de acordo com o IDC, e será responsável por 80% dos dados mundiais até 2025. Para muitas grandes empresas de TI, ela ultrapassou essa marca há algum tempo.
O crescimento de dados não estruturados não está mais sendo conduzido pelos “suspeitos usuais” – documentos, planilhas, apresentações, fotos, vídeos e áudio. O ímpeto por trás de seu crescimento hoje são fontes como logs, dispositivos IoT, mídia social, CCTV, sensores, metadados e até mesmo consultas de mecanismos de pesquisa.
A pesquisa da Dragon Slayer Consulting revelou que a maioria dos dados não estruturados na empresa são dados legais (com mais de 30 dias e raramente acessados) ou dados frios (com mais de 90 dias e raramente acessados).
E, no entanto, ele fica em um armazenamento primário caro, consumindo constantemente o orçamento.
O desafio de gerenciar dados não estruturados é como fazer isso de maneira econômica
Dados não estruturados não são facilmente classificados ou indexados, nem são facilmente armazenados em bancos de dados tradicionais. Além disso, normalmente não se origina em bancos de dados equipados para analisá-lo.
Isso significa que os dados devem ser extraídos, transformados e carregados em um banco de dados útil. É um processo trabalhoso, demorado e sujeito a erros que requer scripts ou um provedor de serviço externo.
A movimentação de dados também pode criar várias cópias deles, o que significa mais armazenamento, espaço em rack, portas de switch, licenças de software, energia, resfriamento, cabos, transceptores e sobrecarga alocada.
Isso não faz sentido financeiro.
Gerenciando dados não estruturados – ou não
A abordagem comum para o gerenciamento de dados não estruturados é simplesmente não gerenciá-los. Muitos departamentos de TI optam por adicionar capacidade aos seus sistemas de armazenamento primário em vez de classificar, gerenciar, analisar ou mesmo arquivar dados não estruturados.
Eles descobrem que os dados estão lá se for necessário, no entanto, pode ser difícil de encontrar. O problema com esse método é que ele é financeiramente insustentável por vários motivos.
O primeiro motivo é que os dados consomem capacidade – geralmente, capacidade de armazenamento primário. E, uma vez consumida, essa capacidade não está disponível para outros dados.
O armazenamento primário é o mais caro , geralmente consistindo em algum tipo de mídia SSD flash. O software do sistema de armazenamento e muitos outros tipos de software, como backups e replicações, são licenciados ou assinados com base na capacidade, aumentando o custo dos dados não estruturados, mesmo quando não estão sendo acessados.
Todos os sistemas de armazenamento devem ser atualizados a cada três a cinco anos
Quando um sistema é atualizado, o novo sistema deve incluir capacidade para todos os dados não estruturados existentes, bem como aqueles que serão armazenados durante a vida do novo sistema, adicionando mais infraestrutura e custos.
Além disso, os dados devem ser migrados do antigo para o novo sistema de armazenamento. Isso leva tempo, esforço e software ou scripts.
E não é apenas o armazenamento primário que está sendo consumido. O armazenamento secundário também é necessário, porque todos os dados não estruturados armazenados devem ser submetidos a backup .
Além do custo de fazer backup de dados não estruturados, um custo maior pode ser a recuperação de dados de uma interrupção. O tempo que leva para restaurar dados frios e frios pode atrasar a recuperação e execução dos sistemas, adicionando ainda mais custos a este processo desatualizado.
Outro motivo pelo qual manter dados não estruturados no armazenamento primário cria um problema são as leis e regulamentações globais de privacidade, como a Lei Geral de Proteção de Dados (LGPD).
A conformidade não é opcional e existem consequências financeiras significativas em caso de não conformidade. Isso significa que as organizações de TI devem saber se há informações de identificação pessoal nos dados não estruturados que mantêm e o que são.
Ferramentas de gerenciamento de dados não estruturados
A chave para gerenciar dados não estruturados para otimizar o desempenho e reduzir custos é capturar, coletar, analisar e analisar os metadados. Em alguns casos, como informações pessoais, isso significa analisar o próprio conteúdo.
Diversas empresas possuem produtos e serviços voltados para o gerenciamento de dados não estruturados e seus custos.
Quando o gerenciamento de dados não estruturados é feito corretamente, tudo muda de uma maneira boa. Os dados são movidos, arquivados ou excluídos do armazenamento primário caro para o armazenamento secundário, em nuvem ou em fita mais econômica.
Além disso, o software de gerenciamento de dados determina para onde movê-los com base nas características dos dados não estruturados e nos requisitos de desempenho. O acesso é mantido por meio de software cliente, links simbólicos, namespace global ou combinações destes.
Esses sistemas de gerenciamento de dados inteligentes e autônomos têm diferentes maneiras de acessar e classificar dados não estruturados. Eles montam o arquivo ou armazenamento de objeto com privilégios administrativos , ficam no caminho de dados parecendo um switch ou são executados nos sistemas computacionais capturando os metadados, classificar o conteúdo, copiar, mover, arquivar e excluir dados.
Isso reduz a capacidade consumida no armazenamento primário e backup ou dados replicados no armazenamento secundário.
Feito corretamente, o custo total de gerenciamento de dados não estruturados deve ser menor do que a abordagem anterior de não gerenciá-los.
Sobre a Service IT
Tecnologia é a nossa especialidade! Integradora de soluções e serviços de TI desde 1995, a Service IT possui uma equipe de profissionais altamente treinados e capazes de atender as demandas de tecnologia da sua empresa. E por isso, se responder a perguntas como a que foi feita ainda é um desafio para sua empresa, entre em contato agora mesmo!
A Service IT é especializada em outsourcing e consultoria de tecnologia. Distribuída através de escritórios em Porto Alegre, Curitiba, São Paulo, Rio de Janeiro, Buenos Aires e Santiago, a empresa possui estrutura preparada para atender toda a América Latina. Com um Centro de Operações próprio, a Service IT monitora e gerencia o ambiente de TI de seus principais clientes com foco em infraestrutura, managed services, cloud e segurança.