Prepare-se para o crescimento acelerado de dados

O Big Data ganha notoriedade e cada vez mais as organizações estão se perguntando de que forma esse modelo pode ajudar a levar inteligência para os negócios e ampliar a competitividade. Mas, enquanto a consciência sobre esse tema ainda cresce, apenas algumas companhias, como Google ou Facebook, estão realmente em posição para beneficiar-se desse fenômeno.

Com os negócios mudando rapidamente, companhias esperam tirar proveito de tecnologias como o Hadoop. Para isso, vão precisar renovar a infraestrutura para garantir o sucesso do Big Data e ainda contar com a segurança adequada do ambiente.

Nos próximos três a cinco anos, veremos um abismo entre empresas que sabem explorar Big Data e aquelas que não entendem o seu poder, afirma Kaylan Viswanathan, diretor global de gerenciamento de informações da Tata Consultancy Services (TCS). Segundo ele, as companhias que conseguirem transformar dados em informações estratégicas terão grande vantagem competitiva.

“Hoje, a maioria das empresas está ciente do que é Big Data. A consciência está bastante difundida, mas se você olhar para sua exploração, diria que estamos em estágio inicial”, analisa Viswanathan.

O diretor da TCS acredita que as companhias de internet localizadas no Vale do Silício, nos Estados Unidos, como Facebook e Google, que se baseiam na gestão e exploração de dados, estão levando vantagem no manuseio de Big Data. Setores como o de finanças não estão muito atrás, aponta, assim como os serviços militares. Segmentos de varejo, telecomunicações, saúde e manufatura seguirão a mesma trilha.

“Aqueles que conseguirem explorar Big Data em pouco tempo serão líderes de mercado em seus segmentos”, projeta Viswanathan. “Eles serão os únicos que tendem a não esperar até que os outros explorem novas tecnologias”, completa.

Contribuição para os negócios
E de que forma Big Data poderia ajudar uma empresa? Uma companhia farmacêutica pode, por exemplo, identificar os Top 100 formadores de opinião no mundo farmacêutico. Para fazer isso, poderia rastrear a web e ir a milhões de páginas relacionadas ao seu segmento. Um fabricante de automóveis poderia coletar dados do status dos carros em uma estrada em tempo real.

Em muitos casos, afirma Larry Warnock, diretor-executivo de Big Data da Gazzang, empresa de infraestrutura de cloud, ainda não é possível imaginar de que forma essa tecnologia irá alavancar a empresa. “É como uma rede de pesca gigante”, avalia. “Há atum e peixe-espada lá dentro, mas também mexilhões, lagosta e linguado. Todos eles foram tirados do mar, mas o pescador ainda não sabe o que vai fazer com eles. Acontece o mesmo nos negócios. As correlações que podem ser extraídas desses dados nem sequer foram determinadas ainda”, exemplifica.

Uma das chaves para extrair dados não-estruturados como áudio, vídeo, imagens, eventos, tweets, wikis, fóruns e blogs, é transformá-los em informações valiosas é criar um modelo de dados semântico a partir de uma camada que fica em cima do armazenamento de dados.

“Temos de reunir as informações a partir de diferentes fontes e dar sentido a elas”, ensina David Saul, cientista-chefe do State Street, prestador de serviços financeiros que atende a investidores globais. “O modo pelo qual fizemos isso, e a forma que a indústria tem feito, é realizar extrações dos dados a partir de lugares diferentes e construir um repositório. Depois são produzidos relatórios fora desse repositório. É um processo que consome tempo e não é uma questão extremamente flexível”, adverte.

Para tornar esse processo mais eficiente, o State Street começou a estabelecer uma camada semântica que permite que os dados fiquem onde estão, mas forneçam informações descritivas adicionais.

“Temos de lidar com uma série de informações de referência que podem vir de diferentes fontes. E a tecnologia semântica tem a capacidade de identificar diferentes formas de falar sobre uma mesma coisa. Por exemplo, alguém poderia chamar a IBM de apenas IBM ou Internacional Business Machines ou ainda de IBM Corporation. Ao mostrar equivalência dentro da camada semântica, eles vão remeter ao mesmo assunto”, afirma Saul.

“Um dos benefícios que vemos é que com a tecnologia semântica não é necessário refazer todos os sistemas legados e definições de banco de dados. Por isso, é muito menos prejudicial do que outro tipo de tecnologia. Uma vez definida a semântica para uma das fontes, podemos adicionar outras definições sem ter de voltar e refazer a anterior”, acrescenta o executivo do State Street.

Modelo protegido
Mas recolher todos os dados e torná-los mais acessíveis também significa que as organizações precisam identificar formas de protegê-los. E isso exige pensar em uma arquitetura de segurança desde o início, recomenda Saul.

“Acredito que o maior erro que a maioria das pessoas comete em relação à segurança é deixar de pensar no tema até que toda a estrutura esteja pronta”, constata o executivo.

Saul relata que o State Street implementou uma estrutura de segurança em cada pedaço dos dados que requer credenciais para acessá-los. “Temos um controle mais refinado e a capacidade de fazer relatórios para atender aos requisitos de auditoria. Cada etapa de dados é considerada um ativo”, observa.

A capacidade de correlacionar dados e tirar conclusões a partir deles pode ser valiosa, mas também é desafiadora porque se os dados forem para a mão de outras pessoas fora da empresa, será devastador para a organização. Warnock, da Gazzang, afirma que o risco muitas vezes vale a pena. Mas as companhias devem então seguir as melhores práticas de criptografia de dados.

Quando se trata de Big Data, Warnock avalia que a chave de criptografia é transparente. Segundo ele, é possível criptografar tudo em tempo real e gravar em disco. Dessa forma, cada pedaço de dado da organização está protegido. No passado, as empresas tinham certa resistência sobre essas medidas por causa do custo e receio de diminuir o desempenho. Mas o executivo garante que muitas ferramentas baseadas em open source reduzem o custo e ampliam a performance.

Outro grande passo para uso de criptografia é adotar uma solução de gerenciamento automático de chaves. “O segredo da segurança de dados é o gerenciamento de chaves”, considera Warnock. “Ele é o elo mais fraco nesse processo de criptografia.”

Prepare-se para o crescimento acelerado de dados – Tecnologia – CIO.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *