Os dados são um elemento fundamental da economia moderna. Além de serem a peça-chave do processo de transformação digital pelo qual a maioria das empresas está passando nesse momento, os dados viabilizam uma criação de valor praticamente sem precedentes para as empresas, seja através da otimização operacional com inteligência artificial, da criação de experiências individualizadas para os clientes, ou de qualquer outro setor onde sua aplicação traz vantagens competitivas relevantes.

Por um lado, os dados são “infinitos”. Diferente do que acontece com um bem ou produto físico, dados são totalmente intangíveis, podendo ser replicados, manipulados e modificados sem um custo financeiro relevante. É tentador pensar nos dados como um ativo intangível, de valor potencial ilimitado. Porém, dados sofrem com algumas das mesmas limitações que os ativos tradicionais das empresas. A primeira dessas limitações é a sua expiração, representada no conceito de shelf-life dos dados. Todo e qualquer dado possui uma data de expiração intrínseca, um ponto no tempo a partir do qual o mesmo deixa de estar válido.

O exemplo mais simples dessa data de expiração é pensarmos em um telefone de contato para uma pessoa. A grande maioria das pessoas troca de telefone em no máximo um ou dois anos. Assim, o prazo de validade dessa informação não pode ser maior do que esses anos. Passado esse tempo, a pessoa provavelmente não vai mais ser encontrada naquele número, o que significa que a informação não é mais válida. Uma outra forma de entender o conceito da data de expiração é pensar na utilidade de uma informação, e no momento em que ela deixa de existir. O exemplo tradicional aqui é da informação de posição geográfica de um indivíduo. Ela é útil no momento em que é coletada, pois pode ser utilizada para a exibição de ofertas e serviços locais, que estão próximos ao usuário. Em alguns minutos, o indivíduo se deslocou, a posição mudou, e aquela informação que havia sido coletada deixa de ser útil, ou seja, expirou.

Esse prazo de validade pode ser estendido pelo proprietário da informação de diferentes formas. Pode ser realizado, por exemplo, um trabalho de revalidação dos dados, garantindo que uma informação de contato que foi coletada no passado continua válida e não se alterou, ou que as características comportamentais do indivíduo permanecem as mesmas. Ou pode ainda ser realizado um trabalho de desenvolvimento de novas aplicações para as informações: informações de posição geográfica, combinadas e analisadas ao longo do tempo, podem indicar o local onde um indivíduo mora ou trabalha, por exemplo.

Por mais que essa extensão do prazo de validade da informação seja possível, no entanto, sempre vai existir um ponto a partir do qual o custo associado com os dados e com a sua manutenção se torna maior do que os benefícios potenciais que eles podem trazer para a empresa. Esse ponto é o que chamamos de half-life, ou meia-vida, dos dados. Enquanto o shelf-life é um número que depende de características internas da informação, o half-life leva em consideração não só essas características internas, mas também fatores externos que podem impactar os custos, e seu cálculo e acompanhamento são mais complexos.

A forma mais simples de entender o conceito de half-life é pensar nos dados como produtos que estão no estoque da empresa. Em um primeiro momento (quando são coletados, ou quando são gerados inicialmente), tem um valor potencial, são um ativo. Ao longo do tempo, vão se depreciando e perdendo valor, seja por que estão saindo da validade, ou por causa dos próprios custos de armazenamento e manutenção associados com eles. Depois de um certo ponto, esses custos externos, associados com a própria desvalorização, tornam o valor dos dados negativo, ou seja, os benefícios que a empresa pode extrair deles no futuro é menor do que o custo que ela incorre por mantê-los armazenados.

E esses custos externos são um elemento bastante importante dentro do cálculo do half-life dos dados. Além do valor que é despendido para realizar o armazenamento dos dados, que pode ser significativo, existe também o custo de manutenção dos dados (para mantê-lo dentro do seu shelf-life), e custos mais indiretos, como o risco de um vazamento de dados e o potencial prejuízo que o vazamento desse dado pode trazer para a empresa. Por depender de fatores externos, o half-life é mais variável, podendo mudar ao longo do tempo.

A equação de cálculo do half-life tem dois componentes principais: os custos associados com a informação, e o retorno financeiro que a informação pode trazer para a empresa. Assim, o gerenciamento dessa meia-vida dos dados tem dois lados. No lado do custo, existem diferentes ações que as empresas podem tomar. Elas podem estabelecer políticas de remoção de dados ao longo do tempo (algo muito comum em alguns cenários de tecnologia), buscar tecnologias ou serviços de armazenamento de dados mais baratos, contratar seguros que reduzam o custo financeiro de um vazamento de dados, e assim por diante.

Do outro lado da equação, dos benefícios que a informação traz, o desafio é sempre buscar novas formas de monetizar os dados. Essa monetização não quer dizer necessariamente a comercialização das informações para terceiros, mas sim a extração de valor dos dados, de diferentes maneiras. Pode ser a implementação de novos processos que façam uso dos dados para otimizar as operações da empresa, a utilização de informações comportamentais para criar campanhas de marketing mais direcionadas que aumentam as vendas, o uso de dados no desenvolvimento de novos produtos, ou qualquer outra atividade que encontre valor em cima das informações.

A gestão dos dados como um ativo ainda é uma área incipiente nas empresas, e poucos gestores tem experiência com esse assunto. O half-life é um elemento fundamental nessa gestão, que precisa ser compreendido e acompanhado pelas empresas e pelas pessoas responsáveis pela manutenção dos dados no ambiente corporativo. Na economia dos dados, entender e acompanhar o valor real da informação é fundamental para se ter um bom posicionamento de mercado.

BigDataCorp