Já falamos, nesse blog e em outros artigos, sobre a existência de uma “data de validade” – ou shelf-life – para os dados. Isso é um pouco contra-intuitivo quando falamos de um produto digital ou intangível. Não existe uma data de expiração para uma música, para um filme, ou para um livro. Se você ler hoje um artigo científico de 1867, pode encontrar informações defasadas ou que se mostraram incorretas ao longo do tempo, mas não vai sofrer nenhum efeito prejudicial por causa disso.

Os dados, nesse sentido, são diferentes de outros produtos digitais, e se aproximam mais de bens de consumo perecíveis, que efetivamente podem causar mal para quem os consome após a data de validade. Usar um telefone ou um e-mail defasado em uma ação de marketing pode levar a uma violação de privacidade e um processo no escopo da LGPD. Enviar uma comunicação para uma pessoa que já faleceu pode levar a uma condenação por danos morais. Os malefícios de se utilizar dados que já venceram são reais e muito visíveis.

Ao mesmo tempo, existe um limite para essa analogia. Quando falamos de bens de consumo convencionais, o prazo de validade normalmente é algo “estável”. Dadas as mesmas condições de armazenamento, ele permanece o mesmo. Um suco natural de laranja vai durar uma semana na geladeira, independente de quem for tomar o suco, ou do suco ser utilizado para fazer um bolo ao invés de ser ingerido diretamente.

No caso dos dados, isso não é verdade. O shelf life de um dado depende não só da informação em si e de como a mesma está sendo armazenada, mas também de quem vai usar os dados, de para que os dados vão ser utilizados, e ainda de como vão ser aplicados. Ele é um conceito fluído, que varia de acordo com esses fatores, e compreender essa fluidez é fundamental para garantir o bom uso da informação, por você e por sua empresa.

Vamos explorar então esses três fatores que impactam a validade de uma informação, começando por “quem vai utilizar o dado”. Quando falamos isso, não estamos querendo dizer pessoas específicas, mas sim agentes do mercado. A validade de cada ponto de informação é diferente para cada tipo de empresa. Uma empresa de varejo, por exemplo, não precisa manter atualizado o dado de profissão de seus clientes, mas para uma empresa do mercado financeiro, essa mesma informação é fundamental para saber o risco associado com um cliente. Assim, o perfil da empresa que está usando a informação é um elemento importante na definição da validade de um dado.

O segundo fator é a aplicação dos dados, ou seja, para que eles vão ser utilizados. Como já comentamos acima, se uma empresa pretende utilizar informações de contato – endereços, telefones ou e-mails – para falar com um cliente (ou potencial cliente), é fundamental que esses dados estejam atualizados corretamente. Do contrário, ela não conseguirá falar com a pessoa, ou, pior ainda, vai falar com a pessoa errada, e corre o risco de ser processada. Por outro lado, se os mesmos dados forem utilizados em um escopo de modelagem estatística (identificando a cidade na qual a pessoa disse morar, por exemplo), o prazo de validade é muito maior. Mesmo que as informações não estejam mais exatas, elas continuam sendo úteis e trazendo um resultado positivo.

O último fator é como a informação vai ser aplicada. Esse fator é bem parecido com o anterior, e de fato pode ser confundido em alguns casos, mas tem algumas diferenças. Vamos pegar novamente o caso da empresa que quer usar informações de contato para fazer alguma ação em cima de clientes ou potenciais clientes. Se a informação for utilizada em uma tentativa de comunicação direta – o envio de um e-mail marketing, ou uma ligação telefônica – todos os problemas que descrevemos acima se aplicam. No entanto, se a empresa usar a informação de contato como uma chave externa para realizar campanhas direcionadas dentro de outras plataformas de marketing digital, como o próprio Google ou Facebook, não só o risco de uma comunicação incorreta se reduz, como a utilidade do dado aumenta, porque você pode ter se cadastrado nessas plataformas com um dado de contato mais antigo.

Dada a fluidez causada por esses fatores, é fundamental conhecer e entender qual a data de referência de toda informação com que você está trabalhando. E justamente por isso incluímos nativamente na plataforma de dados da BigDataCorp o conceito da data de referência em todos os dados e datasets. Somos a única empresa do mercado que não só amarra todos os dados capturados com datas de referência específicas, mas também entrega essa informação relevante para os clientes no momento das consultas. Assim, você pode tomar uma decisão informada na hora de considerar (ou não) um dado como válido.

Da mesma forma que as empresas vem realizando avaliações sobre a segurança e as questões de privacidade relacionadas com os seus dados – motivadas principalmente pela LGPD – avaliar de forma estruturada e recorrente a validade de todas as informações que a sua empresa possui deveria ser um processo padrão no mercado, tão parte da rotina quanto qualquer análise de vulnerabilidade ou

Faça um assessment da validade dos seus dados, e torne isso tão parte da sua rotina empresarial quanto as análises de segurança.

BigDataCorp