“Os dados são o novo petróleo”. A imagem, criada pelo matemático britânico Clive Humby, fez enorme sucesso no universo da ciência de dados, tornando-se uma referência frequente em análises e textos sobre o valor do Big Data. No entanto, um olhar mais atento para essa frase de efeito logo revela que ela não passa de uma metáfora imperfeita. O próprio autor, especialista em ciência de dados, complementou seu raciocínio: “Sem processamento, os dados não podem ser usados; dados devem ser analisados, para ter algum valor”. Ou seja, ao contrário do petróleo, os dados não têm valor intrínseco, mas dependem de alguém que tenha capacidade de tirar deles informações relevantes e conclusões aproveitáveis.

Muitos outros aspectos comparativos entre dados e petróleo têm sido apontados por estudiosos, o que nos traz uma ótima oportunidade para jogar luz sobre questões importantes relativas à natureza e à qualidade das informações. Para começar, diferente do óleo natural, que precisa ser prospectado ao longo de longas extensões de solo, as informações estão à mão, com alguns cliques, facilmente localizáveis. O grande desafio é selecionar o que vale a pena ser extraído e transformar a matéria-prima em “riqueza”.

Além disso, quando uma empresa termina de explorar uma jazida, o petróleo acaba. Os derivados são consumidos e desaparecem no ciclo produtivo. Os dados, gerados em volumes e velocidade cada vez maiores, não se esgotam. Ao contrário: permitem associações, cruzamentos e leituras que geram uma série de hipóteses, talvez envolvendo outras fontes de informações, que vão gerar novas possibilidades. Nesse ponto, são muito mais parecidos com os software, que podem ser infinitamente re-empacotados e revendidos.

O físico alemão Samuel Flender explica que, ao detectar sinais de petróleo, uma companhia sabe com algum grau de confiança quais os passos necessários para transformar aquela substância em lucros: furar o solo, extrair o líquido, refinar, vender. Não acontece a mesma coisa quando tratamos de dados, diz ele: “Nem sempre é muito claro como transformar informação em lucros”. Para isso, ele acredita, existem os cientistas de dados, profissionais capazes de tirar de amplas bases de dados os insights mais adequados ao negócio. E justifica: “O processo de tratamento de dados é às vezes caótico, requer planejamento cuidadoso, engenharia e pesquisa, além de conter algumas armadilhas”. Uma realidade bem mais complexa que a dos campos de petróleo.

Outra diferença importante é que, no caso de uma commodity como o petróleo, um barril de óleo equivale a outro barril de óleo do mesmo tamanho. Dados são heterogêneos, lembra o economista norte-americano Alec Stapp. “Os dados de cada pessoa são únicos e podem consistir em praticamente um número ilimitado de diferentes atributos coletados de um perfil. Isso significa que o petróleo seguirá a lei do preço de mercado, enquanto o valor de um conjunto de dados dependerá de suas propriedades e potenciais de comercialização específicos”. E ainda, quanto mais abundante a commodity, menor o seu valor. Quando tratamos de dados, quanto mais informação, mais valor.

Deixar claro que informações estão muito longe de ser comparadas a petróleo não é apenas uma questão semântica. É fundamental esclarecer essa diferença para qualificar a formulação de políticas públicas de tecnologia e informação, evitando que os dados sejam tratados como meras commodities.

BigDataCorp