A aceleração tecnológica que estamos vivendo torna o exercício de analisar e prever tendências cada vez mais complexo. Coisas que hoje imaginamos que vão levar 10 anos para se concretizar acontecem em 2 ou 3. Desafios que parecem impossíveis são resolvidos com a aplicação inovadora de diferentes campos de tecnologia. Falar sobre o “futuro” hoje é arriscar virar piada amanhã.

Dito isso, pensar nos movimentos que estão acontecendo no mercado e exercitar pensar sobre que tendências maiores eles representam é sempre algo saudável. No caso específico dos dados, é ainda mais interessante, uma vez que as informações “moram” em uma interseção de questões tecnológicas, econômicas e sociais cada vez mais relevantes. Desta forma, procuramos reunir e explorar abaixo três áreas de interesse, como elas devem evoluir ao longo dos próximos anos, e qual poderá ser o impacto dessas transformações para as empresas.

 

Dados abertos e transparência

Estamos vivendo um momento quase sem precedentes de abertura e transparência na sociedade. Governos têm sido obrigados a serem cada vez mais transparentes com seus cidadãos, empresas vem sendo forçadas a ser cada vez mais transparentes com seus acionistas, com o mercado, e até mesmo com os consumidores, e temos cada vez mais informações abertas, compartilhadas e disponíveis para acesso por qualquer um.

O primeiro movimento de abertura de dados no mercado foram as chamadas “bases compartilhadas”, nas quais empresas de diferentes segmentos e setores agruparam suas informações para minimizar riscos do sistema como um todo. Os grandes birôs de crédito, com as informações de negativação dos indivíduos, são um exemplo desse movimento, do mesmo jeito que as bases de dados coletadas por empresas de prevenção à fraude são outro.

Hoje, estamos vivendo a “fase 2” dessa abertura, com silos de informações compartilhadas a partir do consentimento dos donos da informação. O cadastro positivo, e as iniciativas de open banking e open insurance que vem evoluindo rapidamente, não só no Brasil, mas também em países ao redor do mundo, são emblemáticas desse momento. Os dados estão sendo abertos, mas de maneira restrita aos participantes de mercados específicos.

O futuro é uma abertura cada vez maior, e cada vez mais compartilhada. Restringir o acesso aos dados no formato de “silos” que temos hoje, onde apenas empresas que fazem parte oficial de um determinado mercado tem como buscar e utilizar esses dados, limita a inovação e a competição, e não traz nenhum benefício real (exceto para as empresas incumbentes). A tendência, regulatória e de mercado, é que essas barreiras de acesso e compartilhamento dos dados sejam quebradas, e que o acesso aos dados, de todas as naturezas, seja cada vez maior e mais amplo. O diferencial das empresas não vai estar em uma exclusividade de dados, mas sim na sua capacidade de gerar valor a partir das informações disponíveis.

 

Industrialização do tratamento de dados

Apesar do aumento das informações disponíveis, e da geração de uma quantidade cada vez maior de dados, o tratamento dos dados para geração de valor continua sendo um trabalho essencialmente manual. E não estamos falando simplesmente da manipulação de dados em ferramentas como o Excel, feita por indivíduos. A grande maioria das ferramentas de análise e manipulação de dados existentes hoje são, no fundo, ferramentas manuais, que necessitam de uma supervisão detalhada e cuidadosa de uma pessoa – seja essa pessoa um analista, um programador ou um cientista de dados – para chegar em qualquer resultado.

Esse tipo de processamento é insustentável. Os fluxos de informação que dependem de uma pessoa (ou mesmo de uma equipe) de analistas de dados para conseguir chegar em um resultado acionável não são capazes de lidar com o volume de informações sendo criadas e disponibilizadas, o que gera um backlog de análise interminável. Para podermos trabalhar dados em escala industrial, precisamos de ferramentas industriais, de máquinas e automações que façam o trabalho no lugar das pessoas.

Aos poucos, ferramentas e tecnologias com essa natureza estão surgindo. Estamos vendo o início da migração para um mundo onde “analistas de dados” e “cientistas de dados” são profissões desnecessárias, porque o trabalho braçal de análise e de tratamento da informação serão totalmente automatizados. Um mundo onde algoritmos e inteligência artificial são aplicados para realizar todo o processo de análise, avaliação e geração de possibilidades em cima dos dados disponíveis, em uma escala que nenhuma pessoa consegue acompanhar.

Na área de pesquisa científica, já temos exemplos de teorias geradas de forma totalmente independente por computadores, a partir de volumes gigantescos de dados, com resultados que nenhuma pessoa conseguiria reproduzir por conta própria. Esse tipo de processo de descoberta de conhecimento deverá rapidamente se espalhar por outras áreas e outros mercados, se tornando o padrão, e não a exceção.

 

Novas “entidades”

Quando falamos hoje de dados, e de análise de dados, a discussão geralmente está associada com dados pessoais, ou seja, com informações que são geradas por pessoas, e de alguma forma coletada dessas pessoas por diferentes empresas. A importância dos dados pessoais vai continuar no futuro, mas a evolução tecnológica abre a possibilidade de analisarmos os dados de outras “entidades”, e de combinar as informações dessas entidades alternativas com os dados pessoais para chegar em resultados ainda mais interessantes e valiosos.

Um exemplo muito interessante dessa tendência é o blockchain. Deixando de lado todo o hype relacionado com as criptomoedas, o que a tecnologia base nos traz é a visão permanente de qualquer coisa – uma moeda, uma imagem, um contrato – que esteja registrado na cadeia. Vamos pegar como exemplo o bitcoin: se todas as “moedas” estão registradas de maneira pública no blockchain, junto com todas as transações em que essas moedas foram trocadas entre endereços, o dinheiro, que antes era simplesmente um valor transacional, passa a ter um histórico. Esse histórico vira informação, que pode ser analisada em conjunto com outros dados para a tomada de decisões. Uma análise de fraude, por exemplo, pode olhar não só para os dados pessoais de quem está tentando fazer uma transação, mas também para o histórico do dinheiro que está sendo usado para fazer aquela compra. De onde ele veio, a quanto tempo existe, e assim por diante.

E não é só a tecnologia de blockchain que gera essas novas possibilidades. Podemos pensar nos próprios algoritmos que tomam decisões como entidades independentes, sobre as quais temos informações relevantes – quem criou o algoritmo, que dados foram utilizados, o quão abertos ou fechados eles são – para tomar decisões. Essas informações podem ser utilizadas, novamente, em conjunto com dados pessoais, para tomarmos decisões mais assertivas nos mais diferentes contextos.

 

Conclusão

Como falamos no começo, exercícios de futurologia são geralmente recompensados com o ridículo. Pensar mais amplamente nas tendências que exploramos acima, no entanto, é fundamental para todas as empresas, não só aquelas que estão diretamente inseridas no universo dos dados. Hoje, toda empresa é, antes de qualquer outra coisa, uma empresa de dados. São as informações que têm o maior potencial de geração de valor para os negócios, e quem não estiver preparado para o futuro dos dados dificilmente vai sobreviver à onda de transformação que estamos vivendo.

BigDataCorp