Embora aumente a cada dia a demanda no mercado por cientistas de dados, definir os skills necessários para esse profissional não é tarefa fácil. A área envolve cálculos, estatísticas e algoritmos, mas o perfil para tal posto deve ir além de altas habilidades em exatas e em tecnologia. É fundamental também ser capaz de obter um equilíbrio entre a técnica e o pensamento estratégico. E, ainda, de compreender a relação existente entre as informações e as pessoas ou as organizações. Ou seja, o cientista deve estar preparado para aplicar seu conhecimento aos problemas do mundo real.

Esse profissional precisa lidar com perguntas abertas e ter capacidade de interagir rapidamente com diferentes métodos e modelos de análise. Afinal, um dos objetivos da profissão é gerar novos insights, que proporcionem novas possibilidades, que poderão mudar completamente a maneira como as coisas são feitas até então. Cabe ao cientista de dados apoiar esse movimento exploratório de hipóteses. Por isso, é importante que ele tenha interesse em aprender e em encarar novos problemas.

Não existe, no entanto, um consenso sobre quais são os conhecimentos teóricos e práticos obrigatórios para se ocupar essa posição. De acordo com a Wikipedia, a ciência de dados abrange “um campo interdisciplinar” que utiliza métodos, processos, algoritmos e sistemas científicos para extrair conhecimento e insights de dados de várias formas. Para driblar essa diversidade, algumas organizações setoriais e grandes empresas de tecnologia estão propondo a construção de um processo de certificação formal.

Uma experiência avançada nesse sentido foi coordenada pelo The Open Group, um consórcio do setor de Tecnologia da Informação (TI) que oferece programas de certificação em arquitetura de TI e análise de riscos. O grupo criou uma certificação para cientistas de dados (Certified Data Scientist – CDS) que define habilidades, conhecimentos e experiências relativas a esses profissionais.

A certificação exige o domínio de um conjunto de assuntos, incluindo estatística, aprendizado de máquina, IA e comunicação para negócios. O programa oferece três níveis de certificação: cientista de dados certificado, cientista de dados mestre certificado e cientista de dados certificado distinto. No setor privado, gigantes como IBM, DELL EMC, SAS e Microsoft dispõem de cursos próprios de certificações para ciência de dados. Além de apoiar a iniciativa do The Open Group, a IBM também lançou o Data Science Apprenticeship, programa de 24 meses projetado para candidatos a empregos que podem não ter um diploma universitário e consiste em três componentes principais: educação, orientação e experiência prática.

Mas nem só de estatísticos, matemáticos e analistas de dados é feita a nova profissão. Muitos cientistas de dados vêm de áreas não técnicas, como economia e administração. O importante é que tenham habilidade para rastrear e entender um problema. E um interesse profundo e incansável em buscar as soluções. Matéria-prima para isso é mais do que abundante, na era do Big Data. Resta saber interpretá-las.

BigDataCorp