8 habilidades que você precisa para ser um cientista de dados de elite

 8 habilidades que você precisa para ser um cientista de dados de elite

Extrair o verdadeiro valor comercial dos dados requer uma combinação única de habilidades técnicas, conhecimento matemático, narrativa e intuição.

Os cientistas de dados continuam em alta demanda, com empresas em praticamente todos os setores procurando obter o máximo valor de seus crescentes recursos de informação. Conforme as organizações capitalizam o uso de seus ativos de dados internos e integram centenas de fontes de dados, cresce a relevância desses profissionais.

As estrelas dos negócios em ascensão são os cientistas de dados mais experientes, capazes de não apenas manipular grandes quantidades de dados com sofisticadas técnicas estatísticas e de visualização, mas também têm uma perspicácia sólida da qual podem obter insights sobre o futuro, segundo Greg Boyd, Diretor da empresa de consultoria Protiviti. Esses insights ajudam a prever possíveis resultados e atenuar possíveis ameaças aos negócios.

Então, o que é preciso para ser um especialista em ciência de dados? Aqui estão alguns atributos e habilidades importantes, de acordo com líderes de TI, analistas do setor, cientistas de dados e outros especialistas.

1. Pensamento crítico

Os cientistas de dados precisam ser pensadores críticos, para poder aplicar uma análise objetiva dos fatos sobre um determinado tópico ou problema antes de formular opiniões ou emitir julgamentos.

Apoiador:

“Eles precisam entender o problema ou decisão de negócios que está sendo tomada e ser capaz de ‘modelar’ ou ‘abstrair’ o que é crítico para solucionar o problema, versus o que é estranho e pode ser ignorado”, diz Anand Rao, líder global de inteligência artificial e inovação para data e analytics na empresa de consultoria PwC.

Um cientista de dados precisa ter experiência, mas também ter a capacidade de suspender a crença. “A experiência fornece benefícios, mas não é isenta de riscos, se formos complacentes demais. É aqui que o suspense da crença é importante”, acrescenta Jeffry Nimeroff, CIO da Zeta Global, que fornece uma plataforma de marketing baseada em nuvem.

2. Codificação

Os melhores cientistas de dados sabem como escrever código e se sentem à vontade para lidar com uma variedade de tarefas de programação.

“A linguagem de escolha na ciência de dados está se movendo em direção ao Python, com seguidores substanciais para o R”, diz Rao. Além disso, existem várias outras linguagens em uso, como Scala, Clojure, Java e Octave.

“Para ser realmente bem-sucedido como cientista de dados, as habilidades de programação precisam compreender os dois aspectos computacionais – lidar com grandes volumes de dados, trabalhar com dados em tempo real, computação em nuvem, dados não estruturados e aspectos estatísticos – [e] trabalhando com modelos estatísticos como regressão, otimização, clustering, árvores de decisão, florestas aleatórias etc.”, diz Rao.

O impacto do big data no início dos anos 90 exigiu que cada vez mais cientistas de dados entendessem e pudessem codificar em linguagens como Python, C ++ ou Java, diz Celeste Fralick, Cientista Chefe de Dados da empresa McAfee. Para ela, a parceria entre desenvolvedores e cientistas de dados pode ser muito proveitosa.

3. Matemática

A ciência de dados provavelmente não é uma boa opção de carreira para pessoas que não gostam ou não são proficientes em matemática.

Segundo Boyd, o especialista em dados é um especialista em matemática e estatística, embora tenha a capacidade de colaborar estreitamente com executivos de linha de negócios para comunicar o que realmente está acontecendo na “caixa preta” de equações complexas. Dessa forma, o profissional fornece garantias que a empresa pode confiar nas recomendações e nos resultados, auxiliando diretamente nas estratégias de negócios da organização.

4. Machine Learning, Deep Learning, IA

As indústrias estão se movendo extremamente rápido nessas áreas devido ao aumento do poder da computação, da conectividade e do enorme volume de dados coletados. Por isso, os cientistas de dados precisam ter um entendimento profundo do problema a ser resolvido, e os próprios dados falarão com o que é necessário, diz Fralick.

“Estar ciente do custo computacional do ecossistema, da interpretabilidade, da latência, da largura de banda e de outras condições em torno do sistema – bem como da maturidade do cliente – ajuda o cientista de dados a entender qual tecnologia aplicar”, diz ela. Isso é verdade, porém, desde que eles entendam a tecnologia.

Não basta entender as interfaces funcionais dos algoritmos de machine learning, diz Trevor Schulze, CIO do provedor de armazenamento de dados Micron Technology. “Para selecionar o algoritmo apropriado para o trabalho, um cientista de dados bem-sucedido precisa entender as estatísticas dos métodos e as técnicas adequadas de preparação de dados para maximizar o desempenho geral de qualquer modelo”, diz ele.

As habilidades em ciência da computação também são importantes, diz Schulze. Como a ciência de dados é feita principalmente no teclado, são sólidos os fundamentos fortes da engenharia de software.

5. Comunicação

A importância das habilidades de comunicação merece ser repetida. Hoje praticamente nada na tecnologia é realizado no vácuo; sempre há alguma integração entre sistemas, aplicativos, dados e pessoas. A ciência de dados não é diferente e ser capaz de se comunicar com várias partes interessadas usando dados é um atributo-chave.

“A capacidade de ‘contar histórias’ por meio de dados traduz o que é um resultado matemático em um insight ou intervenção acionável. Estando na interseção de negócios, tecnologia e dados, os cientistas de dados precisam ser especialistas em contar uma história para cada uma das partes interessadas”, diz Rao.

Isso inclui a comunicação sobre os benefícios comerciais de dados para executivos de negócios; sobre tecnologia e recursos computacionais; sobre os desafios com qualidade, privacidade e confidencialidade dos dados; e sobre outras áreas de interesse da organização. Mas para ser um bom comunicador é necessário ter a capacidade de traduzir informações técnicas desafiadoras em um formulário completo, preciso e fácil de apresentar, diz Nimeroff.

6. Arquitetura de dados

É imperativo que o cientista de dados entenda o que está acontecendo com os dados desde o início até o modelo para a decisão de negócios. “Não entender a arquitetura pode ter um sério impacto nas inferências e suposições sobre o tamanho da amostra, muitas vezes levando a resultados e decisões incorretas”, diz Fralick.

Pior ainda, as coisas podem mudar dentro da arquitetura. Entender as complexidades do fluxo de dados ou do pipeline de dados é essencial para garantir uma boa tomada de decisão baseada em fatos.

7. Análise de riscos, melhoria de processos, engenharia de sistema

Um cientista de dados afiado precisa entender os conceitos de análise de risco comercial, aprimoramento de processos e como funciona a engenharia de sistemas. Internamente, o cientista de dados deve se lembrar da segunda metade do título – cientista – e seguir uma boa teoria científica, diz Fralick.

Construir análises de risco no início do desenvolvimento do modelo pode mitigar riscos. “Externamente, essas são todas as habilidades que os cientistas de dados precisam para investigar o cliente sobre o problema que eles estão tentando resolver”, diz ela.

8. Resolução de problemas e boa intuição comercial

Em geral, as características que os grandes cientistas de dados exibem são as mesmas que são exibidas por qualquer bom solucionador de problemas. “Eles olham o mundo sob muitas perspectivas, entendem o que devem fazer antes de retirar todas as ferramentas do cinto, trabalham de maneira rigorosa e completa e podem explicar sem problemas os resultados de suas atividades”, diz Nimeroff.

Encontrar um grande cientista de dados envolve encontrar alguém que possua habilidades um tanto contraditórias: inteligência para lidar com o processamento de dados e criar modelos úteis; e uma compreensão intuitiva do problema de negócios que eles estão tentando resolver, a estrutura e as nuances dos dados e como os modelos funcionam, diz Lee Barnes, Chefe do Paytronix Data Insights do fornecedor de software empresarial Paytronix Systems.

“O primeiro deles é o mais fácil de encontrar; é provável que a maioria das pessoas com boas habilidades matemáticas e diploma em matemática, estatística, engenharia ou outros assuntos científicos possua a potência intelectual para fazê-lo. O segundo é muito mais difícil. É surpreendente quantas pessoas que entrevistamos que criaram modelos complexos, mas, quando questionadas sobre por que elas acham que o modelo funcionou ou por que escolheram a abordagem que adotaram, não têm uma boa resposta”.

É provável que essas pessoas possam explicar a precisão de um modelo, “mas sem entender por que e como ele funciona, é difícil ter muita confiança em seus modelos”, diz Barnes. “Alguém com essa compreensão e intuição mais profunda do que está fazendo é um verdadeiro gênio da ciência de dados e provavelmente terá uma carreira de sucesso nesse campo”.

Por Redação

Via CIO

Editor MDR

Você pode gostar também...

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *