A verdadeira questão por trás da lacuna de habilidades em ciência de dados não é o que você pensa

Nota: O seguinte artigo irá ajudá-lo com: A verdadeira questão por trás da lacuna de habilidades em ciência de dados não é o que você pensa

A lacuna de habilidades em ciência de dados não existe porque não há pessoas suficientes que possam treinar e analisar modelos de dados. Existem muitos modeladores de dados talentosos que entendem modelagem de dados conceituais, modelagem de dados lógicos e muito mais. O verdadeiro desafio é encontrar pessoas que possam coletar dados, prepará-los, limpá-los e colocar seus modelos em produção.

Estou me referindo a profissionais que entendem como consultar e se conectar a bancos de dados, sabem como implementar um armazenamento de objetos e podem conteinerizar modelos, convertê-los em APIs e incorporá-los em dispositivos de borda. Em suma, pessoas que podem aplicar aplicações práticas aos seus conjuntos de dados.

É aqui que está a escassez: cientistas de dados que são quase tão habilidosos em engenharia de software quanto em modelagem de dados. As empresas precisam de pessoas que saibam como produzir seus resultados para que possam ser usados ​​em casos de uso do mundo real, não apenas pessoas que possam construir um modelo eficaz. É por isso que o Gartner identificou a engenharia de IA como uma das principais tendências de tecnologia estratégica para 2022, em que os profissionais de TI se concentram na operacionalização de modelos de IA.

Felizmente, as faculdades e universidades têm as ferramentas necessárias para fornecer ambientes fantásticos para aprender o lado da engenharia da ciência de dados e são a chave para minimizar a atual escassez de habilidades em ciência de dados.

VEJO: Kit de contratação: cientista de dados (TechRepublic )

É hora de usá-lo para abrir portas para a próxima geração de profissionais de ciência de dados.

Brincando de se pegar

Até agora, eles só abriram um pouco a porta.

Muitos professores ainda se concentram muito nos aspectos teóricos e matemáticos da ciência de dados e não tanto na experiência prática necessária para colocar a ciência de dados em prática. Talvez seja porque eles sentem que seus papéis são avançar a ciência, não necessariamente treinar pessoas para uma profissão. Embora isso seja importante, é preciso haver um equilíbrio entre os dois. De fato, as coisas estão melhorando e mais faculdades e universidades estão começando a oferecer alguns cursos limitados sobre como aplicar ciência de dados e modelagem a aplicativos.

Mas eles precisam evoluir seu currículo mais rapidamente para atender à demanda. Isso é difícil, pois às vezes pode levar alguns anos para criar e aprovar um único novo curso. Isso não é aceitável quando a tecnologia avança rapidamente a cada poucos meses. A desconexão entre o que é ensinado e o que é necessário continua.

Enquanto isso, as empresas que possuem os recursos e conhecimentos adequados estão tentando compensar. Muitos estão contratando es de banco de dados experientes e recém-formados e treinando-os em implantação de modelos práticos e engenharia de dados.

Existem desvantagens nessa abordagem. Primeiro, uma organização com poucas habilidades práticas de implantação de modelos não terá a experiência necessária para treinar um novo grupo de cientistas nessas habilidades. Afinal, eles não podem ensinar o que não sabem. Em segundo lugar, o treinamento pode consumir muito tempo, drenar recursos e prejudicar os esforços organizacionais para se tornar mais rápido e eficiente.

Isso não é sustentável ou viável para a maioria das empresas, principalmente organizações menores que podem não ter meios para treinar adequadamente seus funcionários. Também não é justo para os estudantes, que já estão entrando no mercado de trabalho em desvantagem.

Mas faculdades e universidades não precisam ar anos criando novos cursos. Em vez disso, eles podem usar as ferramentas de código aberto que já têm à sua disposição para incorporar o aprendizado prático em seus cursos de ciência da computação existentes.

Criando um engenheiro de dados

As instituições de ensino superior têm investido fortemente em tecnologias de código aberto há vários anos e estão usando o software para resolver de forma criativa uma variedade de desafios. Eles são atraídos por sua interoperabilidade, segurança e custo-benefício, entre outros benefícios.

Mas eles também entendem que mais empresas estão aproveitando o código aberto do que nunca. Na verdade, 95% dos entrevistados em uma pesquisa recente da Red Hat disseram que o código aberto é importante para a infraestrutura corporativa geral de sua organização. De fato, o código aberto é o novo normal para a TI. Isso torna o ensino e o uso de tecnologias de código aberto de vital importância.

Já estamos vendo algumas faculdades e universidades dando cursos sobre tópicos como aprender a usar Python ou Jupyter Notebooks. Alguns até incorporaram essas ferramentas em suas configurações diárias de sala de aula. Agora, é hora de levar as coisas ainda mais longe, criando uma estrutura que reúna essas e outras ferramentas e vincule os aspectos teóricos do treinamento de modelos aos aspectos mais práticos do desenvolvimento de software.

Isso não é difícil de fazer, graças à natureza aberta e flexível do software de código aberto. Diferentes tecnologias podem ser facilmente agrupadas para criar um todo coeso e dar aos alunos uma visão mais completa de como seu trabalho pode ser usado para efeitos práticos em uma aplicação.

Por exemplo, uma faculdade que ensina e usa Python e usa Jupyter Notebooks pode combinar o uso das ferramentas em uma única sala de aula. Os professores podem criar uma seção especializada do curso que mostra aos alunos não apenas como trabalhar com Jupyter Notebooks, mas também como transferir esse trabalho para um desenvolvedor. Eles também podem mostrar como um desenvolvedor de aplicativos usando Python pode incorporar seus modelos de dados em seus aplicativos. Os alunos podem até aprender o básico de como o Python funciona sem serem treinados para serem eles próprios desenvolvedores de aplicativos.

Essencialmente, faculdades e universidades podem aplicar os princípios da ciência e da engenharia em uma única aula. Os alunos podem aprender como experimentar seus modelos e como colocá-los em movimento, levando-os da ideia à implantação.

Preenchendo a lacuna de habilidades

A competição entre as empresas para encontrar cientistas de dados talentosos não mostra sinais de desaceleração. De acordo com a EY, as organizações ainda estão tendo problemas para preencher funções centradas em dados devido a programas ineficazes de qualificação, falta de talentos e muito mais. Mesmo organizações poderosas como a NASA estão lutando para encontrar as pessoas certas para as funções certas de ciência de dados.

A maneira mais fácil e rápida de preencher essa lacuna de habilidades cada vez maior é as faculdades e universidades ampliarem o escopo de alguns de seus cursos atuais. Eles devem considerar a incorporação de engenharia de software e ensinamentos operacionais juntamente com suas ofertas atuais de ciência de dados. Isso fornecerá aos alunos uma perspectiva mais completa – e útil – que os ajudará a se preparar melhor para o que está por vir, dando às empresas o talento que estão procurando.