Engenheiro de Dados em 2022
Já se foi o tempo em que era preciso ter cursado engenharia para poder ocupar o papel de engenheiro. Não sei exatamente quando a moda começou a invadir as empresas de tecnologia e o desenvolvedor se tornou engenheiro de software e o analista de banco de dados virou engenheiro de dados. Não vou nem mencionar o analista que depois de um banho de estatística (ou pelo menos é o que deveria ter acontecido) virou cientista de dados, ainda mais levando em consideração a performance lamentável do Brasil em matemática.
Ranço a parte, muitas pessoas se perguntam qual seria o melhor caminho para tentar ingressar na carreira de Eng. de Dados em 2022. Separei as principais áreas, por ordem de relevância e de facilidade de aprendizado, para quem está iniciando. De maneira resumida, o Eng. de Dados precisa saber 4 assuntos principais: Banco de Dados, APIs REST, Big Data, e principais produtos de dados de algum provedor de nuvem ( AWS, Google, Azure). Um bônus (mas não necessário) é algum conhecimento de Machine Learning e como é normalmente usado em produção.
Banco de Dados
Como era de se esperar, conhecimento de banco de dados é o mais relevante para a área. Saber os diferentes tipos de bancos de dados ( relacionais, NoSQL, tabulares, etc) e suas aplicações, e principalmente saber montar um banco relacional em SQL e deixar algumas queries prontas.
APIs REST
Esse é um tópico cuja demanda tem crescido bastante, porque é um dos jeitos mais eficazes de tornar os dados disponíveis para consumo. Não é esperado que você saiba fazer sistemas complexos, mas apenas manter uma API funcional.
Big Data
Saber bem o básico de SQL e bancos de dados vai te ajudar muito, mas o diferencial para conseguir uma vaga com certeza será o conhecimento de técnicas e ferramentas de big data. Uma dica boa para quem quer treinar sem ter que desembolsar muito dinheiro é o ambiente Community do DataBricks.
Cloud
Aqui entra uma aposta de qual Cloud escolher, pois embora elas sejam semelhantes, os produtos de dados são bem diferentes. Pela minha experiência, o mais caro, porém mais fácil e com melhor suporte, é a Azure. Porém, é o menos utilizado pelas empresas, por isso eu não começaria a aprender por ela. As duas principais alternativas são AWS e Google Cloud. Uma boa regra do polegar para escolher com qual começar poderia ser pensando em qual tamanho de empresa você deseja trabalhar: o Google Cloud embora seja mais barato, é mais utilizado por empresas de porte menor, e com usuários menos espalhados pelo mundo. A AWS é mais utilizada por empresas de grande porte, mesmo sendo mais cara.
Machine Learning em Prod
Chegamos no último item da lista, e esse é mais um bônus do que algo pra se aventurar. Definitivamente não é responsabilidade do Eng. de Dados saber o funcionamento de algoritmos de Machine Learning nem suas aplicações, mas algo que pode te proporcionar uma vantagem competitiva enorme é saber usar recursos do seu provedor de cloud que oferecem soluções quase prontas.
Comentários
Postar um comentário