O Apache Spark virou o motor padrão para processar grandes volumes de dados em empresas que exigem velocidade. Times de dados usam essa tecnologia para rodar pipelines, treinar modelos de machine learning e analisar terabytes em poucos minutos. No entanto, muita gente conhece o nome sem entender como a ferramenta funciona por dentro nem onde […]