En este artículo voy a explicar el escenario en el que he estado trabajando el último año traduciendo código de Pandas a PySpark para mejorar los tiempos de ejecución y hacer más eficientes los scripts en un entorno de producción. Empecemos entendiendo estas...