Toronto mobilizing Ladies learning to code Python

Para un número creciente de personas, el análisis de datos es una parte central de su trabajo. Una mayor disponibilidad de datos, una computación más potente y un énfasis en las decisiones basadas en el análisis en los negocios han hecho de TI un éxito para la ciencia de los datos. Según un informe de IBM, en 2015 hubo 2,35 millones de puestos de trabajo de análisis de datos en los EE.UU. Estima que ese número aumentará a 2,72 millones en 2020.toronto-mobilizing-ladies-learning-to-code-python,

Una parte significativa de las personas que crunch números para un uso vivo de Microsoft Excel u otros programas de hoja de cálculo como hojas de cálculo de Google. Otros utilizan software estadístico propietario como SAS, Stata, o SPSS que a menudo aprendieron por primera vez en la escuela.

Aunque Excel y SAS son herramientas poderosas, tienen serias limitaciones. Excel no puede manejar conjuntos de datos por encima de un cierto Tamaño, y no permite fácilmente la reproducción de análisis previamente realizados en conjuntos de datos nuevos. La principal debilidad de programas como SAS es que fueron desarrollados para usos muy específicos, y no tienen una gran comunidad de colaboradores constantemente añadiendo nuevas herramientas.

Para aquellos que han alcanzado las fronteras de estos programas, hay un siguiente paso: aprender R o Python. R y Python son los dos lenguajes de programación más populares usados por data SOPs y data scientists. Ambos son libres y de código abierto, y fueron desarrollados en la década de 1990-R para el análisis estadístico y Python como un lenguaje de programación de propósito general. Para cualquier persona interesada en el aprendizaje de la máquina, trabajando con grandes conjuntos de datos, o creando visualizaciones complejas de datos, son enviados de Dios.

¿Pero Cuál de estos programas es mejor aprender? Como ex analista de datos, es la pregunta que me han hecho más que cualquier otra en mi vida profesional.

Aunque usted podría simplemente tratar de aprender tanto R como Python, cada uno requiere una inversión de tiempo significativa-particularmente si usted nunca ha codificado antes.

  • Personalmente, soy parcial. Aprender R cambió radicalmente mi vida para mejor (no estoy exagerando), pero sólo conozco una pizca de pitón.
  • Afortunadamente, el antiguo editor de datos de Quartz, Detection Groskopf, es un usuario de ambos idiomas. Cuando le preparatorio qué programa recomendaría, me ofreció la respuesta matizada que todos aquellos no programadores que me preguntaban estaban buscando.
  • (Para una discusión más técnica del debate y las opiniones de otros sobre el asunto, véase aquí.

En pocas palabras, dice, Python es mejor para la manipulación de datos y tareas repetidas, mientras que R es bueno para el análisis ad hoc y la exploración de conjuntos de datos.

Se fue con Python cuando trabajaba en la cobertura electoral, ya que era un proceso relativamente rutinario y predecible. Desde extraer los datos, ejecutar análisis automatizados una y otra vez, hasta producir visualizaciones como mapas y gráficos de los resultados, Python fue la mejor opción. “Si hubiera hecho el análisis en R, entonces habría tenido que cambiar a una herramienta diferente para crear el sitio web y automatizar el proceso, pero Python también funciona bien para esas cosas”, dice.

R, por el rec, es bueno para las estadísticas-los proyectos pesados y una sola vez se zambulle en un conjunto de datos. Tome el análisis de texto, donde desea deconstruir párrafos en palabras o frases y luego identificar patrones. “A menudo no sé dónde voy a terminar cuando comienzo un proceso como ese, y R hace que sea fácil probar un montón de ideas diferentes rápidamente”, dice Groskopf. “En Python, inevitablemente terminaría escribiendo un montón de código genérico para resolver este problema bastante estrecho.”

¿Qué es más fácil de aprender? R tiene una curva de aprendizaje empinada, y la gente sin experiencia en programación puede encontrarlo abrumador. Python se considera generalmente más fácil de recoger.¿Qué es más fácil de aprender? R tiene una curva de aprendizaje empinada, y la gente sin experiencia en programación puede encontrarlo abrumador. Python se considera generalmente más fácil de recoger.

Otra ventaja de Python es que es un lenguaje de programación más general: para aquellos interesados en hacer algo más que estadísticas, esto viene muy bien para construir un sitio web o dar sentido a las herramientas de línea de comandos. La forma en que trabaja Python refleja la forma en que piensan los programadores. R, por otra parte, refleja sus orígenes en las estadísticas. Muchos programadores encuentran el diseño de irritante, porque es tan diferente a lo que están acostumbrados, dice Groskopf. Para alguien interesado en convertirse en un programador de propósito general, Python es una mejor opción.

Pero para el análisis de datos, las potencial entre R y Python están empezando a descomponerse, dice. La mayoría de las tareas comunes que antes estaban asociadas con un programa o con el otro son ahora realizables en ambos. Son lo suficientemente similares, de hecho, que si la mayoría de tus colegas ya están usando R o Python, probablemente deberías aprender ese lenguaje.

Así que el gran debate de R contra Python está resuelto. Si todo lo que estás haciendo es análisis de datos, realmente no importa Cuál uses.