Las herramientas utilizadas dependeran del rol o etapa del análisis de datos. Pero principalmente tenemos 3 herramientas:

SQL es un lenguaje de programación para el manejo de datos. Su principal tarea en el analisis de datos, es la extracción de información y síntesis de la base de datos para saber sobre el pasado y el presente.

Su uso es principalmente por parte del ingeniero de datos y el analista de datos.

Este lenguaje está enfocado principalmente en el ambito estadistico, y ciertamente al principio puede parecer algo complejo, sin embargo es bastante potente para el analisis y predicción de la información.

Además, el lenguaje R, nos permite generar un análisis descriptivo y exploratorio, esto quiere decir que nos permite extraer la información importante de hoy, así como inferir lo que pudiera ocurrir mañana.

Dentro de los principales packetes utilizados, esta ggplot2 y dplyr. Estos paquetes sirven para la visualización de los datos en graficas con bastantes funcionalidades.

Finalmente los roles que utilizan esta herramienta, es pricipalmente el Cientifico de Datos.

Este lenguaje amado por mucho y envidiado por otros, tiene un enfoque hacia la ingenieria, por lo que es parecido a otros lenguajes de programación, al menos a los más recientes.

Además, al igual que R, su uso en el analisis de datos está enfocado en el análisis descriptivo y exploratorio. Sin embargo su uso se extiende más allá como lo es el Desarrollo Web y de Software.

Los paquetes más utilizados en el ambito de análisis de datos son Pandas y Numpy. Estos paquetes nos sirven para simplificar el manejo de la información así como el calculo que pudieramos hacer con el mismo.

Finalmente, los roles que más utilizan este lenguaje es el Cientifico de datos, y principalmente aquellos que ya tienen una cercanía con algún lenguaje de programación ya que es mucho más sencillo adaptarse a este nuevo.

Untitled

Untitled