Conclusiones#

  1. Python es un lenguaje de muy fácil aprendizaje y de uso hoy en día en la ciencia de datos, este también se utiliza en compañia de lenguajes funcionales que permiten un escalado mejor como el lenguaje scala y la librería pyspark que permite manejar información contenida en teras -big data. Ver pyspark para mas detalles.

  2. La ventaja hoy día en el análisis de datos es que muchos de los lenguajes son gratuitos y se puede interactuar con estos muy fácilmente, también

  3. Los entornos virtuales permiten probar nueva información en entornos controlados que no afectas otras instalaciones y funcionalidades.

Analítica de datos#

  1. Es necesario conocer las necesidades de la organización para poder saber como procesar los datos y como contribuir a las metas con los resultados obtenidos.

  2. Una metodología adecuada permite realizar una preparación óptima de los datos antes de procesado.

See also

Infografía analítica de datos, descripción del procedimiento ASUMDM de IBM.

Python jupyther#

  1. El entorno de programación web interactivo es muy fácil de utilizar pero carece de la inteligencia de autocompletado que muchos ide tiene hoy en día.

  2. Anaconda provee un sistema para manejar entornos virtuales de programación con la facilidad visual de actualizar libreofficeías.

  3. Es posible correr entornos listos para la analítica de datos con imágenes de Docker y pyspark.

Gráficos#

  1. Los gráficos permiten realizar una interpretación visual de los datos y sus interacciones

  2. Mediante una gráfica se pueden interpretar los resultados que sería muy difícil de interpretar de otra manera, también permite comunicar a otras personas los resultados del procesamiento de otra información.

jupyter-book myst init path/to/markdownfile.md