domingo , 5 julio 2020
Paquetes incluidos en Anaconda
Paquetes incluidos en Anaconda

Instalación de Python 3.7 para Ciencia de Datos con Anaconda

Aunque siempre podemos instalar el núcleo de Python para la ejecución de código en Python, pronto nos encontraremos limitaciones ya que la mayoría de las librerías especializadas en Ciencia de Datos no se encuentran presentes en el núcleo central de Python. Podríamos optar por instalar cada una de estas librerías manualmente conforme las vayamos necesitando, sin embargo esto es un proceso laborioso y no hay garantía de que la instalación manual de las librerías no nos dará errores de compatibilidad que nos quitarían tiempo de aprendizaje valioso.

Por este motivo nosotros le daremos preferencia a la instalación de Anaconda que es una distribución libre de Python enfocada a la Ciencia de Datos y que ya contiene la mayoría de las librerías más populares para trabajar de inmediato en nuestros proyectos de Ciencia de Datos. Algunos ejemplos de tales librerías son:

  • Matplotlib que nos sirve para la visualización de resultados.
  • Scikit-learn y TensorFlow, librerías muy famosas para el desarrollo y entrenamiento de modelos de machine learning y deep learning.
  • Numpy, Scipy y Pandas para el tratamiento de datos numéricos y otras cosas.
Algunas de las librerías preinstaladas de Anaconda.
Algunas de las librerías pre-instaladas de Anaconda.

Windows

La instalación en Windows es tan fácil como descargar el instalador gratuito de la página web de Anaconda. Como tal Anaconda ofrece también una versión Enterprise con funcionalidades extra que son útiles para grandes equipos de desarrollo. En nuestro caso la versión gratuita es suficiente para aprender a utilizar todas las funcionalidades de Phyton.

Anaconda también nos permite descargar paquetes y el instalador de R, que como bien sabemos es otro lenguaje de programación muy poderoso para la Ciencia de Datos. Por ahora es suficiente con saber que Anaconda nos da la flexibilidad de trabajar con ambos lenguajes (Python o R) y emplear aquel que más nos convenga en función del proyecto que queramos desarrollar.

Después de la instalación de Anaconda, debemos ejecutar una actualización para asegurarnos de estar usando la implementación más actualizada de las dependencias. Independientemente de si descargamos la última versión del instalador, algunas librerías se actualizan constantemente, por lo que es muy probable que muchas de nuestras librerías requieran actualizaciones para estar al día.

Si te encuentras en Windows, en el Menu Principal nos vamos al menú de aplicaciones de Anaconda y abrimos una terminal seleccionando: Anaconda prompt.

Dentro de esta terminal ejecutamos:

conda update anaconda

y le damos “y” para aceptar la instalación de todas las actualizaciones.

Terminal ejecutando: conda update anaconda
Al ejecutar la actualización, se descarga una lista de paquetes que requieren cambios, tras aceptar, nuestra instalación de Anaconda estará al día.

Linux/UNIX

Instrucciones para la instalación de Anaconda en distribuciones Linux (Debian, RedHat, ArchLinux, OpenSuse/SLES, Gentoo) se encuentran disponibles aquí. Si están instalando en Ubuntu, usen las instrucciones de Debian. Si están instalando en Fedora o CentOS, usen las instrucciones para RedHat.

El instalador de Linux se puede descargar desde la misma página de Anaconda.

Durante la instalación en Ubuntu 18.04, la instalación falla cuando el instalador pregunta: “Do you wish the installer to initialize Anaconda3 by running conda init?” Esto no es de gran importancia ya que los paquetes si se instalan adecuadamente, simplemente no se inicializa la instalación. Este error ocurre independientemente de lo que respondamos a la mencionada pregunta. Para completar la instalación simplemente debemos ejecutar:

source <path to conda>/bin/activate
conda init

Si la instalación fue exitosa, podemos actualizar las paqueterías con el comando:

conda update anaconda

Verificar la instalación

Para verificar la instalación de Python, abrimos una terminal (en Windows, en el menú inicio nos vamos a las aplicaciones de Anaconda en donde seleccionamos Anaconda Prompt; en Linux podemos abrir cualquier terminal del sistema), el prompt del sistema debe aparecer con la leyenda (base) antes del prompt. Por otro lado al ejecutar el comando python, se despliega información sobre la versión del compilador. Esta información debe incluir la leyenda Anaconda si la instalación fue correcta.

Terminal después de una instalación exitosa ejecutando: python
Terminal de Windows con la leyenda (base) antes del prompt y la leyenda Anaconda entre los datos del compilador.

Con esto ya tenemos todo lo necesario para trabajar en Python.

Acerca de itsgaraet

Físico especializado en aplicaciones ópticas. En la prepa me llamó la atención aprender lenguaje C y desde entonces comencé a usar programación para resolver problemas que lo ameritaran. Después de aprender Fortran, Matlab y LabVIEW para automatizar mediciones, realizar simulaciones o calcular propiedades físicas, me di cuenta de que a menudo solo buscaba pretextos para resolver problemas empleando programación ya que la experiencia de definir un problema y plantear su solución es una experiencia que disfruto bastante. Esto me llevó a intentar profundizar en el campo del software, principalmente en lo relativo a Ciencia de Datos y Desarrollo Web. También soy amante de la fotografía, planear una nueva imagen y terminar de llevarla a la realidad en Photoshop siempre es algo interesante.

Checa también

¿Que lo origina? - La belleza de la complejidad.

Generación del fractal de Mandelbrot en Octave/Matlab

Tutorial que enseña el origen del conjunto de Mandelbrot usando Octave para su graficación.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *