We’ve opened a new office in Amsterdam
March 26, 2018How to easily install SAP on Azure
April 5, 2018Azure Machine Learning es una herramienta completa para el científico de datos, cuyo propósito más relevante consiste en el despliegue de modelos y experimentos de analítica avanzada y ciencia de datos en plataformas Cloud de Azure. Es completamente compatible con los lenguajes de código abierto más utilizados por la comunidad y permite utilizar los paquetes estadísticos más representativos, como scikit-learn, TensorFlow, Microsoft Cognitive Toolkit y Spark ML.
Posee un IDE que constituye una poderosa ayuda en las tareas más habituales para el científico de datos, soluciones para la ingesta y la preparación del dato, así como el desarrollo y la administración de modelos y experimento como también de la operacionalización de los mismos en entornos de computación como contenedores de Docker, GPUs y clústeres de Spark.
Operacionalización de modelos Machine Learning
Los modelos son creados en la herramienta escritorio., cuya apariencia y funcionalidad es muy similar a los Jupyter Notebooks y, una vez creados se pueden entrenar y desplegar mediante diferentes opciones:
- Cloud Azure:
- Spark (HDinsight)
- SQL Server 2016
- Virtual Machine
- Docker
- GPU
- On premise:
- SQL server
- Machine Learning Server
- Edge Computing:
- Azure IoT Edge
Los modelos creados son administrados desde el servicio de Experimentación de Azure Machine Learning desde donde se puede, entre otras cosas, ejecutar y monitorizar los modelos creados desde el workbench. Todos los proyectos creados en el Workbench, se pueden mantener desde el servició de experimentación, que además, es compatible con Git Hub.
Una de las mayores ventajas que proporciona esta herramienta es qué, a través de un configuración muy simple, permite ejecutar experimentos en una amplia variedad de entornos Cloud Computing como por ejemplo:
- Local nativo
- Contenedor de Docker local
- Contenedor de Docker en VM remota
- Escalar horizontalmente el clúster de Spark en Azure
Biblioteca de Microsoft Machine Learning para Apache Spark
Otra interesante funcionalidad de esta herramienta es la incorporación de la biblioteca MMLSpark. Se trata de un paquete de código abierto con diferentes métodos interesantes para el Machine Learning y Deep Learning de Apache Spark. Dicha librería simplifica y agiliza la creación de modelos, la aplicación de técnicas analíticas de manera totalmente escalable. Algunos de los potenciales beneficios son:
- Ingesta de imágenes de HDFS a Spark fácilmente
- Transformaciones OpenCV
- Caracterización de imágenes con redes neurales profundas previamente entrenadas con Microsoft Cognitive Toolkit
- Uso de LSTM bidireccionales previamente entrenadas de Keras para la extracción de entidades médicas
- Entrenar modelos de clasificación de imagen basados en DNN en VM de GPU de N-Series en Azure
¿Es Azure Machine Learning Workbech la herramienta definitiva para la implementación de modelos analíticos avanzada?
Azure Machine Learning Workbench es una herramienta completa de ciencia de datos. A través de ella podemos encontrar la herramienta de limpieza y preparación de datos, el sencillo acceso a un número considerable de librerías estadísticas de Machine Learning sin necesidad de desplegar complejas infraestructuras, a través del uso de Notebook en un equipo local. Es decir, permite al científico de datos en focalizar su atención en el modelo y no en la infraestructura.
Asimismo, permite abstraer el código de los modelos del sistema de computación, pudiendo seleccionar el sistema de computación más adecuado del modelo, como Docker, GPU y clústeres de SPARK. De este modo, a través de una modalidad de pago por uso, es posible ejecutar los modelos analíticos más avanzados sin realizar una inversión elevada.