myCloudDoor Partner de Dropbox Business
March 3, 2017La (r)evolución del Outsourcing
March 20, 2017R es un lenguaje de programación concebido para solventar problemas estadísticos y de Inteligencia Artificial, con una notable capacidad de representación gráfica. Es de código abierto, teniendo una comunidad global de ususarios que lo nutren de contenido.
Microsoft entendió rápidamente todas estas ventajas, y lo ha incorporado a su gama de soluciones analíticas, enriqueciendo especialmente la dimensión concerniente a los despliegues empresariales, entre otros factores.
La familia de productos R de Microsoft abarca R Server (MRS), R Client (MRC) y R Open (MRO), todas construidas sobre código abierto, y ordenadas de mayores a menores prestaciones.
MRS añade capacidades al tradicional R en código abierto, tales como ejecución remota, despliegue de servicios web, integración con Machine Learning, y soluciones escalables o con procesamiento simultáneo en paralelo.
A nivel muy básico, podemos afirmar que MRO es la versión estable en código abierto de Microsoft para hacer uso de todos los paquetes publicados por la comunidad, y que MRC es una mejora de la anterior, con capacidad de usar paquetes adicionales (MicrosoftML, olapR, y RevoScaleR), con las limitaciones de proceso de datos ajustados a la memoria local, y hasta dos hilos. Para beneficiarse de la escalabilidad de discos, prestaciones y velocidad, es necesario hacer uso del contexto de cómputo ofrecido por MRS.
Microsoft R Server está orientado al uso empresarial, y ofrece una distribución R con capacidad de proceso a niveles de de big data y DWH.
R Server y R Client
MRC (R Client), tal y como fue comentado antes, opera en un escenario de máquina local. Sin embargo, MRS (R Server), es un software comercial que se puede ejecutar en un cojunto de plataformas, a mayor escala y carga de trabajo, y en topologías cliente/servidor que soportan acceso remoto sobre conexiones seguras.
La idea consiste en desarrollar sobre MRC, y migrar a MRS cuando se precisen necesidades propias de un sistema en producción.
Escalabilidad
Aunque la tecnología ScaleR (mediante el uso del paquete RevoScaleR) está disponible en MRC, en este caso, los datos deberán ajustarse a la memoria disponible en el sistema local, y, como máximo, se podrá hacer uso de dos procesadores. Sólo MRS tiene la capacidad de aprovechar toda la potencia de ScaleR, haciendo uso de las capacidades de computación remota, procesado en paralelo y cargas de trabajo distribuidas.
Las funciones de análisis ofrecidas por ScaleR incluyen, aparte de resúmenes estadísticos, modelos lineales, regresiones logísticas, agrupaciones kmeans, árboles y bosques de decisión. Todos son procesados en paralelo y distribuidos automáticamente.
Paso a producción
Las herramientas de paso a producción de MRS pueden desplegar el análisis en un entorno web, en un pc, dispositivo móvil, o bien sobre aplicaciones de generación de cuadros de mando y en sistemas de backend. En definitiva, convierte un script de R en un servicio web analítico.
Los despliegues pueden realizarse en una sola máquina, o bien en un clúster de servidores con balanceo de carga.
En el entorno Windows, pueden usarse clusters de cálculo en modo Activo-Activo, y los nodos web pueden ser escalados mediante Network Load Balancing.
Plataformas disponibles para R Server
Con el objeto de tomar conciencia acerca de la potencia de esta tecnología, vamos a mencionar algunas de las plataformas disponibles para R Server:
- Hadoop: para distribuir el trabajo entre diferentes nodos
- Teradata DB: perfecta integración para el análisis de datos en Teradata
- Linux: para desplegarse en entornos Linux
- Windows
- SQL Server R Services: analítica avanzada en SQL Server
Para más información sobre las grandes posibilidades y aplicaciones que ofrece R Server, contacte con nosotros en info@myclouddoor.com