Presente y futuro del Machine Learning

Con la explosión actual de datos, las necesidades para tratar dichos datos pasan no solo por el uso de nuevas y potentes tecnologías, sino por la necesidad de crear y desarrollar técnicas que permitan manejar esos datos. Es ahí, donde entran las técnicas de Machine Learning, que si bien es cierto la mayoría son conocidas desde hace décadas su uso se está democratizando y popularizando con el auge del Big Data. Cabe destacar el aumento de interés, ya no de la tecnología Big Data como catalizador de la transformación sino de las técnicas de Machine Learning y la capacidad que tienen de transformar datos en conocimiento [Figura 1].

Figura 1: Tendencias de búsqueda, en rojo “Big Data”, en azul “Machine Learning”.

Fuente: Google Trend.

 

A pesar de la creciente demanda de conocimiento en técnicas de Machine Learning, existe un desconocimiento general sobre qué es y en qué consisten sus técnicas. Todo ello resulta paradójico ya que el uso de dichas técnicas está generalizado tanto para distintas aplicaciones como industrias. Cada vez que se realiza una búsqueda en Google [1], se está utilizando un algoritmo basado en técnicas de Machine Learning para listar las webs en función de su relevancia. Cada vez que se realiza una foto con un “Smart Phone” o teléfono inteligente y la aplicación reconoce los rostros que aparecen en pantalla, se está un utilizando un algoritmo basado en técnicas de Machine Learning [2]. Cada vez que un proveedor de servicios de email filtra los correos y desecha aquellos que son spam, se está utilizando un algoritmo de Machine Learning [3].

El término Machine Learning se lleva utilizando en la literatura científica desde que Arthur Samuel, pionero en temas de Inteligencia Artificial, lo definiera en 1959 como “Field of study that gives computers the ability to learn without being explicitly programmed” [4] cuya traducción es “campo del conocimiento que otorga a los ordenadores la capacidad de aprender sin ser programados de forma explícita para ello”. Años después, Tom Mitchell, uno de los popes del Machine Learning, ofrece una definición más específica del concepto «A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E» [5] cuya traducción es “Un programa de ordenador se dice que aprende de la experiencia E con respecto alguna clase de tarea T y una medida de su rendimiento P, si el rendimiento en la tarea T, medido por P, mejora con la experiencia E”. Ejemplo de la definición de Mitchel es la clasificación de los correos electrónicos en deseado o spam [Figura 2].

Figura 2: Sistema de clasificación de emails.

Fuente: Elaboración propia.

 

En dicho ejemplo, E sería la base de datos clasificada con todos los emails recibidos hasta la fecha que son spam o no, T sería la clasificación de los futuros emails y P la probabilidad de que T separe correctamente los correos.

El futuro del Machine Learning

De acuerdo al estudio “Global CIO Point of View”, antes de 2020 más del 60% de las empresas europeas utilizarán Machine Learning en alguno de sus procesos de negocio llevando a cabo una inversión de más de 44.000 millones de euros. Es por tanto una realidad el interés y necesidad que los distintos actores de la economía tienen ante la posibilidad de conocer mejor su entorno y ser capaces de predecir distintos comportamientos.

No obstante, dentro del escenario tan favorable que se está dando se identifica una gran amenaza a este avance tan disruptivo. Si bien es cierto que en la era del Big Data los datos abundan, debemos ser conscientes de la importancia del acceso a estos y de que sin ellos todo el posible conocimiento que se pueda generar con las técnicas de Machine Learning resulta harto complicado. En líneas generales existe consenso en las empresas tecnológicas al pensar que los datos son el petróleo del siglo XXI, sin embargo no se percibe el mismo entusiasmo en los sectores más tradicionales de la economía.

Desde myCloudDoor se lleva años trabajando de manera conjunta con empresas de distintos sectores económicos en el desarrollo de proyectos de Machine Learning. Como partners tecnológicos de los clientes, myCloudDoor lleva a cabo proyectos complejos en los que define las arquitecturas necesarias para la obtención de datos de calidad, la modelización de algoritmos basados en técnicas de Machine Learning y el despliegue de aplicativos con los que obtener conocimiento basado en los datos.

Referencias

[1] W. Yu-Chai, «Online Learning a Binary Classifier for Improving Google Image Search Results,» Acta Automatica Sinica, vol. 40, nº 8, 2014.
[2] M. R. Mahmoodi y S. M. Sayedi, «A face detection method based on kernel probability map,» Computers and Electrical Engineering, 2015.
[3] T. Guzella y W. Caminhas, «A review of machine learning approaches to Spam filtering,» Expert Systems with Applications, nº 36, pp. 10206-10222, 2015.
[4] P. Simon, «Too Big to Ignore: The Business Case for Big Data,» Wiley, 2013.
[5] T. Mitchell, Machine Learning, McGraw Hill, 1997.
myCloudDoor
Adopt a Cloud!

Leave a Reply

Your email address will not be published.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Share This

Copy Link to Clipboard

Copy