Machine learning: Top preguntas pt. 1

La inteligencia artificial y el Machine learning han sido tecnologías por las que muchas empresas han apostado. De hecho son complejas pero nos ofrecen una gran cantidad de beneficios.

En una serie de 4 artículos, hemos recopilado las preguntas más relevantes sobre el Machine learning.

¿Te parece si empezamos?

¿Qué es el aprendizaje automático?

El aprendizaje automático es una rama de la informática que se ocupa de la programación de sistemas para aprender automáticamente y mejorar con la experiencia.

Por ejemplo: Los robots se programan para que puedan realizar tareas al basarse en los datos que recogen de los sensores. Los programas aprenden automáticamente a partir de los datos.

¿Qué es el sobreajuste en el aprendizaje automático?

En el aprendizaje automático, cuando un modelo estadístico describe es bueno en la predicción de muestras vistas, pero tiene un rendimiento muy pobre en muestras no vistas.

El modelo muestra un rendimiento pobre que ha sido sobreajustado.

¿Por qué se produce el sobreajuste?

La posibilidad de que se produzca un sobreajuste, se debe a que los criterios utilizados para entrenar el modelo, no son los mismos que fueron usados para juzgar la eficacia de un modelo.

Es posible que se haya olvidado dejar suficientes muestras para probar el poder de generalización del modelo sobre muestras no vistas.

¿Cómo se puede evitar el sobreajuste?

Al utilizar muchos datos se puede evitar el sobreajuste, el cual se produce relativamente cuando se tiene un conjunto de datos pequeños y se intenta aprender de él. Pero si tienes una base de datos pequeña y te ves obligado a elaborar un modelo basado en ella, se puede utilizar una técnica conocida como validación cruzada.

En este método, el conjunto de datos se divide en dos secciones, los conjuntos de datos de prueba y los de entrenamiento. El primero probará el modelo mientras que, el segundo, los puntos de datos llegarán al modelo.

En esta técnica, se suele dar a un modelo, un conjunto de datos conocidos sobre los que se ejecuta el entrenamiento (conjunto de datos de entrenamiento), y un conjunto de datos desconocidos contra los que se prueba el modelo.

La idea de la validación cruzada es definir un conjunto de datos para «probar» el modelo en la fase de entrenamiento.

Contar con tecnología como el Machine learning siempre será una oportunidad de innovación por parte de las empresas aseguradoras. Es por ello que, así como este, te traeremos en los próximos días, una serie de artículos donde desarrollaremos todo el tema.

¡No puedes perdértelo!

¿Qué es el aprendizaje automático?

¿Qué es el sobreajuste en el aprendizaje automático?

¿Por qué se produce el sobreajuste?

¿Cómo se puede evitar el sobreajuste?

Deja una respuesta