Reconocimiento de imágenes: Conceptos básicos

Cath Sandoval
Copywritter

Comparte este contenido:

Share on facebook
Share on twitter
Share on linkedin
Share on email
Share on whatsapp

El reconocimiento de imágenes con aprendizaje profundo es una aplicación clave de la visión de la IA y se emplea para impulsar una gran gama de casos de uso en el mundo real en la actualidad.

¿Qué es el reconocimiento de imágenes?

En palabras simples, se trata de la tarea de identificar objetos de interés dentro de una imagen y reconocer a qué categoría pertenecen. El reconocimiento de fotos y el reconocimiento de imágenes son términos que se utilizan indistintamente.

Cuando detectamos visualmente un objeto o una escena, identificamos automáticamente los objetos como instancias diferentes y los asociamos con definiciones individuales. Sin embargo, el reconocimiento visual es una tarea muy compleja para las máquinas.

El reconocimiento de imágenes mediante inteligencia artificial es un tema de investigación de larga data en el campo de la visión por ordenador. Aunque a lo largo del tiempo han evolucionado diferentes métodos, el objetivo común del reconocimiento de imágenes es la clasificación de los objetos detectados en diferentes categorías (también se denomina reconocimiento de objetos).

En los últimos años, el aprendizaje automático, en particular la tecnología de aprendizaje profundo, logró grandes éxitos en muchas tareas de visión por ordenador y comprensión de imágenes. 

¿Para qué se usa el reconocimiento de imágenes?

En todos los sectores, la tecnología de reconocimiento de imágenes con IA es cada vez más imprescindible. Sus aplicaciones aportan valor económico en sectores como la sanidad, el comercio minorista, la seguridad, la agricultura y muchos más.

Tres modelos de aprendizaje automático de reconocimiento de imágenes más populares

Gracias al artículo de viso.ai pudimos conocer estos tres tipos de modelos más populares:

Máquinas de vectores de apoyo

Las SVM funcionan haciendo histogramas de imágenes que contienen los objetos objetivo y también de imágenes que no los contienen. A continuación, el algoritmo toma la imagen de prueba y compara los valores del histograma entrenado con los de varias partes de la imagen para comprobar si hay coincidencias.

Modelos de bolsa de características

Estos modelos, como la transformación de características invariantes de escala (SIFT) y las regiones extremas máximamente estables (MSER), funcionan tomando como referencia la imagen que se va a escanear y una foto de muestra del objeto que se va a encontrar. A continuación, intenta hacer coincidir los rasgos de la foto de muestra con varias partes de la imagen de destino para ver si se encuentran coincidencias.

Algoritmo Viola-Jones

Es un algoritmo de reconocimiento facial muy utilizado en la época anterior a las redes neuronales convolucionales, funciona escaneando rostros y extrayendo características que luego pasan por un clasificador de refuerzo. Este, a su vez, genera una serie de clasificadores potenciados que se usan para comprobar las imágenes de prueba.

Para encontrar una coincidencia con éxito, una imagen de prueba debe generar un resultado positivo de cada uno de estos clasificadores.

Modelos de reconocimiento de imágenes de aprendizaje profundo

Los modelos de aprendizaje profundo más populares, como YOLO, SSD y RCNN, utilizan capas de convolución para analizar una imagen o fotografía. Durante el entrenamiento, cada capa de convolución actúa como un filtro que aprende a reconocer algún aspecto de la imagen antes de pasar a la siguiente.

Una capa procesa los colores, otra las formas, y así sucesivamente. Al final, se tiene en cuenta un resultado compuesto de todas estas capas para determinar si se ha encontrado una coincidencia.

¡Este tema es bastante extenso! Pero hemos hecho para ti una serie de artículos con información comprimida que te enseñará todo lo que debes saber del reconocimiento de imágenes.

¡Está atento y no te lo pierdas!

Continua leyendo...

Cath Sandoval

Copywritter

Se esperan 170 millones de dólares de pérdidas por malas gestiones en los reclamos de las compañías de seguros

Lorem fistrum por la gloria de mi madre esse jarl aliqua llevame al sircoo. De la pradera ullamco qué dise usteer está la cosa muy malar.

Cath Sandoval

Copywritter

Desafíos para los seguros en la era del «Nuevo Normal»

Lorem fistrum por la gloria de mi madre esse jarl aliqua llevame al sircoo. De la pradera ullamco qué dise usteer está la cosa muy malar.

Cath Sandoval

Copywritter

Seguros en Argentina: continúa la expansión regional de LISA Insurtech

Lorem fistrum por la gloria de mi madre esse jarl aliqua llevame al sircoo. De la pradera ullamco qué dise usteer está la cosa muy malar.