¿Cuáles son los principales problemas a la hora de clasificar objetos?

Clasificar objetos y materiales como sólidos, líquidos y gases en función de algunas características observables

Para proyectos serios, recomendamos usar los dos flujos de trabajo, Clasificación de píxeles y Clasificación de objetos, por separado, usando la salida generada por el primero como entradas adicionales en el segundo.

Este applet encuentra los componentes conectados (objetos) en el mapa de segmentación binaria proporcionado y calcula las funciones definidas por el usuario para cada objeto. Para inspeccionar componentes conectados, habilite la capa “Objetos (componentes conectados)”. Si selecciona un atributo del objeto, el análisis de los componentes conectados se realiza automáticamente.

En ese caso, la vecindad del objeto (especificada por el usuario en la parte inferior del cuadro de diálogo) se encuentra usando una transformación de distancia, y el atributo se calcula para el objeto mismo y para la vecindad que incluye y excluye el objeto.

Después de que el usuario seleccione las funciones deseadas, el applet procede a calcularlas. Para grandes conjuntos de datos 3D, este paso puede llevar mucho tiempo. Sin embargo, tenga en cuenta que seleccionar más funciones en este paso no suele ser más costoso computacionalmente. Por lo tanto, le recomendamos que seleccione todas las funciones que cree que puede probar para la clasificación y luego elija un subconjunto de esas funciones del subprograma a continuación.

https://www.youtube.com/watch?v=xcJ615qmDyo

Problemas con la clasificación taxonómica

En estadística, la clasificación es el problema de identificar a cuál de un conjunto de categorías (subpoblaciones) pertenece una observación (u observaciones). Los ejemplos incluyen la asignación de una dirección de correo electrónico particular a la clase “spam” o “no spam” y la asignación de un diagnóstico a un paciente en particular según las características observadas del paciente (sexo, presión arterial, presencia o ausencia de ciertos síntomas, etc.).

Las observaciones individuales a menudo se analizan en una serie de propiedades cuantificables, también llamadas variables explicativas o características. Estas propiedades pueden ser categóricas (por ejemplo, “A”, “B”, “AB” u “O”, para el tipo de sangre), ordinales (por ejemplo, “grande”, “mediano” o “pequeño”), número entero (por ejemplo, la cantidad de veces que aparece una palabra en particular en un correo electrónico) o valor real (por ejemplo, una lectura de presión arterial). Otras clasificaciones funcionan comparando las observaciones con las anteriores utilizando una función de similitud o distancia.

Un algoritmo que implementa la clasificación, especialmente en una implementación concreta, se conoce como clasificador. El término “clasificador” también se refiere a veces a la función matemática implementada por un clasificador

Problemas de clasificación de imágenes interesantes

No faltan problemas interesantes en la visión artificial, desde la clasificación de imágenes simples hasta la estimación de la posición en 3D. Uno de los temas que más nos interesan y en los que hemos trabajado mucho es la detección de objetos. Al igual que muchos problemas de visión por computadora, todavía no hay una forma obvia o incluso “mejor” de abordar el problema, lo que significa que todavía hay mucho margen de mejora. Antes de entrar en la detección de objetos, demos una breve descripción de los problemas más comunes en esta área.

Probablemente el problema más conocido en visión artificial. Consiste en clasificar una imagen en una de muchas categorías diferentes. Uno de los conjuntos de datos más populares utilizados en el mundo académico es ImageNet, que consta de millones de imágenes clasificadas, que se utilizan (en parte) en el ImageNet Large Scale Visual Recognition Challenge (ILSVRC) anual. En los últimos años, los modelos de clasificación han superado el logro humano y se considera prácticamente resuelto. Si bien existen muchos desafíos en la clasificación de imágenes, también se ha escrito mucho sobre cómo se resuelve normalmente y cuáles son los desafíos restantes.

Problemas y soluciones de procesamiento de imágenes

El aprendizaje profundo se está convirtiendo rápidamente en una herramienta importante en las aplicaciones de IA (LeCun et al. 2015). Por ejemplo, en áreas como la visión por computadora, el procesamiento del lenguaje natural y el reconocimiento de voz, el aprendizaje profundo ha producido resultados notables. Es por eso que hay un interés creciente en el aprendizaje profundo.

Uno de los temas en los que sobresale el aprendizaje profundo es la clasificación de imágenes (Rawat y Wang 2022). El propósito de la clasificación de imágenes es clasificar una imagen específica según una serie de categorías posibles. Un ejemplo clásico de clasificación de imágenes es la identificación de gatos y perros en una serie de imágenes (por ejemplo, la competencia Kaggle Dogs vs. Cats).

Desde una perspectiva de aprendizaje profundo, el problema de clasificación de imágenes se puede resolver mediante el aprendizaje por transferencia. De hecho, varios resultados de vanguardia en la clasificación de imágenes se basan en soluciones de aprendizaje por transferencia (Krizhevsky et al. 2012, Simonyan & Zisserman 2014, He et al. 2022). Pan y Yang (2010) brindan una descripción completa del aprendizaje por transferencia.

Publicaciones relacionadas

Botón volver arriba