banner
Hogar / Noticias / Una mirada más cercana a las imágenes 3D
Noticias

Una mirada más cercana a las imágenes 3D

Jun 10, 2024Jun 10, 2024

Cuadro 1: Este mapa de tecnologías 3D ilustra los diferentes tipos de imágenes 3D según sean activas o pasivas y si utilizan triangulación, tiempo de vuelo o interferometría. Fuente: ENFERMO

Gráfico 2: este gráfico muestra cómo se comparan varias tecnologías 3D al considerar la resolución y precisión Z versus la distancia y el campo de visión (FOV). Fuente: ENFERMO

A menudo hay muchas formas posibles de resolver una tarea de visión específica. En algunos casos, la elección entre visión 2D o 3D es obvia, pero en otros casos ambas tecnologías podrían funcionar aunque cada una ofrece ciertos beneficios. Es importante comprender estos beneficios y cómo se aplican a una aplicación determinada para poder proporcionar una solución de visión artificial confiable. En general, el 3D es más adecuado no sólo para analizar el volumen, la forma o la posición 3D de los objetos, sino también para detectar piezas y defectos que tienen poco contraste pero que tienen una diferencia de altura detectable. La tercera dimensión se utiliza principalmente para medir, inspeccionar y posicionar, pero también hay casos en los que se utiliza 3D para leer código o texto impreso cuando falta información de contraste.

La captura de la tercera dimensión se puede realizar de muchas formas diferentes y cada una de las tecnologías de visión artificial disponibles tiene sus ventajas y desventajas. Las imágenes tridimensionales se pueden dividir en dos categorías principales: pasivas y activas. A partir de ahí se puede dividir en técnicas mucho más específicas. Las técnicas pasivas incluyen profundidad de foco, campo de luz y estéreo. Las principales técnicas activas se basan en el tiempo de vuelo, la luz estructurada y la interferometría. Las imágenes tridimensionales se pueden desglosar aún más en cómo se adquiere realmente la imagen, incluidos los métodos de instantánea y escaneo.

TECNOLOGÍA INSTANTÁNEA

Hay sistemas tanto activos como pasivos que utilizan el método de "instantánea". Esta es la técnica con la que la mayoría de la gente está familiarizada, ya que es el método utilizado en las cámaras que han utilizado durante años. El método de instantánea captura todos los píxeles de la imagen al mismo tiempo que crea la imagen instantánea. En el caso del estéreo pasivo, hay múltiples imágenes capturadas desde diferentes perspectivas y la diferencia entre las imágenes se utiliza para calcular la distancia al objeto (piense en la vista humana). Esta misma solución también se puede lograr con una sola cámara, si la cámara se puede mover a varias ubicaciones.

Una técnica de instantánea activa incluiría el tiempo de vuelo, que mide cuánto tiempo le toma a la luz viajar hasta el objetivo y regresar a una matriz de sensores. De esta forma, cada píxel obtiene directamente una medición 3D y sólo se necesita un sensor. Existen variaciones de la técnica de la instantánea, como la opción activa de proyección de luz codificada. En este caso, se capturan varias imágenes de alta velocidad del mismo objeto a medida que cambia el patrón de iluminación. Luego se crea una imagen compuesta que muestra la profundidad en función de las diferencias en los patrones de iluminación. Normalmente los patrones son una serie de líneas cada vez más estrechas; Se utilizan líneas cada vez más finas para lograr una mayor resolución.

TECNOLOGÍA DE ESCANEO

Luego están las técnicas de escaneo como la triangulación láser, donde se proyecta una luz láser sobre el objeto y la cámara captura (generalmente a alta velocidad) imágenes de la proyección de la luz a medida que el objeto se mueve a través del área de escaneo. Un tipo diferente de técnica de escaneo es la profundidad desde el foco. Los datos tridimensionales se crean tomando una secuencia de imágenes en un rango preestablecido. La pila de imágenes se escanea para ver dónde se maximiza el enfoque local y el rango se deriva de esto. Este método, si bien es beneficioso porque no se necesita luz estructurada, puede ser lento y el objeto debe tener cierta estructura para estimar el enfoque.

En una tecnología de escaneo, las imágenes 3D se adquieren perfil por perfil, ya sea moviendo el objeto a través de la región de medición o moviendo la cámara sobre el objeto. Para obtener los datos 3D correctos y, por tanto, una imagen 3D válida, el movimiento debe ser constante o bien conocido, por ejemplo, mediante el uso de un codificador para rastrear el movimiento. Las imágenes 3D creadas suelen ser muy precisas. Las tecnologías de instantáneas crean una imagen 3D completa de los objetos tomando una sola foto como una cámara de consumo típica, pero en 3D. El movimiento del objeto o de la cámara no es necesario, pero las tecnologías producen imágenes que no son tan precisas como las tecnologías de escaneo.

Las tecnologías de imágenes 3D que se describen con más detalle a continuación son la triangulación láser (escaneo), el tiempo de vuelo (instantánea) y el estéreo (instantánea).

TRIANGULACIÓN LÁSER

La triangulación láser utiliza una línea láser y una cámara para recopilar perfiles de altura a través del objeto. Los perfiles se juntan para crear una imagen 3D mientras el objeto se mueve. Dado que la adquisición del perfil de altura requiere el movimiento del objeto, el método es una tecnología de escaneo. La triangulación láser tiene una mayor precisión de medición que el tiempo de vuelo, pero tiene un rango de medición más limitado. Además, la oclusión es posible cuando la cámara no puede ver el láser cuando está oculto detrás de un objeto. Las aplicaciones típicas incluyen inspección de troncos/tablas/chapas de madera, inspección de componentes eléctricos/pasta de soldadura y aplicaciones de inspección de alimentos y embalajes. A continuación se detallan algunas de las ventajas y limitaciones clave de la triangulación láser:

Ventajas:

Limitaciones:

TIEMPO DE VUELO

Las cámaras 3D de tiempo de vuelo (TOF) crean imágenes en 3D mediante instantáneas. Esto significa que no se necesita ningún objeto ni movimiento de cámara. La tecnología mide el tiempo de vuelo de una señal luminosa entre el dispositivo y el objetivo para cada punto de la imagen. Conociendo el cambio de fase del tiempo de llegada de la señal con respecto a la señal inicial, se puede derivar la distancia entre el dispositivo y el objetivo. El resultado es una imagen 3D instantánea del objetivo. El tiempo de vuelo es muy adecuado para aplicaciones con un gran campo de visión y una distancia de trabajo superior a 0,5 m.

Ventajas:

Limitaciones:

ESTÉREO

Las imágenes estéreo funcionan de manera similar a la visión humana y proporcionan imágenes instantáneas en 3D sin necesidad de movimiento externo. Combina dos imágenes 2D tomadas desde diferentes posiciones y encuentra correlaciones entre las imágenes para crear una imagen de profundidad. A diferencia de la triangulación láser y TOF, la tecnología estéreo no depende de una fuente de luz dedicada. Sin embargo, para encontrar correlaciones, las dos imágenes deben tener suficientes detalles y los objetos suficiente textura o falta de uniformidad. Por tanto, es adecuado para aplicaciones con un gran campo de visión y para uso en exteriores. Para obtener mejores resultados, es posible que sea necesario agregar esos detalles iluminando la escena con iluminación estructurada.

Ventajas:

Limitaciones:

En resumen, existen varios métodos para lograr imágenes en 3D; La selección de uno depende de cuál sería el más apropiado para una aplicación determinada y su entorno. Así como hay varias formas de capturar datos 3D, existen un par de formas diferentes de procesar esas imágenes.

SENSORES DE VISIÓN CONFIGURABLES

Los sistemas de visión más simples son cámaras autónomas con activación de imágenes, iluminación y capacidades integradas de análisis de imágenes. Su configuración es sencilla y puede ser realizada por cualquier persona técnicamente orientada tras unas horas de formación. Los beneficios importantes de los sensores de visión configurables incluyen:

PROGRAMABLES (CÁMARAS INTELIGENTES)

Estas cámaras se encuentran en el rango medio de complejidad. Al igual que los configurables, el análisis está integrado en el dispositivo. La diferencia es que son más flexibles en la configuración del hardware y la programación del software. Se necesitan unos días de formación para convertirse en desarrollador de aplicaciones. Los beneficios importantes de las cámaras inteligentes programables incluyen:

STREAMING (PC-VISIÓN)

Los sistemas de visión más flexibles están basados ​​en PC. Las cámaras generan imágenes mientras el análisis se realiza en una PC. Los desarrolladores de aplicaciones expertos suelen preferir este tipo de sistema, ya que permite total flexibilidad para crear algoritmos y funcionalidades de sistema personalizados en aplicaciones exigentes. Los beneficios importantes de la transmisión por secuencias incluyen:

ELEGIR LA TECNOLOGÍA ADECUADA PARA SU APLICACIÓN

Medir la tercera dimensión proporciona conocimiento sobre la altura, la forma o el volumen del objeto, pero a menudo los requisitos son difíciles de precisar. Los requisitos para 3D pueden ser difíciles de definir para algunos usuarios/clientes, ya que no están acostumbrados a definir cosas de esta manera. Por lo tanto, trabajar con el cliente para definir los requisitos, mientras se realizan pruebas en un proceso iterativo, puede ser una buena estrategia.

Como ocurre con cualquier proyecto de visión, es imperativo definir los requisitos y los criterios de aceptación. Eso incluye la idea de que la clasificación nunca es del 100%. Eso significa definir con su cliente el impacto de los falsos positivos (rechazar las partes buenas) frente a los falsos negativos (aceptar una parte mala). El impacto puede ser muy diferente según la aplicación.

Con todas las diferentes opciones disponibles para capturar y procesar datos 3D, puede parecer abrumador, pero si se concentra en lo básico como el campo de visión, la distancia al objeto, la velocidad de la aplicación, la velocidad de los objetos que se miden y, en general, resolución requerida, encontrará una tecnología para resolver su aplicación. q

Jim Andersones el consultor de negocios digitales para visión artificial en SICK Inc. Para obtener más información, envíe un correo electrónico a [email protected] o visite www.sickusa.com.

TECNOLOGÍA DE INSTANTÁNEATECNOLOGÍA DE ESCANEOTRIANGULACIÓN LÁSERTIEMPO DE VUELOESTÉREOSENSORES DE VISIÓN CONFIGURABLESPROGRAMABLES (CÁMARAS INTELIGENTES)STREAMING (PC-VISIÓN)ELEGIR LA TECNOLOGÍA ADECUADA PARA SU APLICACIÓNJim Anderson