Thesis Directed
Relative Depth from Blur
Student: Pol Moreno
MSc. Thesis in Computer Engineering
Defense: July 2012
Retrieving the depth structure of a scene has been an active research topic for many decades in Computer Vision. Most of the approaches have been inspired in the
way our visual system works; it is not surprising, we are able to interact and move in our environment with extraordinary accuracy. We tackle the challenging task
of estimating the relative depth from a single observation with unknown camera parameters using the blur cue. To this end, we develop a method that estimates the
blur in the scene as it is related to the depth. We do so by using a reverse diusion process that sharpens each region of the image; the time it takes before the process
becomes unstable is used as the measure of relative depth. We propose:
1. A robust measure to detect when to stop the reverse diusion based on the maximum curvature point of the Sum of Modied Laplacian measure.
2. An adaptive window mechanism to achieve more accurate estimations around the image edges.
3. A global integration technique applied to the local depth estimates based on the bilateral filter.
Although there are certain limitations concerning the characteristics of the image structure, experiments show encouraging results: our method is able to retrieve the
relative depth of a scene with a high degree of accuracy.
MSc. Thesis in Computer Engineering
Defense: July 2012
Retrieving the depth structure of a scene has been an active research topic for many decades in Computer Vision. Most of the approaches have been inspired in the
way our visual system works; it is not surprising, we are able to interact and move in our environment with extraordinary accuracy. We tackle the challenging task
of estimating the relative depth from a single observation with unknown camera parameters using the blur cue. To this end, we develop a method that estimates the
blur in the scene as it is related to the depth. We do so by using a reverse diusion process that sharpens each region of the image; the time it takes before the process
becomes unstable is used as the measure of relative depth. We propose:
1. A robust measure to detect when to stop the reverse diusion based on the maximum curvature point of the Sum of Modied Laplacian measure.
2. An adaptive window mechanism to achieve more accurate estimations around the image edges.
3. A global integration technique applied to the local depth estimates based on the bilateral filter.
Although there are certain limitations concerning the characteristics of the image structure, experiments show encouraging results: our method is able to retrieve the
relative depth of a scene with a high degree of accuracy.
Diseño e implementación de una aplicación móvil para la detección e identificación de patrones de color perceptual orientada a personas con problemas de visión
Student: Albert Vicente
MSc. Thesis in Computer Engineering
Defense: July 2012
La principal motivación de este proyecto es aprovechar el gran desarrollo actual en tecnologías y dispositivos móviles para mejorar la calidad de vida de las personas que sufren alguna discapacidad visual, ya sea ceguera total, parcial u otros problemas graves de visión como el daltonismo.
Aunque en los últimos años se ha producido un avance espectacular desde el punto de vista tecnológico, esto no siempre se ha reflejado en una mejora significativa de la calidad de vida de las personas con problemas de visión. El objetivo de este proyecto final de carrera es acortar esta brecha tecnológica mediante el diseño e implementación, teniendo en cuenta la situación del mercado actual y las principales plataformas disponibles, de una aplicación móvil capaz de extraer o detectar los diferentes patrones de color perceptual de una imagen tomada por el usuario desde el dispositivo móvil. Utilizando el audio del propio dispositivo, la aplicación permitirá que el usuario tenga un conocimiento preciso de los principales patrones de color de la imagen con cierta independencia del nivel de iluminación de la misma. Además, el usuario podrá crear su propia base de datos personalizada de patrones (organizada mediante etiquetas de voz grabadas por él mismo) y usarla para comparar y realizar búsquedas en cualquier momento.
Durante todo el proceso de diseño se ha tenido muy presente al usuario final, maximizando en el proceso de diseño aspectos claves para que la aplicación sea realmente útil para las personas con problemas de visión como la simplicidad, la navegabilidad y la interacción y respuesta en tiempo real.
Una vez finalizado el diseño y la implementación, el objetivo último de este proyecto es hacer accesible la aplicación al mayor número de personas. Por este motivo, será publicada en el mercado de la plataforma móvil seleccionada.
MSc. Thesis in Computer Engineering
Defense: July 2012
La principal motivación de este proyecto es aprovechar el gran desarrollo actual en tecnologías y dispositivos móviles para mejorar la calidad de vida de las personas que sufren alguna discapacidad visual, ya sea ceguera total, parcial u otros problemas graves de visión como el daltonismo.
Aunque en los últimos años se ha producido un avance espectacular desde el punto de vista tecnológico, esto no siempre se ha reflejado en una mejora significativa de la calidad de vida de las personas con problemas de visión. El objetivo de este proyecto final de carrera es acortar esta brecha tecnológica mediante el diseño e implementación, teniendo en cuenta la situación del mercado actual y las principales plataformas disponibles, de una aplicación móvil capaz de extraer o detectar los diferentes patrones de color perceptual de una imagen tomada por el usuario desde el dispositivo móvil. Utilizando el audio del propio dispositivo, la aplicación permitirá que el usuario tenga un conocimiento preciso de los principales patrones de color de la imagen con cierta independencia del nivel de iluminación de la misma. Además, el usuario podrá crear su propia base de datos personalizada de patrones (organizada mediante etiquetas de voz grabadas por él mismo) y usarla para comparar y realizar búsquedas en cualquier momento.
Durante todo el proceso de diseño se ha tenido muy presente al usuario final, maximizando en el proceso de diseño aspectos claves para que la aplicación sea realmente útil para las personas con problemas de visión como la simplicidad, la navegabilidad y la interacción y respuesta en tiempo real.
Una vez finalizado el diseño y la implementación, el objetivo último de este proyecto es hacer accesible la aplicación al mayor número de personas. Por este motivo, será publicada en el mercado de la plataforma móvil seleccionada.
Felipe Calderero - Image Processing Group - UPF