miércoles, 6 de febrero de 2013

Visión computacional(LAB) - Python, Escala a grises, Blanco y negro y difuminación

Que tal compañeros para esta entrada se nos dio a la tarea de hacer un .py que procesara una imagen y la convirtiera a grises, blanco y negro y difusa.

Antes de empezar
Recuerden que una imagen de colores por lo general esta formada por 3 bytes que son representados como R,G,B. Donde cada byte admite hasta 256 variaciones de color.

Ejemplo:
                  R     G     B
    Pixel = (255, 255, 255)   => Pixel TOTALMENTE blanco.


                B
    Pixel = (000)   => Pixel TOTALMENTE negro.


Escala a grises
En realidad es algo sencillo, para esta tarea yo use el método del MAX que es uno de las sencillos. Se trata de sacar el máximo byte del pixel y a continuación asignarlo al nuevo pixel.


Blanco y negro
Para sacar esta tarea aplicamos el método del promedio, el cual compara el promedio del pixel contra 2 parámetros de entrada(MIN y MAX) que a grandes rasgos lo que hacen es... si el promedio tiende a cero(blanco) el nuevo pixel valdrá cero en sus tres bytes y si tiende a 255(negro) sus nuevos bytes ahora valdrán 255. En caso de que no caiga dentro del rango el pixel se mantiene igual.


Difuminación
Para sacar esta tarea tenemos que usar CASI la misma metodología que en escala a grises, lo que primero hice fue sacar el máximo byte de todos los pixeles vecinos después el mayor de los mayores y este byte es el que se le asigna al nuevo pixel.

Como lo aplique... Yo estoy manejando la imagen como una lista de listas, supongamos que queremos sacar los vecinos del primer pixel, lo primero que hacemos es sacar sus vecinos de los lados... esto es sencillo solo restamos o sumamos uno al pixel... que en mi caso es disminuir en 1 y aumentar en 1 la lista, agregando try-except en caso de querer restar pixes que no existen. Para sacar los vecinos de arriba-abajo me valgo solo de sumar o restar el ancho de la imagen al numero del pixel... la teoría nos dice que si a un pixel le sumas el ancho de la imagen te encontraras en su vecino de abajo y si restamos nos encontraremos en el vecino de arriba. Sabiendo esto es fácil programarlo.


Código
Ve al git

Resultados


Imagen original
Imagen a grises

Imagen Blanco-negro con umbral MIN = 80 y MAX = 200

Imagen Blanco-negro con umbral MIN = 110 y MAX = 180

Imagen difusa


Comentarios

  • Se utilizo una imagen de 497x512.
  • En los tiempos de ejecución los podemos observar que umbral tarda mucho mas que los demás métodos porque calcula el promedio de cada pixel.

Tiempos de ejecución
Referencias

http://www.pythonware.com/library/pil/handbook/image.htm