viernes, 23 de marzo de 2012

Reporte 7 - Distribuidos

Esta semana estubo buena, aclaramos puntos que teniamos que hacer, se puso en claro que es lo que habiamos logrado, y tambien lo que se logra hacer.

En la casa de Saúl, se vieron puntos como:

¿Con que distrubuccion trabajar?                                                                       = Ububtu 10.04
¿Cual es la mejor 32/64 bits?                                                                            = 64 bits
¿Cuales herramientas vamos a instalar para hacer nuestra distribucción?
¿Que lograremos?                                                                                            = conectar todas las pc por vpn
¿Fecha?                                                                                                          = empezamos el 26 de marzo

Ahora que esta todo en la mesa y las cartas repartidas, ya nadamas es cuestion de jugar un rato (con la configuración).

Mostrando avances


Leí sobre MPI y vi muchos códigos, PUNTOS EXTRAS para Emmanuel, por una entrada bien explicada el cual me guié. El objetivo de esta semana era modificar el código de Cecy (pi en paralelo) para hacerlo para cluster.

Este es el código que tengo hasta ahora, como pueden ver es el mismo código que Cecy, entonces, ¿que lo hace diferente? solamente 2 lineas (lo relevante).

import random
import math
import mpi

def enCirculo(x,y):
 acierta = false
 resultado = x**2 + y**2
 if resultado <= 1
  acierta = true
 return acierta

def piCalculo(n):
 c=0
 random.seed(mpi.rank)
 for i in range(n):
  x = random.random()
  y = random.random() 
  acierta = enCirculo(x,y)
  if acierta:
   c += 1
  pi = (4.0*c)/n
 return pi

if mpi.rank == 0:
 print "pi=", piCalculo(10000000/mpi.size), "para un rango", mpi.rank

pimpi = (1.0/mpi.size) * mpi.allreduce(pi,mpi.SUM)

if mpi.rank == 0
 print "valor calculado de PI en", mpi.size, "procesos es" ,pimpi
 print "usando", mpi.size*n, "numeros"


Lo Relevante

Se agregaron varias lineas, al final del código. Pero lo interesante ocurre en las siguientes 2 lineas

random.seed(mpi.rank)

Esto inicializa el generador de números aleatorios, lo que garantiza que nos da una secuencia diferentes
en cada proceso.

mpi.allreduce(pi,mpi.SUM)

Esto nos proporciona una forma de sumar los resultados obtenidos en los procesos. Este programa calcula pi, sumando el promedio de los resultados obtenidos en cada proceso individual.

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
En estos momentos estoy peleando con instalando/configurando el cluster, para correr el ejemplo. El programa lo hice a mano y segun yo debe funcionar.

nadamas que el cluster este listo, pongo las impresiones de pantalla.