lunes, abril 4

Métodos de Generación de Variables Aleatorios

MÉTODO DE LA TRANSFORMADA INVERSA

Utiliza la distribución acumulada F(x) de la distribución que se va a simular. Puesto que F(x) está definida en el intervalo (0;1) , se puede generar un numero aleatorios uniforme R y tratar de determinar el valor de la variable aleatoria para la cual su distribución acumulada es igual a R, es decir, el valor simulado de la variable aleatoria que sigue una distribución de probabilidad F(x), se determina al resolver la siguiente ecuación:

F(x)= R ó x = F-1(R)



La dificultad principal de este método descansa en el hecho de que en algunas ocasiones es difícil encontrar la transformada inversa. Sin embargo, si esta función ya ha sido establecida, generando número aleatorios uniformes se podrá obtener valores de la variable aleatoria que siga la distribución de probabilidad deseada.

MÉTODO DE  RECHAZO
Existe otro procedimiento para generar números al azar da distribución de probabilidades no-uniformes. A este procedimiento se le conoce con el nombre de rechazo. Este método consiste primeramente en generar un valor de la variable aleatoria y en seguida probar que dicho valor simulado proviene de la distribución de probabilidad que se está analizando. La aplicación del método de rechazo implica el desarrollo de los siguientes pasos:

1. Generar dos números uniformes R1 y R2
2. Determinar el valor de la variable aleatoria x de acuerdo a la siguiente relación lineal de R1:
X= a + (b-a) R1

3. Evaluar la función de probabilidad en x= a + (b-a) R1

4. Determinar si la siguiente desigualdad se cumple:
R2 ≤ F(a + (b-a) R1)/M

Se utiliza a x= a + (b-a) R1 si la respuesta es afirmativa como un valor simulado de la variable aleatoria. De lo contrario, es necesario pasar nuevamente al paso 1 tantas veces como sea necesario.
La teoría sobre la que se apoya este método se basa en el hecho de que la probabilidad de que R2 ≤ F(x)/M. Por consiguiente, si un numero es escogido al azar de acuerdo a x= a + (b-a) R1 y  rechazo si R2 > F(x)/M, entonces la distribución de probabilidad de las x aceptadas será exactamente F(x). Por otra parte, conviene señalar que si todas las x fueran aceptadas, entonces x estaría uniformemente distribuida entre a y b.

MÉTODO DE COMPOSICIÓN

Otro método para generar valores de variables aleatorias no-uniformes es el método de composición. Mediante este método la distribución de probabilidad F(x) se expresa como una mezcla de varias distribuciones de probabilidad F(x) seleccionadas adecuadamente.
El procedimiento para la selección de las F(x) se basa en el objetivo se minimizar el tiempo de computación requerido para la generación de valores de la variable aleatoria analizada.
Los pasos requeridos para la aplicación de este método en la simulación de variables no-uniformes son los siguientes:

1. Dividir la distribución de probabilidad original en sub-áreas, tal como se muestra en la figura
2. Definir la distribución de probabilidad para cada sub-área.

3. Expresar la distribución de probabilidad original en la forma siguiente:
F(x)=A1F1(x) +  A2F2(x) +… AnFn(x)  y  ∑Ai = 1

4. Obtener la distribución acumulada de las áreas:

5. Generar dos números uniformes R1, R2
6. Seleccionar la distribución de probabilidad F(x) con la cual se va simular el valor de x. La selección de esta distribución se obtiene al aplicar el método de la transformada inversa, en la cuel el eje Y está representado por la distribución acumulada de las areas, y el eje X por las distribuciones F(x). Para esta selección se utiliza el numero uniforme R1.

7. Utilizar el numero uniforme R2 para simular por el método de la transformada inversa o algún otro procedimiento especial, números al azar que sigan la distribución de probabilidad F(x) seleccionada en el paso anterior.

MÉTODO DE CONVOLUCIÓN


Muchas variables aleatorias incluyendo la normal,  binomial,  poisson, gamma, erlang,  etc., se pueden expresar de forma exacta o aproximada mediante la suma lineal de otras variables aleatorias. El método de convolución se puede usar siempre y cuando la variable aleatoria  x se pueda expresar como una combinación lineal de k variables aleatorias:
x=b1x1+ b2x2 +…+bkxk

En este método se necesita generar k números  aleatorios (u1,u2,...,uk) para generar (x1,x2,...xk) variables aleatorias usando alguno de los métodos anteriores y así poder obtener un valor de la variable que se desea obtener por convolución.


Bibliografía:



  • COSS BU Raúl, SIMULACION: UN ENFOQUE PRÁCTICO, Noriega Editores. 

viernes, marzo 11

Historia de los Numeros Aleatorios

Una forma de aprender cosas es leyendo historias, cuentos etc, a continuacion encontraras narrada a forma de cuento la historia de los numeros aleatorios:


UNA HISTORIA PARA APRENDER

Había una vez un par de amigos que querían ser matemáticos, se la pasaban en la biblioteca leyendo y leyendo libros de matemática, haciendo ejercicios y resolviendo cuanto problema se encontraban.

Un día Nicolas le dijo a su amigo Federico:

-- Federico, nosotros sabemos que es un numero  aleatorio pero, tu sabes desde cuando se habla de aleatoriedad.

Federico respondió:

-- Buena  pregunta qué te parece si vamos buscamos acerca de ello y mañana hablamos.

Nicolas  acepto la propuesta de Federico. Al día siguiente Federico llego hablando de lo que había encontrado, le comento a su amigo que había encontrado que desde hace muchos años aproximadamente 3500 A.C. los instrumentos que usaban para los juegos de azar eran de hueso en lugares como Egipto, estos podrían ser los dados de la época.
Nicolas no se quedo atrás y antes que Federico siguiera le dijo: el noble francés Antonie Gombauld en el siglo XVII puso en duda el éxito y fracaso en las mesas de juegos y le formulo a un matemático también francés Blaise Pascal de ¿cuál era la probabilidad de sacar dos seis con un par de dados en 24 lanzamientos?, Federico se sorprendió, 24 lanzamientos, me imagino que no le respondió porque en la época no había la tecnología que tenemos ahora para responder eso en un 2x3.

A lo que Nicolas respondió, no amigo estas equivocado, si la tecnología que tenemos ahora fue desarrollada a las cosas que antes se hacía a la antigua es decir  a lo manual somos afortunados porque hubieron personas que se imaginaron hacer esas cosas de una manera más fácil, pero bueno de eso no hablábamos, como te dije si respondió este problema porque al igual que Gombauld, Pascal sintió interés por la teoría de probabilidad que incluso lo comentaron con un amigo de apellido de Fermat, Federico respondió Pierre de Fermat, ese mismo amigo dijo Nicolas, incluso los documentos que ellos escribieron fue la primera revista académica de probabilidad, encontraron solución a problemas que se consideraban no tenían, aunque tuvieron ayuda indirecta de Galilei y Giordamo Cardamo quienes ya habían encontrado probabilidades numéricas.

Federico agrego, sabes que también leí, que después de ellos hubieron otras personas quienes realizaron estudios como estos pero fue en el siglo XIX que el marqués de Laplace, Pierre Simon, reunió todas esas ideas iníciales y formuló la primera teoría de la probabilidad y que fue aplicada los juegos de azar, en eso Nicolas dijo si esa teoría ha sido desarrollada desde el siglo XVII y aplicada en diferentes campos de la ingeniería y ciencias y en el estudio de fenómenos mediante el método de Montecarlo .

Montecarlo? Dijo Federico extrañado, yo no leí nada de eso. En ese momento llego Alejandra, amiga de ellos la cual compartía el mismo sueño de ambos.

Hola amigos que mas, ¿qué hacen?, aquí hablando de azar, probabilidad y ahora que Nicolas menciona el método Montecarlo no sé qué es eso dijo Federico, hay yo te digo respondió Alejandra, el método fue llamado así por el principado de Mónaco por ser ``la capital del juego de azar'', al tomar una ruleta como un generador simple de números aleatorios. El nombre y el desarrollo sistemático de los métodos de Monte Carlo vienen aproximadamente de 1944 con el desarrollo de la computadora electrónica. John von Neumann y Stanislao Ulam, metrópolis  y Lehmer pueden ser nombrados en este campo.

¿Neumann el de teoría de juegos? Pregunto Nicolas, si ese mismo dijo Alejandra, valla ese señor si es un matemático neto, así quiero llegar a ser yo agrego Nicolas. Pero ¿ese fue el inicio del método? Dijo Federico, a lo que Alejandra dijo, no, fue en 1949 cuando se hizo oficial con la publicación de THE MONTECARLO METHOD de Metrópolis y Stanislaw.

Increíble cómo han cambiado las cosas, antes los números aleatorios eran generados por métodos manuales antes de la invención de las computadoras, ahora solo basta con entrar a Excel y usar  una formula exclamo Alejandra.

Ring ring era el celular de  Alejandra bueno amigos ya me voy nos vemos en el msn, listo nena chao dijeron los amigos, bueno parcero yo ya me voy también debo ir ayudar a mi hermanita con calculo integral dijo Nicolas y yo a mi primo con investigación de operaciones dijo Federico.
 Listo estamos hablando.
FIN

jueves, marzo 10

Mapa de Distribuciones

En el siguiente enlace encontraras algunas de las distribuciones continuas y discretas:


https://docs.google.com/document/d/1D8CDX7y1iZfrzC_NNvKDcEEeElOG1CvbKlMkcsxp6wU/edit?hl=en&pli=1#




Bibliografia: Hernandez Gonzales Francisco J.;Breve introducción a la investigación de operaciones; facultad de ingeniería de la universidad autónoma de san luis potosí

Metodos Congruenciales

Congruencial Mixto

Los generadores congruenciales lineales generan  una secuencia de numero pseudoaleatorios en la  cual el próximo numero pseudoaleatorios es determinado a partir del numero generado, es decir el numero pseudoaleatorios Xn+1 es derivado a partir del numero pseudoaleatorios Xn  
Para el caso particular del generador Congruencial mixto, la relación de decurrencia es la siguiente:

Xn+1 =( aXn  + C) mod m

Donde:
X0 = la semilla (X0 > 0)
a= el multiplicador (a>0)
c= constante aditiva (c>0)
m= el modulo (m>X0  , m>a y m>c)

Esta relación de recurrencia nos dice que Xn+1 es el residuo de dividir aXn + c entre el modulo.
Veamos el siguiente ejemplo:

Generar 2 números aleatorios de modulo 8 con constantes a= 5 y  c=7 y una semilla x0 = 4.
             XN+1= (5XN + 7)(MODULO 8)

X1= 27 MODULO 8= 3
X2=22 MODULO 8= 6


Congruencial Multiplicativo

Al igual que el generador Congruencial mixto, el generador Congruencial multiplicativo determina el próximo número pseudoaleatorio a partir del último número generado, de acuerdo a la siguiente recurrencia:

Xn+1 = aXn mod m


Método de los Cuadrados Medios

Es debido a von Neuman y tiene fundamentalmente solo interés histórico.
1. se toma un numero entero inicial, X0, llamado semilla, de 2n cifras.
2. se eleva al cuadrado, obteniendo un número de 4n cifras (completado quizás con ceros a la izquierda).
3. se considera X1 el número entero formado por las 2n cifras centrales.
4. se eleva al cuadrado X1 y se repite el proceso anterior tantas veces como sea preciso.
5. finalmente se consideran los numero ui = Xi/102n ya en el intervalo (0,1)

Ejemplo:



Bibliografía: Cao Abad Ricardo; Introducción a la Simulación y a la Teoría de Colas;
Bibliografía: Coss Bu Raul; Simulación un Enfoque Practico; Limusa Noriega editores.

domingo, febrero 27

La Simulación

La simulación se define como una técnica experimental, que generalmente se realiza por computadora para analizar el comportamiento de cualquier sistema que opere en el mundo real. La simulación involucra un proceso o sistema en el que el modelo produce la respuesta del sistema real ante eventos que suceden en este durante un periodo dado de tiempo.

La simulación se usa para predecir el comportamiento de sistemas complejos de manufactura o servicios, mediante la observación de los movimientos y la interacción de los componentes del sistema. El software de simulación genera reportes y estadísticas detallados que describen el comportamiento del sistema que se estudia.

La modelación en computadora tiene dos características de importancia que colocan a la simulación aparte de otras formas de análisis, la primera es que es dinámica, en el sentido en que se observan el comportamiento del modelo durante el tiempo que dure la simulación y la segunda es que usa un modelo estocástico en lugar de uno deterministico.

La simulación es algo que vivimos a diario en nuestro entorno, sobre todo en la naturaleza, un ejemplo es la  Zarigüeya de Virginia, que se simula estar muerta cuando se ve amenazada, otro ejemplo de animales simuladores es la serpiente cabeza de marrano, que se pone boca arriba y saca la lengua como si estuviera agonizando.

La simulación puede estar en función de algunos factores como el tiempo y dentro de esta se encuentran:

1. La proyectiva: hace referencia a conocer cómo será el comportamiento de algo en el futuro, esta es muy usual en un estudio de mercado para un nuevo producto o servicio.
2. La retrospectiva: referente a como fue el comportamiento de algo, un ejemplo claro de esta es como era el  comportamiento del mercado en cierta época de la humanidad.

De igual forma la simulación puede esta en función del medio o escenario y dentro de esta encontramos:

1. Semi-Imersiva: Se tiene una interacción con todo el escenario sin estar implicado en algo en especia.
2. Imersiva: Esta es la nueva forma de simular, es muy ligado a la realidad virtual, se interactúa con un escenario casi como si se estuviera realmente en dicho escenario.
3. No Imersiva: la podemos asociar a los videos juegos, es que hay una interacción pero no lo suficientemente casi real como para transportar al individuo al escenario.


Bibliografía:
1. Stephens Mattew P.; Diseño de Instalaciones y Manejo de Materiales: editorial Pearson.
2. Apuntes clase de Simulacion de procesos del 07 de febrero de 2011.

Ventajas y Desventajas de la Simulación

Ventajas de la simulación

1. Es un proceso relativamente eficiente y flexible.
2. Puede ser usada para analizar y sintetizar una compleja y extensa situación real, pero no puede ser empleada para solucionar un modelo de análisis cuantitativo convencional.
3. En algunos casos la simulación es el único método disponible.
4. Los modelos de simulación se estructuran y nos resuelve en general problemas trascendentes.
5. Los directivos requieren conocer como se avanza y que opciones son atractivas; el directivo con la ayuda del computador puede obtener varias opciones de decisión.
6. La simulación no interfiere en sistemas del mundo real.
7. La simulación permite estudiar los efectos interactivos de los componentes individuales o variables para determinar las más importantes.
8. La simulación permite la inclusión de complicaciones del mundo real.

Algunas desventajas de la simulación son:

1. Un buen modelo de simulación puede resultar bastante costoso; a menudo el proceso de desarrollar un modelo es largo y complicado.
2. La simulación no genera soluciones óptimas a problemas de análisis cuantitativos, en técnicas como cantidad económica de pedido, programación lineal o PERT. Por ensayo y error se producen diferentes resultados en repetidas corridas en el computador.
3. Los directivos generan todas las condiciones y restricciones para analizar las soluciones. El modelo de simulación no produce respuestas por si mismo.
4. Cada modelo de simulación es único. Las soluciones e inferencias no son usualmente transferibles a otros problemas.
5. Siempre quedarán variables por fuera y esas variables (si hay mala suerte) pueden cambiar completamente los resultados en la vida real que la simulación no previó… en ingeniería se “minimizan riesgos, no se evitan”.


Bibliografia: Sitio oficial de los Institutos Tecnológicos Mexicanos 

Ventajas y Desventajas de la Experimentacion

Ventajas

1. Es fácil de analizar puesto que extrae del  error experimental la variación debida a tratamientos únicamente.
2. Permite el uso de un elevado número de tratamientos y gran número de repeticiones.
3. Los grados de libertad del error experimental, son generalmente altos de tal modo que garantizan la precisión del experimento; de hecho este diseño asegura el máximo número de grados de libertad  para el error.

Desventaja

Si el número de tratamientos es elevado y el ensayo en el campo, se afronta el problema de la heterogeniedad causada por el ambiente.



Bibliografía: Quiroga Víctor; Manual Práctico para el Análisis de Experimentos de Campo. 

sábado, febrero 26

Medidas de Tendencia Central

La Moda

Esta medida de posición se asocia con el valor más común, más típico o que ocurre más frecuentemente en un conjunto de datos. Más concretamente, se define como el valor al cual corresponde la mayor frecuencia. En la serie que se incluye seguidamente se puede observar que la moda es 21.
14,14,17,17,21,21,21,21,33,36,40

La moda es una medida muy natural para describir un conjunto de datos; su concepto se adquiere fácilmente: es el sueldo más común, el peso más corriente, la edad más frecuente.  Además, tiene la ventaja de que no se ve afectada por la presencia de valores altos o bajos.

La principal limitación esta en el hecho de que requiere un número suficiente de observaciones para que se manifieste o defina claramente. La moda se puede aplicar tanto a datos cualitativos como cuantitativos.

La Mediana

La mediana se define como el valor central de una serie de datos ordenados o más  específicamente, como un valor tal que no más de la mitad son menores que él  y no más de la mitad mayores. Esto es lo mismo que decir que el  50% de las observaciones son menores o iguales que él y el otro 50% son mayores o iguales.

Cuando se tiene datos sin agrupar y se desea calcular la mediana es necesario, en primer lugar, ordenarlos de acuerdo a su magnitud. Luego se determina el valor central de la serie y esa es la mediana. Si el numero de datos es par, existirá dos valores centrales y entonces la mediana se obtiene haciendo el promedio de ellos. El cálculo se facilita recordando que el valor central de una serie de n datos es el n+1/2 termino de la serie.

Ejemplo: 6, 8, 8, 10, 12, 19,23

n=7; n+1/2; 7+1/2= 4; la mediana es 10, ya que corresponde al termino numero 4.


La Media Aritmética

Corrientemente se le llama “promedio” a secas y de ahora en adelante cuando se diga promedio se estará haciendo referencia a la media aritmética. Existe dos formas alternativas para su cálculo: como una media aritmética simple o como una media aritmética ponderada.

Aritmética simple: suma de los valores/numero de valores


Bibliografia: Gomez Barrantes Miguel; Elementos de Estadística Descriptiva; editorial EUNED.

Medidas de Dispersion

No solo basta con determinar las medidas de tendencia central para comprender el comportamiento de una serie de datos, es importante además, conocer que tan alejados están esos datos respecto a ese punto de concentración.

Las medidas de dispersión nos indican la distancia promedio de los datos respecto a las medidas de tendencia central. Así podremos diferenciar dos conjuntos de datos que poseen iguales medias, siendo los datos de uno más dispersos del otro.

Son indicadores estadísticos que muestran la distancia promedio que existe entre los datos y la media aritmética.

En el estudio de las medidas de dispersión daremos:
  • Varianza: La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
    La varianza se representa por signo. 
    varianza          varianza

  • Desviación estándar o típica: La desviación típica es la raíz cuadrada de la varianza.Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.La desviación típica se representa por σ.
    de relación típicadesviación



  • Coeficiente de Variación: El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.El coeficiente de variación se suele expresar en porcentajes, lo unico que se debe hacer es multiplicar la formula por 100.
                                         coeficiente de variación
Bibliografia: Vargas Sabadias Antonio,Estadistica Descriptiva e Inferencial,Coleccion Ciencia y Tecnologia.

Kolmogorov-Smirnov


En esta prueba también se está interesado en el grado de concordancia entre la distribución de frecuencia muestral y la distribución de frecuencia teórica, bajo la hipótesis nula de que la distribución de la muestra es f0(x,q) e interesa probar que no existe diferencia significativa. La prueba trabaja con la función de distribución ( distribución de frecuencia acumulativa). Esta prueba pertenece al campo de la Estadística No Paramétrica.
Sea F0(x) la función de distribución teórica para la variable aleatoria X, y representa la probabilidad de que la variable aleatoria X tome un valor menor o igual a x (también se interpreta como la proporción esperada de observaciones que tengan un valor menor o igual a x). Es decir:
Sea Sn (x) la función de distribución empírica, calculada con base en los valores observados de la muestra n observaciones. Sn (x) representa la proporción de valores observados que son menores o iguales a x, y está definida como:
Sn (x) = P ( X £ x/ dados los resultados muestrales) = m/n
donde m es el número de valores observados que son menores o iguales a x.
En la prueba de Smirnov-Kolmogorov se está interesado en la mayor desviación entre la función de distribución teórica y la empírica, es decir entre F0 (x) y Sn(x), para todo el rango de valores de x. Bajo la hipótesis nula se espera que estas desviaciones sean pequeñas y estén dentro de los límites de errores aleatorios. Por lo tanto, en la prueba S-K se calcula la mayor desviación existente entre F0 (x) y Sn(x), denotada por Dmax(x) y está dada por:
Dmax(x) = Max | FX (x) - Sn (x) |


Los pasos para realizar Smirnov-Kolmogorov son:
1- Se plantea una  Ho, hipótesis nula. y Ha, hipótesis alternativa
2- Se extraen de la muestra las variables necesarias para realizar la prueba,  como :media, desviación, rango (limsup – liminf), numero de datos que se tomaran de la muestra, numero de intervalos y tamaño del intervalo.

3- Se calcula la frecuencia observada de cada uno de los intervalos, al final la suma de las frecuencias observadas debe ser igual a 100.
4- Calculamos la frecuencia observada relativa con la formula: frecuencia observada de cada intervalo/la sumatoria total de la frecuencia observada.
5- Luego calculamos la frecuencia observada relativa acumulada y frecuencia esperada relativa acumulada, esta ultima varía de acuerdo al tipo de histograma que nos haya dado.
6- aplicamos la formula
D = (FOR Acum - FER Acum) el cual es el estadístico de prueba; donde la D que mayor valor de va a ser la mayor discrepancia o estimador de kolmogorov.
7- Se hallan también los grados de libertad de acuerdo a la distribución estadística utilizada.
8- se busca en la tabla de acuerdo al tamaño de la muestra y un  determinado valor de riesgo alfa (α),
9-  se busca en la tabla de smirnov kolmogorov, si el estimador de la prueba (D) es menor que el valor que se encontró en la tabla entonces se acepta la hipótesis Ho (hipótesis nula) planteada antes de estudiar la muestra, de lo contrario se acepta la hipótesis alternativa Ha.


tabla :








Bibliografia: Cao Abad Ricardo; Introducción a la Simulación y a la Teoría de Colas.

sábado, febrero 19

Chi Cuadrada

La función de probabilidad de esta distribución depende del parámetro n que son los grados de libertad. Es una función asimétrica positiva.


Para ello, necesitaremos una muestra de valores de la variable X. Si la variable es discreta y tiene pocos valores posible estimaremos las probabilidades de dichos valores mediante sus frecuencias muestrales; si la variable es continua o si es una discreta con muchos o infinitos valores estimaremos probabilidades de grupos de valores (intervalos).


Metodológicamente, la prueba se basa en la comparación entre la serie de frecuencias absolutas observadas empíricamente para los valores de la variable (Oi) y las correspondientes frecuencias absolutas teóricas obtenidas en base a la función de probabilidad supuesta en la hipótesis nula (Ei).


En síntesis la función esta dada por la formula:

Pasos:

  • Arreglar las observaciones en una tabla de contingencias.
  • Determinar el valor teórico de las frecuencias para cada casilla.
  • Calcular las diferencias entre los valores observados con respecto a los teóricos de cada casilla.
  • Elevar al cuadrado las diferencias y dividirlas entre el valor teórico de la casilla correspondiente.
  • Obtener la sumatoria de los valores anteriores, que es el estadístico X2.
  • Calcular los grados de libertad (gl): gl = (Intervalos -1).
  • El valor de X2 se compara con los valores críticos de ji cuadrada de la tabla de valores de X2 y de acuerdo con los grados de libertad, y se determina la probabilidad.
  • Decidir si se acepta o rechaza la hipótesis.
En el siguiente enlace encontraras la tabla de valores.





Bibliografia: Moreno Jaime Serret, Manual de estadistica universitaria:Inductiva, Editorial ESIC.