You are on page 1of 27

Preguntas orientadoras

Fase 3 – Elaborar documento de aplicación de conceptos de probabilidad

Grupo: 300046_38

Realizado por:
Hector Alexis Tenorio Caicedo; código: 1.114.888.564

Presentado a:
Hector Fabio López

Universidad Nacional Abierta y a Distancia – UNAD


Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente (ECAPMA)
Palmira, Valle
Mayo 2019
Introducción

La estadística descriptiva se sustituye o reduce como el conjunto de datos obtenidos por un


pequeño número de valores descriptivos, como pueden ser: el promedio, la mediana, la
media geométrica, la varianza, la desviación típica, etc. Estas medidas descriptivas pueden
ayudar a brindar las principales propiedades de los datos observados, así como las
características clave de los fenómenos bajo investigación.

El siguiente trabajo permitirá al estudiante aprender a interpretar los diferentes


fundamentos de los tipos de variables estadísticas cuantitativas y cualitativas, su forma de
procesamiento y el desarrollo, recomendaciones de uso y manejo de las variables
estadísticas.
Objetivos

General.
 Identificar las variables aleatorias, sus componentes y probabilidades.

Específicos
 Analizar la información suministrada y por medio de ella encontrar el rango,
varianza, desviación típica y coeficiente de variación de una variable.

 Conocer y aplicar diferentes metodologías de aprendizaje con el uso de la aplicación


R
1. Definir los siguientes conceptos tomados del libro de Balazarini se aclara que para
la presente actividad el estudiante debe consultar el capítulo dos variables
aleatorias y probabilidades y el capítulo tres modelos probabilísticos.

 Evento muestral

Conjunto de datos, valores o resultados posibles que puede asumir en un estudio de


tipo aleatorio. Su denotación es la letra omega (). (Balzarini, 2013)

 Punto muestral

Se define como punto muestral a los diferentes resultados posibles de un estudio


aleatorio, es decir a cada elemento del especio muestral. (Balzarini, 2013)

 Evento muestral

Según (Balzarini, 2013) el evento muestral, es el subconjunto de elementos


provenientes del especio muestral.

 Explique en sus propias palabras el experimento aleatorio del dado deben


descargar el CODIGODADO disponible en la siguiente columna. El estudiante
debe entender que, aunque no es un experimento agropecuario nos ayuda a
entender los conceptos planteados.

En el presente experimento se logra evidenciar las diferentes posibilidades y resultados que


se obtiene al lanzar los dados, donde se obtienen 36 posibilidades de resultados.
Al lanzar los dados existen diversas posibilidades de que estos muestren sus caras desde
dos pares, dos impares o una combinación de par e impar.

 Variable aleatoria

Se define variable aleatoria a la función que relaciona un resultado de un estudio


con un valor numérico, esta está íntimamente relacionadas al concepto probabilidad
que es la encargada del valor de esta variable. (Balzarini, 2013)

 ¿Qué significa que el espacio muestral de una variable aleatoria continua es no


contable?

Esto se refiere a que en este tipo de variable no se le puede deducir o suponer una
conclusión o respuesta sin ser antes estudiado. (Balzarini, 2013)
 ¿Que son variables aleatorias discretas proporcionales y que son variables
aleatorias discretas de conteo no acotado? De ejemplos este tipo de variables.

 Variables aleatorias discretas proporcionales.

Las variables discretas proporcionales, son aquellas que provienen de conteos que
pueden superar el número de elementos evaluados.
Ejemplo de una variable discreta expresada como proporción es el número de
semillas germinadas en cajas de Petri con 25 semillas cada caja; los resultados se
expresan como proporciones porque existe un denominador natural: la cantidad de
semillas por caja. (Balzarini, 2013)

- Variables aleatorias discretas de conteo no acotado.

Son aquellas que provienen de conteos que no pueden superar el número de


elementos evaluados y los conteos no acotados o sin determinador natural.
Ejemplo de variable discreta obtenida por un conteo (no acotado) es el número de
pústulas de roya por m2 de cultivo. Para el caso de proporciones es importante dejar
expresado que si bien el valor puede ser continuo en el rango 0-1, el espacio
generatriz es discreto, porque la base de la variable es el conteo. (Balzarini, 2013)

 Existe dos conceptos de probabilidad el clásico y concepto frecuencial, defina


cada uno, en el caso del frecuencial explique el experimento de germinación de
una semilla cuál es el experimento aleatorio, cuál es el evento, cuantos puntos
muestrales tiene.

- Probabilidad clásica.

Se define como la probabilidad que se basa en la observación de los elementos del


espacio muestra. Esta se desarrolla originariamente estudiando los juegos de azar.
(Balzarini, 2013)

- Probabilidad frecuencial.

Se define como la serie repetida de estudios aleatorios. Generalmente esta se usa


cuando el espacio muestral es infinito y por tanto no se pueden enumerar todos los
resultados posibles del estudio. (Balzarini, 2013)

En el siguiente ejemplo nos basamos del expuesto. De la germinación de semillas,


para este caso se tiene un lote de semillas, de la cual sacaremos la probabilidad de
que la semilla germine óptimamente. Cogemos una semilla y la plantamos
esperando que germine, pero este proceso lo repetiremos 500 veces, probablemente
se usaran 500 semillas, este número de repeticiones será N, tengamos en cuenta que
para lograr obtener la probabilidad debemos saber el número de veces que el evento
ocurre en la cantidad de las repeticiones y lo denotaremos 𝑛𝐴 . La probabilidad de
germinación de una semilla en la totalidad de las repeticiones la denominaremos
P(A). Si de las 500 repeticiones (N) se observó una germinación de 300 semillas
(𝑛𝐴 ), diremos que la probabilidad de que una semilla germine se representa por:
P(A) = P (observar una semilla germinada) =𝑛𝐴 =N = 300/500= 0,6 y esta es la
probabilidad de observar una semilla germinada en las 500 repeticiones. (Balzarini,
2013)
El experimento aleatorio es la semilla, el evento es la probabilidad de que la semilla
germine y la cantidad de puntos muéstrales es uno que depende de la cantidad de
semillas germinadas en la totalidad de repeticiones.

 ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de


probabilidad?

Si bien la analogía es fundamental, las frecuencias se entienden como


probabilidades sólo cuando N tiende a infinito. Si el número de veces que se repite
un experimento no es grande, entonces hablaremos de frecuencia relativa y diremos
que ésta “aproxima” una probabilidad. Otra idea importante para comprender la
medida de probabilidad es la de eventos mutuamente excluyentes.
 ¿Que son eventos mutuamente excluyentes?, ¿cómo es la intersección de dos
eventos mutuamente excluyentes, si son excluyentes, dado un evento A y uno B,
a que es igual la P(AꓴB)?

- Eventos excluyentes

Se dice que son eventos excluyentes si cada uno de los eventos esta formado por
puntos muestrales distinto, es decir que no existe ningún punto muestral en la
intersección de los subconjuntos que representan el evento.

Si A y B son dos eventos de Ω, la intersección de eventos conforma un nuevo


conjunto, que contiene a los puntos muestrales que simultáneamente pertenecen al
subconjunto A y al subconjunto B. Denotaremos la intersección de A y B con A ∩
B.
Cuando dos eventos son excluyentes, la intersección es cero y por tanto la
probabilidad de la unión de esos eventos, P (A ∪B), es la suma de las
probabilidades de cada evento. Por el contrario, si la intersección no es vacía, la
probabilidad de la unión de eventos es la suma de las probabilidades de cada evento,
menos la probabilidad de la intersección.

 En el caso de distribuciones de variables aleatorias cuando una variable es


continua y simétrica que modelo se usa.

Para una variable continua y de distribución simétrica unimodal, es común el uso


del modelo Normal.

 ¿Para una variable de conteo no acotado que modelo se utiliza?

Para las variables de conteos no acotados el modelo que se utiliza es el Poisson.

 ¿Para variables de proporciones que modelo se utiliza?

Para las variables de proporciones el modelo que se utiliza es el Binominal.

 Que variables tienen función de probabilidad y que variables tienen función de


densidad.

Según el caso de variables con función de probabilidad encontramos las variables


discretas. Como variables con función de densidad podemos encontrar las variables
continuas.

 Cuáles son los parámetros más usados en estadística para estudiar y utilizar
funciones de distribución de variables aleatorias.
Los parámetros utilizados en estadística para estudiar funciones de distribución de
variables aleatorias son el valor esperado, que a su vez formaliza el valor medio en
un fenómeno aleatorio.

 ¿Qué es la esperanza matemática de una variable aleatoria, como se denota?

La esperanza matemática de una variable aleatoria, usualmente denotada por E(.) o


la letra griega Mu (μ) es, desde un punto de vista intuitivo, un promedio de los
valores asumidos por la variable, donde cada valor es ponderado por su
probabilidad de ocurrencia. (Balzarini, 2013)

 ¿Qué es la varianza de una variable aleatoria, como se denota?

La varianza de una variable aleatoria, denotada por Var(.) o la letra griega Sigma al
cuadrado (O2), es una medida de dispersión. Su raíz cuadrada, denominada desvío
estándar (O) es usada para expresar la dispersión en término de diferencias (o
desvíos) de cada dato respecto a la esperanza.

 ¿Qué tipo de histograma se seleccionar un modelo probabilístico para una


variable aleatoria continua cuando se tienen datos de esa variable?

Para seleccionar un modelo probabilístico para una variable aleatoria continua


cuando se tienen datos de esa variable, resulta recomendable graficar un histograma
de frecuencias relativas y observar la forma del mismo. Existen diversos modelos
teóricos o funciones matemáticas que podrían ajustar o “aproximar bien” la forma
del histograma.

 ¿Qué es la estandarización, cuál es su fórmula?

La estandarización es una transformación para las variables aleatorias con funciones


de densidad normal diferente, para su distribución, de esta manera facilita los
cálculos de probabilidades.

Formula.
𝑌−
𝑍=
√𝜎 2

DISTRIBUCIÓN BINOMIAL
 ¿Qué tipo de conteos se trabajan con la distribución Binomial?

La distribución Binomial puede usarse para el cálculo de probabilidades de eventos


provenientes de conteos acotados. Se supone que se realizan cierto número (n) de
experimentos aleatorios y en cada experimento se registra uno de dos resultados
posibles, éxito o fracaso donde el éxito tiene una cierta probabilidad (P) de
ocurrencia (este ensayo con resultado binario se conoce como ensayo Bernoulli).

 ¿En la distribución binomial que es n y que es P?

N; es número (n) y P probabilidad (P).

 ¿A que es igual la esperanza y la varianza en esta distribución?

La esperanza de la variable Y=número de lanzamientos que resultan en cara es igual


a 20 x 0,5 = 10 y la varianza de Y es 20 x 0,5 x 0,5 = 5.

 ¿Que tipos de conteos se trabaja con la distribución de Poisson?

La distribución de Poisson también sirve como modelo probabilístico para variables


discretas de tipo conteo. A diferencia de la Binomial, donde el conteo se realizaba
sobre n experimentos independientes, en el caso de la Poisson, los conteos se
refieren al número de veces que un evento ocurre en una unidad de tiempo o espacio
dada (hora, kilo, m2, m3, planta, etc.) y por tanto los valores de la variable no están
acotados.

 ¿En agronomía se usa para qué tipo de conteos?

En agronomía se usa para qué tipo de conteos, les recuerdo los ácaros por ejemplo
se pueden trabajar con esta distribución.

 ¿Como se denota el único parámetro de esta distribución, a que es igual la


media y la varianza?

Usando el menú ESTADÍSTICAS  PROBABILIDADES Y CUANTILES, donde


se debe ingresar el valor del parámetro lambda ( = 2) luego de seleccionar la
distribución Poisson y el valor 2 como valor de la variable se denota como valor de
X). El resultado que se muestra indica que P (Y > 2) =0,3233. La varianza de una
variable aleatoria, denotada por Var(.) o la letra griega Sigma al cuadrado (2  ), es
una medida de dispersión. Su raíz cuadrada, denominada desvío estándar (  ) es
usada para expresar la dispersión en término de diferencias (o desvíos) de cada dato
respecto a la esperanza.

 Revisando el ejercicio de la table 3.1 del libro de Balzarini como se obtiene λ en


este caso a que es igual la media y la varianza.

Un comerciante que vende arroz fraccionado desea exportar su producto bajo la


etiqueta de alta calidad; sin embargo, el producto será aceptado bajo esa
denominación sólo si la cantidad de granos de arroz partidos no es mayor a 50
granos por kilo. El comerciante extrajo 50 muestras de 1 kg para determinar el
número de grano partidos (Tabla 3.1).

- ESTADÍSTICA Y BIOMETRÍA (2011)

El propósito de este muestreo fue estimar el parámetro ʎ de esta distribución


Poisson, que se calcula de la siguiente manera: ʎ = [(10 × 3) + (20 × 6) + (30 × 10)
+ (40 × 20) + (50 × 6) + (60 × 5)]/50 = 870/50 = 37

Es decir, ʎ es 37 granos partidos por kilogramo de arroz y como sabemos que ʎ es


que se obtiene tanto en  como en 𝜎 2 .

¿Cuál es la desviación estándar de Y para este comerciante?


La desviación estándar es la raíz cuadrada de la varianza, en este caso:

√ʎ = √37 = 6,08
Usando el software InfoStat para el cálculo de probabilidades, se dieron respuestas a
las siguientes preguntas:

¿Cuál es la probabilidad de una partida de arroz con 50 granos partidos?


P (Y=50) =0,0072

¿Cuál es la probabilidad de una partida con más de 50 granos partidos?

P (Y>50) = 0.0167

¿Cuál es la probabilidad de obtener 10 granos partidos en una muestra?

P (Y=10) = 1,13x10-7, es decir prácticamente cero

Si un exportador más exigente pide a lo sumo 10 granos partidos por kilo, ¿Cuál es
la probabilidad de rechazo de la partida?

P (Y≥10) = 0,9999 es decir que, prácticamente con seguridad, la partida será


rechazada.

 Estudie el ejercicio de velocidad del viento de la del texto y explicar por qué
hay un sitio mejor para el objeto del estudio, pueden tomar pantallazos del
gráfico.
Análisis de datos de velocidad del viento

 Según se estableció para que los molinos de energía eólica propendan una
mayor cantidad de energía para el propósito de ser utilizado en el trabajo con aguas
subterráneas, si la velocidad de los vientos promedia entre 40 y 48 km/k, es evidente
que la gráfica del norte muestra un intervalo mucho más acorde a lo requerido, ya
que la zona sur tiene intervalos muy bajos, es por eso que se recomienda usar la
zona norte.

Ejercicio 2.1

Supongamos que se toma una muestra aleatoria con reposición de tamaño n=2 a
partir del conjunto {1,2,3} y se produce el siguiente espacio muestral con 9 puntos
muestrales: Ω = {(1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3)}

Supongamos además que definimos la variable aleatoria Y=suma de los dos


números, que conforma un nuevo espacio probabilístico y que estamos interesados
en los siguientes eventos:

El evento A conformado por los puntos muestrales cuya suma sea un número par, es
decir, A= {(1,1), (1,3), (2,2), (3,1), (3,3)} y P(A)= 5/9.

El evento B conformado por los puntos muestrales cuya suma sea un número impar,
siendo B= {(1,2), (2,1), (2,3), (3,2)} y P(B)=4/9.

El evento C conformado por los elementos cuya suma es 5. Preguntas:


A. ¿Qué tipo de concepto de probabilidad aplicaría para calcular
probabilidades?
Aplicará la definición frecuencial de probabilidad, ya que utiliza las
frecuencias de los puntajes para calcular los casos favorables, según el
criterio de cada probabilidad.
B. Los eventos A y B, ¿son independientes?
Sí, dado a que cada elemento de los dos sucesos es diferente, y el criterio de
selección no depende uno del otro.
C. ¿Cuál es la probabilidad de que ocurra A o B?
La probabilidad de que ocurra el evento A o B es de uno, dado a que juntos
eventos conforman todo el espacio muestral posible, es decir A o B= Ω,
entonces P (A o B) =1
D. ¿Cuál es la probabilidad de que ocurra B o C?
La probabilidad de que ocurra el evento B o C es de 4/9, ya que todos los
eventos de C se encuentran dentro del espacio muestral de B; B= {(1,2),
(2,1), (2,3), (3,2)} y P (B)=4/9. Los marcados con rojo son todos los eventos
de C. Entonces P (B o C) =4/9.
E. Representar tabularmente a F (y).
Y f(y) F(y)
2 f (2) = 1/9 F(y) = f (2) =1/9
3 f (3) = 2/9 F(y)= f (2) +f (3) =1/9 + 2/9 = 1/3
4 f (4) = 1/3 F (4) = f (2) +f (3) +f (4) =1/9+2/9+1/3=2/3
5 f (5) = 2/9 F (5) = f (2) +f (3) +f (4) +f (5) = 1 / 9 + 2 / 9 + 1 / 3 + 2
/9=8/9
6 f (6) = 1/9 F (6) = f (2) +f (3) +f (4) +f (5) +f (6) =1 / 9 + 2/ 9 + 1 /
3+2/9+1/9=1

Ejercicio 2.3:
Los siguientes datos corresponden a la venta de tractores que registra una empresa de
maquinarias agrícolas en los días laborables del último año:

y f(y)
0 f (0) =11/26
1 f (1) =4/13
2 f (2) =7/52
3 f (3) =5/52
4 f (4) =1/26
Preguntas:
a) ¿Cuál es la variable en estudio?
La variable del estudio es cantidad de tractores vendidos
b) ¿Cuántos resultados posibles tiene la variable? ¿Qué tipo de variable es?
Los resultados posibles son 5 (0 vendidos, 1 vendido, 2 vendidos, 3 vendidos y 4
vendidos) Este tipo de variable es discreta.
c) ¿Cuál es la probabilidad de que hoy no venda ningún tractor?

P (0) =110 / 260=11/16


d) ¿Cuál es la probabilidad que un día, seleccionado al azar dentro de los días
laborables del año, venda 3 o más tractores?
(3 o 4) = 25 / 260 + 10 / 260 = 35 / 260
e) ¿Cuál es la probabilidad que en los próximos dos días venda 3 tractores?
P (3) * P (3) = 25 / 260 * 25 / 260 = 625 / 67600 = 25 / 2704

 El estudiante debe descargar en su carpeta de trabajo el archivo Excel


PROBABILIDAD.csv y el código CODIGOPROBABILIDAD, debe verificar
lectura de la carpeta y correr el respectivo código. En este caso el código explica
como seleccionar las variables y el programa las lee del archivo
PROBABILIDAD Cada estudiante debe correr el modelo para una variable
discreta y una continúa dando conclusiones de lo encontrado acorde a su
profesión. ¿cuál es conteo de más alta probabilidad? En el caso de la variable
continua el 50% de los datos de sus variables serán menores o iguales a que a
valor?
 Variable continua discreta

En el presente pantallazo se logra evidenciar el procedimiento del programa R, en el cual se


logra identificar el conteo de datos probabilidad de ocurrencia.

En el presente gráfico de frecuencias absolutas se abarcan diez datos de ácaros, los cuales
promedian un rango de 0 a 10 especies, donde sus datos de menor valor se encuentran los
datos 2 y 3 con una cantidad de 6; y los de mayor valor (5 y 9) con un valor inferior a 12.
En el gráfico de frecuencias relativas nos confirma que los conteos 5 y 9 presentan mayor
probabilidad con un 12 % como se observa en la imagen.
 Variable cuantitativa continua.

En la anterior imagen se logra identificar el desarrollo de la actividad pH8 en el programa


R. En esta se logra evidenciar que el promedio de la media abarca entre 1 y 5.
0.4
0.3
Frequency

0.2
0.1
0.0

3.96 4.22 4.48 4.75 5.01 5.27 5.54 5.80 6.06

Class limits

A continuación, en las presentes graficas tanto absoluta como relativa, se logra evidenciar
el comportamiento de la encuesta, donde su rango promedio de los diferentes datos abarca
entre 1 a 5 en la grafica de frecuencia absoluta y de 1% a 5% en la gráfica de frecuencia
relativa.
Polígono de frecuencias absolutas
El presente polígono de frecuencia absolutas, nos muestra los diferentes puntos promedio
de datos, donde el valor de los diferentes encuestados promedian entre 0 a 5.

Polígono de frecuencias relativas acumuladas


Para concluir, en las presentes graficas logramos identificar los diferentes datos y valores
de la encuesta de pH8, donde su totalidad de datos abarcaba los valores no mayores a 5
según la mediana, que en su forma representa al 50% de probabilidad.

 Deben revisar en el texto el ejercicio de las vacas del tambo en el texto, en el


código de MODELOS, deben correr el código para este ejercicio que esta con
los datos del texto, adicionalmente deben hacer la gráfica de la función de
densidad con una media de 28 y 23 ambas con una varianza de 10 misma
varianza en ambos casos, y hacer el ejercicio con un media de 32 y dos
varianzas una de 10 y otra de 8, es el caso de la misma media y dos varianzas,
que pasa cuando se cambia le media y hay la misma varianza, hacia donde se
desplaza la figura y que pasa cuando se cambia la varianza en que se afecta la
figura.

En el anterior pantallazo se evidencia ejercicio de las vacas del tambo, donde se representan
dos valores de la Media cuyos valores son: 23 y 28. De igual forma se evidencia el valor de
varianza con el valor correspondiente a 10.
En la gráfica anterior se evidencia el aumento de producción de leche en las vacas,
donde el dato referente a 30 aumento su mayor productividad, a partir de este
empieza a descender en el dato 40 igualándolo a cero donde se puede decir que esta
eficiencia en las vacas es igual al cero.
En el anterior pantallazo se evidencia ejercicio de las vacas del tambo, donde se representan
dos valores de la Media cuyos valores son: 10 y 8. De igual forma se evidencia el valor de
varianza con el valor correspondiente a 32.

En el anterior caso representado en la grafica lineal se logra evidenciar la baja


productividad de leche en los datos de 10 a 25, donde asciende en los datos de 30 a 35 y
como finalidad decae en el dato 40. En conclusión, la producción de leche en este momento
tuvo un comportamiento porco eficiente.

 En el texto revisar el ejercicio de los híbridos de maíz y en el código


MODELOS correr el código para los datos registrados en este código que son
los mismos del libro, adicionalmente determinar la probabilidad de un valor
entre 62 y 51 para el rendimiento, también la probabilidad de un valor menor
de 59 y un valor mayor a 53.
En la anterior imagen se logra evidenciar el ejercicio en programa R de los híbridos de
maíz, donde se observa el comportamiento de la probabilidad de los rangos del 62 a 51
En la presente grafica se observa la probabilidad de ocurrencia de un valor menor a 60

En la presente grafica se observa la probabilidad de ocurrencia en un rango entre 45 y 60.

En el texto deben revisar en tema de modelo binomial el ejercicio de la germinación de


semillas de panicum correrlo con los datos del código MODELOS que son los mismos
del libro, adicionalmente CON AYUDA DEL CÓDIGO determinar la probabilidad de
germinar 5 semillas, por lo menos cuatro y a lo sumo 4.

Probabilidad de germinación de 5 semillas =0,9802723


Probabilidad de germinación de al menos 4 semillas = 0,5255928
Probabilidad de germinación a lo sumo 4 semillas = 0,474072
de igual forma se obtiene la esperanza esta variable aleatoria que es de 2,5 y la varianza
que es de 1,875.

El estudiante debe revisar del texto el ejercicio de las picaduras del Gorgojo, correr el
código MODELOS que está con los datos del texto, y adicionalmente determinar
cuántas de 100 semillas tendrán 3 picaduras y cuantas 6 o más, en este caso saque las
probabilidades de 0,1,2,3,4,5 las suma y se las resta a uno.
Conclusión
Gracias a los diferentes roles que nos brinda la estadística, en este documento nosotros
como estudiantes logramos aprender a interpretar los diferentes fundamentos de los tipos de
variables estadísticas cuantitativas y cualitativas, su forma de procesamiento y el desarrollo,
recomendaciones de uso y manejo de las variables estadísticas.
Referencias bibliográficas

Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en problemas


de agronomía. Recuperado de
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?docID=3221775&query
=bioestadistica

You might also like