You are on page 1of 62

Estadística Aplicada a las

Ciencias Sociales I
Aspectos generales

Video de bienvenida
https://www.youtube.com/watch?v=y_rEdgJlGpc

Datos de identificación

• Institución responsable: Facultad de Ciencias Políticas y Sociales. Suaed. UNAM.


• Nombre de la asignatura: Estadística Aplicada a las Ciencias Sociales I
• Autores: Laura Azucena Lira Jiménez, Lic. María Martha Miranda Hernández
• Semestre: Tercero
• Créditos: 08
• Carácter: Obligatoria
• Clave: 2314
• Área a la que pertenece: Metodológica
• Seriación: Indicativa

Objetivos

Objetivo general
Al término de la materia el alumno será capaz de:
• Entender los conceptos matemáticos y estadísticos elementales para la descripción de grupos y procesos sociales.
Objetivos específicos
• Distinguir la diferencia entre relaciones y funciones en el contexto de la descripción de grupos y categorías sociales.
• Entender el concepto de variable, correlación y causación desde la perspectiva matemática, aplicados a problemas sociales
relevantes (pobreza, clase, identidad, producción, opinión).
• Seleccionar y valorar resultados y datos sociodemográficos.
• Representar datos sociodemográficos.
• Comprender la lógica de la estadística y los modelos elementales.
• Dominar la estadística descriptiva y realizar operaciones estadísticas básicas con la finalidad de hacer inferencias generales
sobre poblaciones delimitadas.

2
Temariorio
Tema 1. LENGUAJE MATEMÁTICO Y TEORÍA DE CONJUNTOS

1.1 Conjuntos, y descripción de grupos, individuos y unidades sociales.


1.1.1 Definición de conjunto y elemento.
1.1.2 Complemento de Conjuntos.
1.1.3 Intersección de Conjuntos.
1.1.4 Unión de Conjuntos.
1.1.5 Inclusión de Conjuntos.
1.1.6 Igualdad de Conjuntos.
1.2 Definición de universo, pertenencia.
1.2.1 Notación.
1.2.2 Operaciones (pertenencia, unión, intersección).
1.2.3 Relaciones.
1.2.4 Funciones.
1.2.4.1 Graficar relaciones y funciones.
1.2.4.2 Clasificación de funciones.
1.2.4.3 Operaciones de funciones.

Tema 2. ESTADÍSTICA

2.1 Introducción a la Estadística en Ciencias Sociales.


2.1.1 Estadística, ciencia y observación.
2.1.1.1 Inferencias de las poblaciones. Estadísticas Vitales y Estadísticas Matemáticas.
2.1.1.2 Utilidad y limitantes de la Estadística en las Ciencias Sociales.
2.1.1.3 Población y muestras.
2.1.1.3.1 Tipos de muestras.
2.1.1.3.2 Tipos de encuestas, general.
2.1.2 Estructura de información, métodos de investigación.
2.1.3 Variables, medición.
2.1.4 Anotación estadística.
2.2 Frecuencias.
2.2.1 Distribución de frecuencias.
2.2.2 Distribuciones – Tablas y Gráficas (relaciones x, y).
2.2.2.1 Presentación de tablas, intervalos.
2.2.2.1 Presentación de tablas, intervalos.
2.2.3 Tendencia Central Total.
2.2.4 Promedio, Media, Moda.
2.2.4.1 Teorema de tendencia central y Skweness y Kurtosis.
2.3 Variabilidad.
2.3.1 Rango y rango intercuartil.
2.3.2 Desviación estándar.
2.4 Diseño de hipótesis en las Ciencias Sociales.
2.4.1 Causalidad y correlación Pearson.
2.4.2 Hipótesis nula.
2.4.3 Pruebas de hipótesis.
2.4.3.1 Error estándar.
2.4.3.2 Estimación.
2.4.3.3 Índice de confianza.
2.5 Modelos probabilísticos.
2.5.1 Normal.
2.5.2 Binomial.
2.5.3 Poisson.

3
Bibliografía

Básica

Tema 1.

Elorza, H. (2008). Estadísticas para las ciencias sociales, del comportamiento y de la salud (3.ª ed.). México: Cengage Learning
Editores.

García-Ferrando, M. (1999). Socioestadística: Introducción a la estadística en sociología. Madrid: Alianza.

Rioboo, J. y Del Oro, C. (2000). Representaciones gráficas de datos estadísticos. Madrid: AC.

Zeisel, H. (1999). Dígalo con números. México: FCE.

Tema 2.

Pliego-López, J. y Ruiz-Pérez, L. (2002). Estadística I: Probabilidad. Madrid: AC.

Triola, M. (2008). Estadística. México: Pearson Educación.

Bibliografía complementaria
Bibliografía complementaria

Ai-Camp, R. (1996). Encuestas y democracia: opinión pública y apertura política en México. México: Siglo XXI, 1996.

Babbie, E. (2000). Fundamentos de la investigación social. México: Thomson Learning.

Evans, M. (2005). Probabilidad y Estadística: la ciencia de la incertidumbre. Barcelona: Reverté.

Flores-Villa, A. (1968). Nociones del método Estadístico. México: Porrúa.

Jauset, J. (2000). La investigación de audiencias en televisión: Fundamentos estadísticos. Buenos Aires: Paidós.

Malhotra, N. (1996). Investigación de mercados: un enfoque práctico. México: Prentice Hall Hispanoamericana.
Sitios de interés

Sitios de interés

Es un sitio académico reconocido internacionalmente por el éxito de su método para aprender matemáticas. Disponible en
https://es.khanacademy.org/

ibliografía complementaria

4
Lenguaje matemático y teoría de
conjuntos

Introducción

En este tema estudiaremos los conceptos fundamentales del lenguaje matemático y la teoría de conjuntos, para que al
finalizar el tema seas capaz de distinguir la diferencia entre relaciones y funciones en el contexto de la descripción de
grupos y categorías sociales.

La teoría de conjuntos es un marco para el análisis de hechos sociales. Diversos autores consideran el manejo de esta
teoría como un instrumento fundamental para el científico social. Elorza (2008), por ejemplo, comenta que la teoría
de conjuntos “es un instrumento adecuado para la sistematización de la información relevante que permite enfocar un
problema en su totalidad, deslindando en él lo que es fundamental” (p. 83).

Por su parte, Kleiman (2009) señala que la teoría de conjuntos es una “estructura lógica que unifica los conceptos más
fundamentales mediante un lenguaje intuitivo y simple” (p. 5). Él mismo destaca que buena parte del conocimiento
matemático moderno ocupa en menor o mayor medida la teoría de conjuntos.

El estudio de la teoría de conjuntos es importante porque te permitirá enfocar el análisis de problemas sociales desde una
perspectiva lógico-matemática, sin que ello signifique pasar por alto la complejidad y multidimensionalidad de los hechos
sociales. Por el contrario, el análisis a través de lenguaje matemático debe mejorar la comprensión y sistematización de
un problema, y fomentar la creatividad para generar hipótesis de trabajo.

Para el estudio de este tema hemos desarrollado el contenido puntual, en un lenguaje sencillo y abundando en
explicaciones, con la intención de que el lenguaje matemático por sí sólo no sea un impedimento para tu comprensión y
uso de los conceptos elementales de la teoría de conjuntos.

Además, en el desarrollo de contenido encontrarás varios ejemplos que se refieren a una realidad concreta: el estudio de
los grupos y hechos sociales que tenemos a la mano. Lo hicimos así para que puedas utilizar los conceptos matemáticos
en las situaciones de análisis que corresponden a las ciencias sociales. De esta manera, te proporcionamos un
complemento a los textos clásicos sobre la teoría de conjuntos, en los cuales predominan los ejemplos abstractos y en
lenguaje matemático.

Los conceptos abordados en esta unidad te permitirán identificar elementos, conjuntos (grupos) y relaciones, en la
descripción de problemas sociales. Podrás enunciar las características que determinan la pertenencia de un elemento a
un conjunto. Ésta es una tarea de clasificación que pone en práctica el estudio de categorías sociales.

Además, podrás identificar las operaciones que pueden darse entre conjuntos, por ejemplo, la inclusión, la unión,
intersección, complementación y diferencia; si pensamos que dichos conjuntos representan unidades de estudio, es
posible anticipar la utilidad que tiene identificar la factibilidad de las operaciones mencionadas. El estudio de las relaciones
y funciones entre conjuntos fomenta la habilidad para detectar posibles relaciones entre variables de estudio.

5
Objetivos particulares

Al término de la unidad el alumno será capaz de:

• Distinguir la diferencia entre relaciones y funciones en el contexto de la descripción de grupos y categorías sociales.
• Entender el concepto de variable, correlación y causación desde la perspectiva matemática, aplicados a problemas sociales
relevantes (pobreza, clase, identidad, producción, opinión).

Temario

1.1 Conjuntos, y descripción de grupos, individuos y unidades sociales.


1.1.1 Definición de conjunto y elemento.
1.1.2 Complemento de Conjuntos.
1.1.3 Intersección de Conjuntos.
1.1.4 Unión de Conjuntos.
1.1.5 Inclusión de Conjuntos.
1.1.6 Igualdad de Conjuntos.
1.2 Definición de universo, pertenencia.
1.2.1 Notación.
1.2.2 Operaciones (pertenencia, unión, intersección).
1.2.3 Relaciones.
1.2.4 Funciones.
1.2.4.1 Graficar relaciones y funciones.
1.2.4.2 Clasificación de funciones.
1.2.4.3 Operaciones de funciones.

6
Exposición de los temas

1.1. CONJUNTOS Y DESCRIPCIÓN DE GRUPOS, INDIVIDUOS Y UNIDADES SOCIALES

1.1.1. DEFINICIÓN DE CONJUNTO Y ELEMENTO


Kleiman (2009) expone que la definición de conjunto puede establecerse de manera intuitiva, a partir de nuestra experiencia en
el mundo, y en su forma más elemental se refiere a una colección definida de elementos.

Estos elementos pueden ser objetos, personas, instituciones, animales, conceptos, ideas, periodos temporales, características,
hechos, etcétera.

Tomado de https://mx.wikimedia.org/wiki/Archivo:Vista_de_um_ Tomado de https://mx.wikimedia.org/wiki/Archivo:Conjunto_


conjunto_residencial_em_Guar%C3%A1_(DF).jpg espa%C3%B1ol_1999_Budapest.PNG

Un elemento es, por lo tanto, un miembro de un conjunto determinado.

Hay tres condiciones para establecer un conjunto:

1. La pertenencia de un elemento a un conjunto debe estar definida sin ambigüedad. Es decir, se sabe si un elemento pertenece
a un conjunto o no. Por ejemplo, si pensamos en el conjunto de científicas reconocidas con un Nobel, es indispensable determinar
si Marie Curie está entre ellas o no.

Conjunto de científicas con Nobel = {Marie Curie, Gerty Cori, Maria Goeppert, Doroty Crowfoot, Irène Joliot, Rosalyn Sussman}

2. Los elementos no se repiten en un mismo conjunto. Si pensamos en el conjunto de número de mascotas por persona, aunque
varias personas tienen la misma cantidad de mascotas, sólo mencionaremos cada cantidad una vez.

Conjunto de cantidad mascotas por persona = {0, 1, 2, 3, 4, 5…}

7
3. Los elementos pueden aparecer en cualquier orden y sigue siendo el mismo conjunto. Ejemplo:

Conjunto de lenguas más habladas en Hidalgo = {náhuatl, otomí, tepehua, mixteco}


Conjunto de lenguas más habladas en Hidalgo = {tepehua, náhuatl, otomí, mixteco}

Notación

Quizá notaste que cada vez que menciono un conjunto escribo los elementos entre llaves y separados por comas, se debe a que
es la notación matemática de un conjunto. Entonces, la notación son los símbolos que se usan para definir conjuntos de manera
escrita. Los conjuntos generalmente se representan con letras mayúsculas, por ejemplo:

M = {Conjunto de niños en situación de calle en Oaxaca de Juárez}


P = {Conjunto de mujeres en situación de violencia en San Pedro Nuevo León}
V = {Conjunto de varones con enfermedades mentales en México}

La lectura de un conjunto expresado con notación es como sigue:

C = {soltero, casado, divorciado, viudo}

Se lee “los elementos del conjunto C son soltero, casado, divorciado y viudo”.

E = {alcoholismo, ansiedad, depresión, fobia}

Se lee “los elementos del conjunto E son alcoholismo, ansiedad, depresión y fobia”.

En los ejemplos anteriores hemos escrito todos los elementos de un conjunto dentro de las llaves, a eso se le llama notación por
extensión. Pero cuando los elementos de un conjunto son decenas o miles es impráctico mencionarlos todos, por lo que en esos
casos usamos la notación por comprensión:

Y = {Municipios de México}
Z = {Derechohabientes del IMSS}

La notación por comprensión también utiliza otros símbolos matemáticos, como la barra “|”, se lee “tal que”, y literales para
representar a los elementos. Se suele utilizar a la letra “x” para representar a los elementos, pero bien podría ser cualquier otra
letra. Veamos un ejemplo:

A = {x | x es un río nacional}

Se lee así: “El conjunto A está formado por los elementos x tal que x es un río nacional”

Luego la notación puede expresarse con rangos si nos referimos a medidas. Por ejemplo:

T = {x | 140 x 90}
Se lee “el conjunto T está formado por los elementos x tal que x es menor que 140 y mayor o igual que 90”.

El conjunto anterior puede referirse a la talla (estatura) de los estudiantes de una primaria expresada en centímetros.

Para denotar que un elemento es parte de un conjunto se usa el símbolo , que se lee “pertenece a”. Por el contrario, si un
elemento no pertenece a un conjunto se cruza el símbolo y se lee “no pertenece a”. Por ejemplo:

P = {La Prensa, Ovaciones, Metro, Publimetro, Reforma, El Gráfico, La Jornada}

8
Entonces:

Reforma D
Se lee “Reforma pertenece al conjunto P”.

El País D
Se lee “El País no pertenece al conjunto P”.

Otro ejemplo. Sea:


F = {m | 180 x 90 }
El conjunto F tiene los números mayores que 90 (sin incluir a 90) y menores o igual a 180.

Así:

180 F
Se lee “180 pertenece al conjunto F”.

90 F
Se lee “90 no pertenece al conjunto F”.

El conjunto F podría representar los pesos de mujeres de estatura media que padecen obesidad.

Cardinalidad

La cardinalidad es el número de elementos que contiene un conjunto, se escribe así:

n(A), y se lee “cardinalidad n del conjunto A”.

Para el conjunto de siglos de la era cristiana tenemos una cardinalidad de 21, porque actualmente vivimos en el siglo XXI.
Revísalo a continuación.

H = {I, II, III, IV, V, VI, VII, VIII, IX, X, XI, XII, XII, XIV, XV, XVI, XVII, XVIII, XIX, XX, XXI}

n(H) = 21

Se lee “la cardinalidad del conjunto H es igual a 21”.

Los conjuntos cuya cardinalidad podemos calcular se llaman conjuntos finitos. Pero también hay conjuntos infinitos, que su
cardinalidad es imposible determinar, por ejemplo, el conjunto de números reales que se extiende y extiende y extiende.

Conjunto universal

El conjunto universal o universo es aquel que contiene todos los elementos en un caso de estudio en particular. Por ejemplo, si
estuviéramos estudiando las características de los pintores, escultores y actores, nuestro conjunto universal puede ser llamado
“Artistas” y los contiene a todos.

Otro ejemplo, si hablamos de “el sector turismo”, “el sector agropecuario”, “el sector industrial” y “otros sectores”, entonces
podemos definir nuestro conjunto universal como “los sectores productivos del país”.

Si estudiamos primarias, secundarias y preparatorias, el universo puede ser las instituciones educativas.

9
El conjunto universal se denota con el símbolo o con el símbolo U.

1.1.2. COMPLEMENTO DE CONJUNTOS

El complemento de un conjunto se trata del conjunto integrado por todos los elementos que están en el conjunto universal pero
no están en un conjunto determinado. Entonces para el conjunto F, su complemento se integra por todos los elementos que
pertenecen al universo y no pertenecen a F. Un complemento se denota con apóstrofo ‘, o con un superíndice

Lo entenderemos mejor con un diagrama Venn-Euler:

El área coloreada corresponde al complemento del conjunto F se escribe así:

F’ = {Biología, Antropología, Geografía}

Existen dos casos especiales para la complementación:

● El complemento del conjunto vacío es el conjunto universal =

● El complemento del conjunto universal es el conjunto vacío =

10
1.1.3. INTERSECCIÓN DE CONJUNTOS

La intersección es el conjunto formado por todos los elementos que pertenecen simultáneamente a dos o más conjuntos.
Se representa con el símbolo . En el siguiente diagrama Venn-Euler se presenta sombreada el área que representa la
intersección de tres conjuntos, se expresa de la siguiente forma:

A B C = {Jalisco}

Se lee “A intersección B intersección C igual a Jalisco”.

Observa en el diagrama anterior cómo la intersección es una operación que nos permite detectar los elementos que están
presentes es varios conjuntos a la vez, por ejemplo, el Estado “Jalisco” es productor de maíz, de caña de azúcar y de sorgo.

1.1.4. UNIÓN DE CONJUNTOS

La unión de conjuntos se forma por todos los elementos que pertenezcan a dos o más conjuntos. Se representa con el
símbolo . En el siguiente diagrama Venn-Euler está sombreada el área que representa la unión de los conjuntos A, B y C:

11
Se expresa de la siguiente forma:

A B C = {Sinaloa, Jalisco, Veracruz, Michoacán}

Se lee “A unión B unión C incluye a Sinaloa, Jalisco, Veracruz, Michoacán”. Nota que aunque un elemento pertenezca a dos o más
conjuntos, en la unión de los conjuntos se menciona una sola vez.

1.1.5. INCLUSIÓN DE CONJUNTOS

La inclusión se da cuando un conjunto contiene a otro. Esto también se expresa como que un conjunto es subconjunto de otro. Para
anotar una relación de inclusión se utiliza el símbolo .

Si por el contrario se quiere anotar que un conjunto no está incluido en otro, se usa el símbolo

Por ejemplo:

V = {x| x= trabajadores asalariados}

W = {x| x= trabajadores que perciben un salario mínimo}

Para los conjuntos anteriores se puede decir que W V

Se lee “W está incluido en V” o, bien, “W es subconjunto de V”.

Podemos definir lo anterior porque los trabajadores que perciben el salario mínimo necesariamente son trabajadores asalariados,
aunque en el conjunto “V” también pueden existir otros trabajadores que perciben más de un salario mínimo.

Otro ejemplo:

Y = {x| x= trabajadores sindicalizados}

V = {x| x= trabajadores asalariados}

12
Al reflexionar sobre los conjuntos anteriores notamos que no necesariamente todos los trabajadores asalariados también están
sindicalizados, por ello podemos establecer que V Y , es decir, V no está incluido en Y o, bien, V no es subconjunto de Y.

Observa el diagrama que representa las operaciones de inclusión descritas:

Existen casos especiales en la inclusión de conjuntos:

● Si los conjuntos A y B son iguales, entonces podemos decir que A es subconjunto de B y también que B es subconjunto de A.

● Todo conjunto es subconjunto de sí mismo, a esta relación se le denomina inclusión impropia y se simboliza con ,A A

● Existe un conjunto vacío simbolizado con que está incluido en cualquier otro conjunto.

1.1.6. IGUALDAD DE CONJUNTOS


La igualdad entre dos o más conjuntos se establece siempre que tengan exactamente los mismos elementos. Cuando esto ocurre
se anota así:

A=B

Se lee “el conjunto a es igual al conjunto B”.

Si por el contrario los conjuntos son desiguales, se anota así:

A B

Se lee “el conjunto A es diferente al conjunto B”.

13
Veamos un ejemplo:

R = {x|x = ramas del derecho}

Se lee “R contiene los elementos x tal que x representa a las ramas del derecho público”.

D = {Administrativo, Constitucional, Penal, Procesal, Laboral, Tributario}

En el conjunto R se menciona, por comprensión, las ramas del derecho público que son el derecho administrativo, constitucional,
penal, procesal, laboral y tributario; justamente los elementos del conjunto D. Por ello estos conjuntos son iguales, entonces se puede
anotar que:

R=D

Otro ejemplo:

I = {x| x= Médicos}

N = {x| x= Pediatras}

Aunque todos los pediatras son médicos, no todos los médicos son pediatras. Por ello este par de conjuntos no son iguales, y se
anota de la siguiente forma:

N I

1.2. DEFINICIÓN DE UNIVERSO, PERTENENCIA

1.2. Definición de universo, pertenencia

El conjunto universal o universo está constituido por todos los elementos de estudio en una situación particular. Esto quiere decir que
cada investigador define el conjunto universal de estudio para un problema determinado. Incluso, para un mismo problema se pueden
plantear varias posibilidades de conjunto universal.

Aunque para la definición del conjunto universal el investigador tiene amplia libertad, sí tendrá que establecer un conjunto preciso, y
que se mantendrá fijo mientras realiza un análisis basado en teoría de conjuntos.

1.2.1. Notación
El conjunto universal se denota con el símbolo o con el símbolo U; en los diagramas Venn-Euler se representa como un rectángulo
que contiene todos los elementos. Observa que en la siguiente imagen se ha sombreado todo el conjunto universal.

14
1.2.2. Operaciones (pertenencia, unión, intersección)

Una vez que se define un conjunto universal se asumen las siguientes propiedades:

● Pertenencia: Todo conjunto es subconjunto del conjunto universo.

● Unión: La unión de un conjunto con el conjunto universal da por resultado el conjunto universal. Por ello se dice que el conjunto
universal es un elemento absorbente de la unión.

● Intersección: La intersección de un conjunto con el conjunto universal da por resultado el conjunto inicial. Por ello se dice que el
conjunto universal el un elemento neutro en la intersección.

1.2.3. Relaciones
Una relación vincula los elementos de un conjunto con los elementos de otro conjunto. Veámoslo gráficamente:

Se expresa como un conjunto de parejas ordenadas, donde el primer elemento pertenece al primer conjunto y el segundo elemento
al segundo conjunto. De la siguiente forma:

15
Otros ejemplos de relaciones pueden ser:

Podrás encontrar tres tipos de relaciones:

De un elemento del primer conjunto a un elemento


del segundo conjunto.

De más de un elemento del primer conjunto a un


elemento del segundo conjunto.

16
De un elemento del primer conjunto a más de un
elemento del segundo conjunto.

Dominio y rango

En una relación se puede determinar el dominio y el rango.

El dominio es el conjunto formado por los primeros elementos de los pares ordenados, y se escribe así:

El rango es el conjunto formado por los segundos elementos en los pares ordenado y se escribe así:

Veámoslo gráficamente:

En ciencias sociales estudiamos las relaciones entre conjuntos para proponer vínculos que nos ayuden a explicar y predecir
características de nuestros objetos de estudio.

17
1.2.4. FUNCIONES
Una función es una relación con las siguientes tres características:

Tiene un dominio (generalmente se denota con la letra

Tiene un rango (generalmente se denota con la letra

Tiene una regla de correspondencia con las siguientes restricciones:


1. Cada elemento del dominio debe tener necesariamente un elemento asociado en el rango.

2. Un elemento del dominio no puede tener más que un sólo elemento asociado en el rango.

Una función se denota generalmente con la letra

Observa gráficamente cuáles relaciones son funciones y cuáles no:

18
Imagina que una función es una especie de “caja” que recibe un valor

Una función generalmente se expresa así: y se lee “ = ( ) igual a función de ”.

La letra se representa a cualquiera de los elementos del dominio de la función, es decir, su valor irá cambiando, por ello se dice
que es una variable.

También el valor de tomará valores distintos, de entre los valores posibles para el rango, por ello también es una variable.

Además, sabemos que el valor de depende del valor que se le asigne a, por eso decimos que es una variable dependiente. En
cambio el valor de no depende de otra variable, por eso decimos que es una variable independiente.

Hasta ahora hemos representado las funciones con diagramas o con parejas ordenadas de elementos, pero ¿qué pasaría si
tuviéramos una relación cuyo dominio está integrado por una cantidad infinita de elementos? ¡Exacto! Hacer un diagrama o anotar
todas las parejas posibles es impráctico. Por ello, los dominios de las funciones suelen representarse con ecuaciones, además se
indica qué tipo de elementos pueden pertenecer. Por ejemplo:

19
Lo anterior se lee “ igual a cuadrada. Siempre que pertenece a los números naturales, es mayor o igual a 2 y es menor
o igual que 6”.

Otro ejemplo:

Que se lee “ es igual a 2 , pertenece a los números reales. En este caso no se aclara con cuál número inicia o finaliza x,
lo que significa que sus valores van de menos infinito a infinito, se escribiría así:

Para saber más…


Repasa la diferencia entre relación y función, en el siguiente video: https://youtu.be/qd8QHJEo-6o

1.2.4.1. Graficar relaciones y funciones

Las funciones pueden representarse mediante gráficas. Para elaborar la gráfica de una función, determina cuáles son los puntos que
debes situar en un eje cartesiano, es decir, las coordenadas y . Dichas coordenadas se acomodan en una tabla de doble
entrada o tabulación. Veamos un ejemplo:

Dada la función la tabulación que te permitirá graficar la función es la siguiente.

En la tabulación anterior los valores de se obtuvieron del dominio de la función: , se lee “ pertenece a
los números naturales, es mayor o igual a 2, es menor o igual a 6”. Entendiendo el dominio sabemos que los únicos valores
posibles para x son: 2, 3, 4, 5 y 6.

Después los valores de “ ” se obtuvieron resolviendo


la función para cada valor de , así:

20
Una vez terminada la tabulación podemos elaborar la gráfica acomodando los puntos , . Se muestra a continuación:

Finalmente, podemos especificar los conjuntos que forman el dominio y el rango de la función:

a) Dominio {2, 3, 4, 5, 6}

b) Rango {4, 9, 16, 25, 36}

1.2.4.2. Clasificación de Funciones

Pueden clasificarse en inyectivas, suprayectivas y biyectivas.

En las funciones inyectivas para valores diferentes en el dominio hay valores diferentes en el rango. Observa esta característica en
la siguiente imagen:

En las suprayectivas cada elemento del rango debe tener asociado un elemento en el dominio.

21
Finalmente, las funciones biyectivas son tanto inyectivas como suprayectivas:

1.2.4.2. OPERACIONES DE FUNCIONES


Con funciones es posible realizar las siguientes operaciones algebraicas: suma, resta, multiplicación y división. También podemos
hacer una quinta operación llamada composición. A continuación explicaremos cada una de ellas.

Suma

Dadas dos funciones f y g, la suma de éstas se expresa así:

22
Se lee “f de x más g de x igual a f más g, de x”.

Un propiedad importante de la suma de funciones es que el dominio de una suma de funciones es igual a la intersección de los
dominios de cada función. Se expresa de la siguiente forma:

Se lee “dominio de f más g, igual a la intersección del dominio de f con el dominio de g”.

Veamos un ejemplo:

Para saber más…

Revisa el siguiente video en el que se explica una suma de funciones: https://youtu.be/uXumaGG1yws

Resta

Dadas dos funciones f y g, la resta de estas funciones se expresa así:

23
Se lee “f de x menos g de x igual a f menos g, de x”.

También el dominio de una suma de funciones es igual a la intersección de los dominios de cada función. Se expresa de la siguiente
forma:

Se lee “dominio de f menos g, igual a la intersección del dominio de f con el dominio de g”.

Veamos un ejemplo:

Para saber más…


Revisa el siguiente video en el que se explica una resta de funciones: https://youtu.be/L5Bwmis_d18

Producto o multiplicación

Dadas dos funciones f y g, la resta de estas funciones se expresa así: Se lee “f de x por g de x igual a f por g, de x”.

24
Se lee “f de x por g de x igual a f por g, de x”.

También el dominio de un producto de funciones es igual a la intersección de los dominios de cada función. Se expresa de la siguiente
forma:>

Se lee “dominio de f por g, igual a la intersección del dominio de f con el dominio de g”.

Veamos un ejemplo:

Para saber más…


Revisa el siguiente video en el que se explica un producto de funciones: https://youtu.be/EV9TRVYs36k Cociente o división

Cociente o división

Dadas dos funciones f y g, la división de estas funciones se expresa así:

25
Se lee “f de x entre g de x igual a f entre g, de x”.

También el dominio de un cociente de funciones es igual a la intersección de los dominios de cada función, excluyendo los valores
de x para los cuales g(x) = 0. Se expresa de la siguiente forma:

Se lee “dominio de f por g, igual a la intersección del dominio de f con el dominio de g, siempre que g de x sea diferente de 0”.

Veamos un ejemplo:

Para saber más…


Revisa el siguiente video en el que se explica un cociente de funciones: https://youtu.be/_hJkxqoZlCQ

Composición

Consiste en evaluar una función en otra. Dadas dos funciones f y g, la composición de éstas se expresa así: Se lee “f de x compuesta
g de x igual a f compuesta g, de x”.

26
Siempre que el dominio de x pertenezca al dominio de g(x), y el dominio de g(x) pertenezca al dominio de f(x). Se expresa de la
siguiente forma:

Se lee “dominio de f compuesta g de x, igual a x, tal que x pertenece al dominio de g ,y g de x pertenece al dominio de f de x”.

Veamos un ejemplo:

Para saber más…


Revisa en el siguiente video una introducción a la composición de funciones: https://youtu.be/Nc7dtwfgqtM

Si aún tienes dudas sobre las operaciones con funciones revisa el siguiente video:

Operaciones con funciones: suma, resta, multiplicación y división, https://youtu.be/78QxHDCibIE

27
Estadística

Introducción

En la actualidad, la estadística se ha convertido en un método efectivo para describir con precisión los valores de datos políticos,
sociales, económicos, psicológicos, etc., pues es una herramienta para relacionar y analizar dichos datos.

La estadística se divide en estadística descriptiva y estadística inferencial.

• La estadística descriptiva o deductiva requiere del uso de modelos numéricos y gráficos para resumir y presentar datos, es
la que incluye las técnicas que se relacionan con el resumen y la descripción de datos numéricos.

• Estadística inferencial o inductiva: Consiste en inferir propiedades de una población sobre la base de una muestra con
resultados conocidos, se basada directamente en la teoría de la probabilidad. Es una disciplina puramente deductiva que
proporciona una base racional para el razonamiento inductivo.

Objetivos particulares

Al término de la unidad el alumno será capaz de:

• Seleccionar y valorar resultados y datos sociodemográficos.


• Representar datos sociodemográficos.
• Comprender la lógica de la estadística y los modelos elementales.
• Dominar la estadística descriptiva y realizar operaciones estadísticas básicas con la finalidad de hacer inferencias generales
sobre poblaciones delimitadas.

Temario

2.1 Introducción a la Estadística en Ciencias Sociales.


2.1.1 Estadística, ciencia y observación.
2.1.1.1 Inferencias de las poblaciones. Estadísticas Vitales y Estadísticas Matemáticas.
2.1.1.2 Utilidad y limitantes de la Estadística en las Ciencias Sociales.
2.1.1.3 Población y muestras.
2.1.1.3.1 Tipos de muestras.
2.1.1.3.2 Tipos de encuestas, general.
2.1.2 Estructura de información, métodos de investigación.
2.1.3 Variables, medición.
2.1.4 Anotación estadística.

28
2.2 Frecuencias.
2.2.1 Distribución de frecuencias.
2.2.2 Distribuciones – Tablas y Gráficas (relaciones x, y).
2.2.2.1 Presentación de tablas, intervalos.
2.2.2.1 Presentación de tablas, intervalos.
2.2.3 Tendencia Central Total.
2.2.4 Promedio, Media, Moda.
2.2.4.1 Teorema de tendencia central y Skweness y Kurtosis.
2.3 Variabilidad.
2.3.1 Rango y rango intercuartil.
2.3.2 Desviación estándar.
2.4 Diseño de hipótesis en las Ciencias Sociales.
2.4.1 Causalidad y correlación Pearson.
2.4.2 Hipótesis nula.
2.4.3 Pruebas de hipótesis.
2.4.3.1 Error estándar.
2.4.3.2 Estimación.
2.4.3.3 Índice de confianza.
2.5 Modelos probabilísticos.
2.5.1 Normal.
2.5.2 Binomial.
2.5.3 Poisson.

Exposición de los temas

2.1.1. ESTADÍSTICA, CIENCIA Y OBSERVACIÓN

La estadística es una rama de las matemáticas que, mediante las técnicas que proporciona, permite recolectar, organizar, presentar,
analizar e interpretar datos, ya sea de una muestra o inferir sobre una población, lo cual permite tomar decisiones acertadas.

Ciencia

Es una disciplina que utiliza el método científico con la finalidad de hallar estructuras generales.

Observación o dato

A cada resultado que se obtiene al realizar un experimento se le llama dato u observación.

2.1.1.1. INFERENCIAS EN LAS POBLACIONES. ESTADÍSTICAS VITALES Y ESTADÍSTICAS


MATEMÁTICAS

La inferencia estadística es un proceso que señala los aspectos contenidos en una población, utilizando únicamente la información
de una muestra. El uso de la inferencia estadística tiene grandes ventajas, ya que se ahorra tiempo y dinero al recolectar información
de una manera más sencilla.

29
Las estadísticas vitales son “el resultado del recuento de los hechos ocurridos en la vida de la población, como son: nacimientos,
matrimonios, divorcios, defunciones y muertes fetales. Las estadísticas vitales son elementos básicos para el análisis demográfico
de la situación de un país, así como uno de los requisitos para poder llevar a cabo la planificación del desarrollo económico y social.
Ya que proporcionan información sobre la tendencia del crecimiento natural de la población basándose en las tasas de natalidad
y mortalidad; sobre la conducta de sus componentes, su distribución geográfica y mediante su agregación a lo largo del tiempo,
sobre el tamaño de la población y su estructura. Por otro lado, permite identificar a los grupos demandantes de servicios médicos,
educación, vivienda, etc.” (INEGI, 2003, p. 1).

La estadística es una rama de las matemáticas que estudia la recolección, organización y análisis de los datos, los resume y
simplifica para su análisis y estudio.

2.1.1.2. VENTAJAS Y LIMITANTES DE LA ESTADÍSTICA EN LAS CIENCIAS SOCIALES

La estadística cuenta con una serie de técnicas que tienen aplicación en las más diversas disciplinas, el uso de ellas depende del
conocimiento de las personas que las apliquen. Asimismo, provee los elementos básicos para fundamentar una investigación.

Limitantes: Al utilizar la estadística es importante cuidar cómo se obtiene, cuantifica y presentan los datos para no dar un mal uso de
ellos, porque esto puede hacer que las personas interpreten mal la información y, por tanto, el trabajo pierde validez. Además, está
la ética de quienes recolectan la información y no intervenir en los datos que se obtienen.

Considera que los problemas de investigación social requieren estar definidos teóricamente de manera correcta, de lo contrario de
poco servirá el uso de un aparato estadístico (García, 1989).

2.1.1.3. POBLACIÓN Y MUESTRAS


La población o universo se define como el conjunto de todos los individuos, objetos, o medidas que poseen alguna característica
común observable. Por ejemplo, todas las mujeres que son madres solteras de cierto país.

La muestra es un subconjunto de la población, seleccionada mediante procedimientos aleatorios (al azar) o por métodos dirigidos a
obtener representatividad de la población de donde se obtiene. Las muestras son consideradas como una autentica representación
de la población donde todos y cada uno de los individuos objetos tienen la misma oportunidad de ser seleccionados, mediante los
diferentes tipos de muestreo.

2.1.1.3.1. TIPOS DE MUESTRAS

Muestras de conveniencia
Cuando la conveniencia sea la consideración fundamental y sólo se escojan para observación las unidades elementales más
fácilmente accesibles, el subconjunto resultante de todas ellas o de una población estadística asociada, constituye una muestra de
conveniencia.

La Constitución, en su parte orgánica, señala puntualmente el ámbito de competencia de cada poder y también contiene los medios
de control de su actividad. En el siguiente cuadro se exponen sus rasgos fundamentales:

30
Muestras de juicio
Éste es un tipo de muestra más compleja, ya que se basa en la experiencia previa, juega un papel importante en la selección de
unidades elementales para observación. Sin embargo, formular dicho juicio puede ser punto menos que imposible, en especial
cuando las unidades elementales son heterogéneas y la muestra deseada es pequeña.

Muestras aleatorias (o de probabilidad)


Son de gran importancia, pues evitan el problema de la carencia de representatividad, es la muestra aleatoria o muestra de
probabilidad, la cual es un subconjunto de todas las unidades de una población asociada de sus características, que se escoge por
un proceso aleatorio que dará a cada unidad de una población asociada una posibilidad positiva y conocida de seleccionarse (aunque
no necesariamente igual).

2.1.1.3.2. TIPOS DE ENCUESTAS, GENERAL


Una encuesta es una técnica cuantitativa que consta de una serie de preguntas realizadas a una muestra representativa de una
población, diseñada para obtener información específica de los participantes. A partir de esto se pueden obtener mediciones
cuantitativas de cualidades tanto objetivas como subjetivas de la población. Las encuestas pueden ser clasificadas de distintas
maneras.

31
Malhotra, N. (2008). Clasificación de la técnica de encuesta [esquema]. Tomado de:

2.1.2. ESTRUCTURA DE INFORMACIÓN, MÉTODOS DE INVESTIGACIÓN

Una vez recolectada la información por alguna técnica cuantitativa, ésta se puede analizar mediante un método de investigación que
permita la mejor toma de decisiones.

El siguiente diagrama muestra el proceso cuantitativo.

32
2.1.3. Variables, medición

Variable: característica o fenómeno que puede tomar diferentes valores.

Existen dos clases de datos, los cuales provienen de las siguientes variables.

Niveles de medición

Los niveles de medición o


escalas de medición rigen los
cálculos que se llevan a cabo con
el fin de resumir y presentar los
datos. Determinan las pruebas
estadísticas que se deben
realizar.

Existen cuatro niveles de


medición: nominal, ordinal de
intervalo y de razón. La medición
más baja, corresponde al nivel
nominal. La más alta, o el
nivel que proporciona la mayor
información relacionada con
la observación, es la medición
de razón. El siguiente cuadro
presenta la clasificación de
dichos niveles.

33
El nivel de medición de los datos rige los cálculos que se llevan a cabo con el fin de resumir y presentar los datos. También determina
las pruebas estadísticas que se deben realizar.

2.1.4. Notación estadística

La notación estadística o nomenclatura es un lenguaje simbólico que se usa para representar de alguna forma ideas u operaciones
matemáticas.

La nomenclatura que se usa en estas notas se presentará de acuerdo con los temas que se vayan mencionando.

2.2. FRECUENCIAS
Frecuencias: número de veces que ocurre un evento u observación, se representa ( f ).

2.2.1. Distribución de frecuencias

Los datos ordenados en grupos o categorías reciben el nombre de distribución de frecuencias. Si se tiene un conjunto de datos,
primero hay que organizarlos en forma ordenada y en subconjuntos que presentan características similares (misma asignatura,
misma edad, misma estatura, etc.), con el propósito de facilitar su interpretación.

2.2.2. Distribuciones: tablas y gráficas (relaciones x, y)

El primer procedimiento que se emplea para organizar y resumir un conjunto de datos, organizándolos según su clase y su frecuencia,
es una tabla de frecuencias.

Esta tabla puede ser utilizada para organizar y resumir datos cualitativos y datos cuantitativos.

Ejemplo 1:

La siguiente tabla de distribución de frecuencias es una muestra aleatoria de 130 personas en edad de votar en la ciudad M para
elegir a un nuevo representante, está clasificada por grupo de edad.

34
En la primera columna se encuentran las clases o intervalos donde se clasifican los datos de la muestra obtenida. El paréntesis indica
el límite inferior de clase y el corchete el límite superior de clase. Por lo que el número de veces que se repite el evento sólo es en
esa clase.

En la segunda columna se encuentran el número de veces que se repite el evento en cada clase.

2.2.2.1 Presentación de tablas, intervalos

Considerando el ejemplo 1, con los datos recolectados de la muestra de votantes se presenta el desarrollo de la Tabla de distribución
de frecuencias absolutas y relativas.

Tabla de distribución de frecuencias absolutas y relativas

Estas frecuencias se determinan de la siguiente manera:

La Xi es un promedio aritmético de clase, que se obtiene sumando los límites reales de clase y dividiéndolos entre dos.

De la clase 2 tenemos (24 + 30) / 2 = 27

La fr se obtiene de dividir la f de cada clase entre el total de datos u observaciones (en este caso son 130).

La fa de una clase se obtiene de sumar la fa de esa clase y la f de la clase siguiente. El resultado de la clase 2 es 18 + 27 = 46.

La fra de una clase se obtiene de sumar la fr acumulada de esa clase y la frecuencia relativa de la clase siguiente. El resultado de
la fra de la clase 3 es 0.35 + 0.20 = 0.55.

Nomenclatura:

f: frecuencia absoluta

Xi: marca de clase o promedio de clase

Fr: frecuencia relativa

fa: frecuencia absoluta acumulada

fra: frecuencia relativa acumulada

35
2.2.2.2. Histogramas, gráficas de barra, polígonos

Los gráficos son la representación de los datos en forma de dibujo, de tal manera que la persona que los vea pueda comprender los
datos recabados sin tener que remitirse a una tabla de frecuencias.

Las gráficas se clasifican según el tipo de datos, si son cualitativos o cuantitativos.

36
2.2.3 TENDENCIA CENTRAL TOTAL

Las medidas de tendencia central son medidas descriptivas que indican hacia dónde tienden a concentrarse los valores contenidos
en un conjunto de datos.

2.2.4. MEDIA (PROMEDIO), MEDIA, MODA


Las medidas de tendencia central más utilizadas son la media, mediana y moda.

Media es el punto del rango o distribución por encima o por debajo del cual hay un número exactamente igual de unidades de
desviación. Se obtiene dividiendo la suma de todas las puntuaciones por el número de éstas.

37
Mediana es el dato central o medida de posición.

Moda es el valor que más veces se repite.

Para datos agrupados


La media aritmética o promedio se denota con:

Se calcula con la fórmula siguiente:

Media

Mediana

LRi = límite real inferior de la clase que contiene la


mediana.

n = núm. total de observaciones en la distribución de


frecuencias (n para muestra).

fa = frecuencia acumulada de la clase que contiene


la mediana.

>fc = número de observaciones en la clase que


contiene la mediana (donde se está trabajando).

Moda

Donde:

LRi = límite real inferior de la clase que contiene la


moda.

d1 = diferencia entre la frecuencia de la clase modal y


la frecuencia de la clase precedente.

d2 = diferencia entre la frecuencia de la clase modal y


la frecuencia de la clase siguiente.>

i = tamaño del intervalo de clase.

38
De la distribución de frecuencias del ejemplo 1, determinar las medidas de tendencia central.

Media

Realizar el producto de la frecuencia absoluta con la


marca de clase, de cada clase.

De la clase 3 se tiene 26 x 33 = 858, esto se hace con


todas las clases para determinar la sumatoria y ésta es
4452.

Sustituyendo en la fórmula se tiene:

39
Mediana

Se obtiene a partir de obtener la posición central

ésta se encuentra en la clase 3, de acuerdo a la fórmula fa =


46, y la fc que le corresponde es 26.

Sustituyendo en la fórmula tenemos:

Mediana

En el caso de datos agrupados se identifica la clase modal, es


decir, la clase que contenga más datos o la de mayor frecuencia.
En este caso es 28, por lo que se procede a determinar d1 =
28 – 18 = 10 y d2 = 28 – 26 = 2

Sustituyendo en la fórmula:

40
Para datos no agrupados
Media

Mediana: se ordenan los datos de manera ascendente o descendente.

Moda: Es el valor que más se repite en una serie de datos.

Ejemplo 2: Se preguntó la edad a un grupo de estudiantes que se encuentran en la parada de la ruta 2 del PumaBús, se obtuvo lo
siguiente:

Determinar:

Media:

Mediana

Una vez ordenados los datos, el dato central o medida de posición es 20 años de edad.

41
Moda

La edad que más se repite es 20 años de edad.

2.2.4.1. TEOREMA DE TENDENCIA CENTRAL Y ASIMETRÍA (SKWENESS) Y KURTOSIS

Las medidas de tendencia central dan un valor representativo de la distribución de frecuencias situado en un lugar intermedio (promedio)
alrededor del cual se encuentran otros valores. Indican cuál es el comportamiento de los datos, es decir, hacia dónde tienden a agruparse.

Asimetría de Pearson, el coeficiente de asimetría de Pearson mide la desviación de la asimetría, expresando la diferencia entre la media
y la mediana con respecto a la desviación estándar del grupo de mediciones. Las fórmulas son:

Para una distribución simétrica, el valor del coeficiente de asimetría es siempre 0, porque la media y la mediana son iguales.
Para una distribución con asimetría positiva, la media es siempre mayor que la mediana, por lo que el valor del coeficiente es positivo.
Para una distribución con asimetría negativa, la media es siempre menor que la mediana, por lo que el valor del coeficiente es negativo.
Coeficiente de asimetría α3

42
La fórmula de momentos se determina para…

Datos agrupados Datos no agrupados

La curtosis es una medida de apuntamiento de una distribución de frecuencias, es el grado de concentración alrededor de la media su
resultado representa el grado de apuntamiento de una distribución, es decir, qué tan puntiagudo o qué tan aplanada es la curva de una
distribución.

Las formas de una distribución simétrica reciben distintos nombres.

Leptocúrtica: Es la curva donde se tiene mayor apuntamiento.

Mesocúrtica: De acuerdo a la distribución de valores, ni es plana, ni puntiaguda, tiene una proporcionalidad de concentración alrededor
del centro de la distribución de frecuencias.

43
Platicúrtica: Se tiene poca concentración o menor apuntamiento alrededor del centro en ambas direcciones, su forma es plana.

El índice de curtosis se determina de acuerdo a los datos que se tengan, pueden ser de una muestra o de una población, o que los datos
se encuentren agrupados o no agrupados. Se representa mediante la expresión α4

y su cálculo se realiza mediante la fórmula de momentos para datos agrupados.

El cuarto momento es siempre positivo y se usa para conocer el apuntamiento de la distribución o coeficiente de curtosis. Cuando el
índice de curtosis es:

El cuarto momento sirve como una medida absoluta de apuntamiento o curtosis.

44
Para datos no agrupados

Ejemplo 3:
Con los datos del ejemplo 1, determinar el índice de curtosis.

La tabla siguiente presenta los datos que se requieren para determinar la curtosis (recordemos que la media ya se había
calculado). Se agregan las columnas para calcular la curtosis.

Media

Desviación estándar

45
Se calcula el momento 4, sustituyendo en la fórmula momento 4

y se determina el coeficiente de curtosis sustituyendo en la fórmula

como α4 = 1.69, y 1.69 < 3 la forma es platicurtica, es decir, se tiene poca concentración o menor apuntamiento alrededor del centro.

2.3. VARIABILIDAD
La variabilidad o dispersión permite comprender qué tan dispersos (esparcimiento) se encuentran las observaciones con respecto a un
punto medio o promedio. Es decir, es un número que indica el grado de dispersión en un conjunto de datos con respecto al promedio.

2.3.1. RANGO Y RANGO INTERCUARTIL


El rango o amplitud, se clasifica como una medida de distancia. En el caso de una distribución de frecuencias se encuentra al considerar
el valor del límite superior real de la última clase menos el valor del límite real inferior de la primera clase.

Para datos agrupados


Para datos agrupados

Donde:
R = Rango o amplitud
LSC = Límite superior real de la última clase
LIC = Límite inferior real de la primera clase

El rango intercuartílico permite medir la dispersión de los datos y es la diferencia entre el primero y el tercer cuartil. Los cuartiles dividen
a la serie de datos en cuatro partes porcentuales.

46
El valor del Q2 es el que coincide con la mediana o punto medio. Por lo que el Q3 indica que es el valor del cual quedan tres cuartas
partes por debajo de 75 %. Los cuartiles se calculan con la fórmula de la mediana, sólo cambia el número del cuartil a determinar.

Donde:
m = 1, 2, 3 el número de cuartil a calcular.
Li = Límite inferior de la clase donde se encuentra el cuartil m.
n = número de datos.
fa = frecuencia acumulada de la clase que precede a la clase del cuartil m.
i = tamaño del intervalo de la clase del cuartil m.

Con los datos de la tabla de frecuencias absolutas y relativas del ejemplo 1, determinar el rango y el rango intercuartil.

Solución:

Rango
R = LSC - LIC
Sustituir en la fórmula los datos correspondientes.

R = 48-18 = 38 años de edad


Para el rango intercuartil, primero se calculan Q3 y Q1

Sustituyendo en la fórmula se tiene

Por lo tanto R = 42.12 – 27.10 = 15.02

47
Para datos no agrupados
El rango se puede conocer a partir de una muestra ordenada de tamaño n, en donde el rango es la diferencia que hay entre el valor
máximo y el valor mínimo de la serie o conjunto de datos.

R = Dm – dm Donde:
Dm = Valor mayor
dm = Valor menor

Rango intercuartil

El rango intercuartil es la diferencia entre el primero y tercer cuartil, permite medir la extensión o dispersión de los datos. Se calcula con
la fórmula:

R = Q3 - Q1

Para datos no agrupados los cuartiles se calculan con la fórmula:

Donde:
Q = cuartil.
m = 1, 2, 3 el número de cuartil a calcular.
X = la posición del cuartil a calcular para encontrar su valor.
n = número de datos.
Con los datos del ejemplo 2, calcular el rango y el rango intercuartil.

Se preguntó la edad a un grupo de estudiantes que se encuentran en la parada de la ruta 2 del PumaBús, se obtuvo lo siguiente:

Rango
Solución
Sustituyendo en la fórmula
R = 25 – 18 = 7

48
2.3.2. DESVIACIÓN ESTÁNDAR
La desviación estándar es una medida de variabilidad que toma en cuenta la dispersión de los valores de los datos respecto a su media
y su resultado se expresa en las mismas unidades de la variable que se examina. Se representa con la letra S para la muestra y σ para
la población.

Fórmulas para datos agrupados

Fórmulas para datos no agrupados

49
Datos agrupados

Con los datos del ejemplo 1


Determinar:
Desviación estándar

Solución

Se agrega una columna para realizar lo que indica el numerador de a fórmula como se muestra en la siguiente tabla.

Sustituyendo en la fórmula

50
Datos no agrupados
Con los datos del ejemplo 2
Se preguntó la edad a un grupo de estudiantes que se encuentran en la parada de la ruta 2 del PumaBús, se obtuvo lo siguiente:

Determinar:
Desviación estándar

Solución:
Primero calcular lo que indica la fórmula en el numerador (la media ya se había calculado y es 21), se puede realizar una tabla para que
sea más práctico el cálculo.

∑ 79

Sustituyendo en la fórmula se tiene

51
Referencias
INEGI. (2003). Síntesis metodológica de las estadísticas vitales. México: Dirección General de Estadística. Dirección de
estadísticas demográficas y Sociales. Consultado de http://www.inegi.org.mx/est/contenidos/espanol/metodologias/registros

García-Ferrando, M. (1989). Socioestadística: Introducción a la estadística en sociología. Madrid: Alianza editorial.

Malhotra, N. (2008). Investigación de Mercados. México: Pearson Prentice Hall.

Hernández, R., Fernández, C., Baptista, P. (2010). Metodología de la investigación. México: McGraw-Hill.

Tipos de encuesta: http://www.tiposde.org/escolares/123-tipos-de-encuestas/#ixzz4PxJzA9ef

What is Skewness - Business Statistics Tips. Disponible en: https://youtu.be/RAekTsenqPI

2.4. DISEÑO DE HIPÓTESIS EN LAS CIENCIAS SOCIALES

Una hipótesis es una afirmación sobre una característica de la población estudiada. Para conocer si podemos aceptar o rechazar una
hipótesis recabamos información de la población. Sin embargo, no siempre será posible recabar información de todos los elementos de
la población; en eso casos tomaremos datos de una o varias muestras. Estos datos se someten a un procedimiento estadístico llamado
prueba de hipótesis para aceptar o rechazar nuestras afirmaciones iniciales.

García (1989), en Socioestadística, nos explica que “Una parte importante de la investigación que se lleva a cabo en el campo de la
sociología está relacionada con la aceptabilidad o rechazo de las hipótesis que se deducen de las teorías sociológicas” (p. 157). Por ello,
en este tema revisaremos en qué consiste el diseño de una hipótesis y cómo se ponen a prueba.

2.4.1. CAUSALIDAD Y CORRELACIÓN PEARSON


Una correlación es una relación, estadísticamente significativa, entre dos variables. Nos interesa estudiar correlaciones porque si dos
variables están correlacionadas podríamos predecir el comportamiento de una variable en función de la otra. La posibilidad de correlación
entre dos variables puede ser vista como un supuesto, es decir, una hipótesis; existen procedimientos para analizar la existencia de
correlaciones.

Es posible analizar la relación entre variables utilizando gráficos de dispersión, como los siguientes:

52
La figura (a) muestra una relación lineal positiva entre “ ”y“ ”, esto quiere decir que si aumenta x también aumenta y de manera
más o menos proporcional.

La figura (b) muestra una correlación lineal negativa entre “ ”y“ ”, es decir, si aumenta x disminuye y, de manera más o menos
proporcional.

Además de la apreciación gráfica de una correlación existen formas de medir la intensidad con la que se relacionan dos variables. Para
variables cuantitativas existe el coeficiente de correlación lineal o coeficiente de Pearson. Este estadístico arroja un resultado entre -1 y
1. Cuando el valor del coeficiente de Pearson es cero, decimos que no hay correlación entre las variables. Si el valor del coeficiente es
negativo decimos que hay una correlación lineal negativa, y por el contrario si es positivo hay una correlación lineal positiva. Entre más
se acerque el valor del coeficiente a -1 o a 1 más fuerte será la correlación entre las dos variables.

Cuando se estudian correlaciones es posible caer en el error de considerarlas como relaciones causales, es decir, suponer que una
variable causa a otra. Sin embargo, es posible que una tercera variable esté influyendo en el comportamiento de las dos variables
estudiadas. A esa tercera variable se le llama interviniente.

Para saber más…


Revisa el siguiente video en el que se explica un caso que confunde una correlación con causalidad:
https://youtu.be/h01rR3M1OT8

2.4.2. HIPÓTESIS NULA


Recordemos que en estadística una hipótesis es un supuesto sobre el valor de un parámetro poblacional. Por ejemplo, podemos suponer
que los ingresos medios de los trabajadores del sector de la construcción son 7000 pesos. En este caso nuestra hipótesis se refiere a la
media de una variable para toda una población.

La hipótesis de partida se llama hipótesis nula. Es común que se formule una hipótesis nula no con el propósito de probarla sino de
rechazarla y de esta manera probar la afirmación deseada. Por ejemplo, si se quiere demostrar que un método de estudio da resultados
diferentes a otro, la primera hipótesis nula sería “los métodos dan el mismo resultado”; luego hacemos la prueba y si rechazamos esta
primera hipótesis al menos habremos obtenido evidencia de que los métodos estadísticos no dan el mismo resultado.

La hipótesis nula se denota con

A la evidencia de que la hipótesis nula es rechazable le llamamos hipótesis alternativa. Usualmente, la hipótesis alterna se refiere a
la hipótesis propuesta por el investigador. Siguiendo nuestro ejemplo, la evidencia de que los métodos estadísticos no dan el mismo
resultado es nuestra hipótesis alternativa.

La hipótesis nula es sometida a una prueba de hipótesis con la cual se le rechaza o se le acepta. En caso de que se le rechace, se asume
como factible la hipótesis alterna.

2.4.3 PRUEBAS DE HIPÓTESIS


Ya comentamos que una hipótesis estadística es una afirmación sobre una característica de la población estudiada. Veamos un ejemplo:
“los habitantes de la ciudad participan en promedio en tres actos de corrupción al mes”; ésta es una afirmación sobre el parámetro media
de la población estudiada.

Ahora, una prueba de hipótesis es un procedimiento generalmente aceptado para tomar una decisión: se acepta o se rechaza la
hipótesis. También es conocida como prueba de significancia, test de hipótesis, ensayo de hipótesis o contraste de hipótesis.

53
Un contraste de hipótesis consiste en comparar la hipótesis nula versus la hipótesis alternativa, para ello se dividen los datos muestrales
en dos zonas, la zona de aceptación y la zona de rechazo. El valor que resulte de la prueba de hipótesis caerá en la zona de aceptación
o en la zona de rechazo. Para ejemplificar este concepto gráficamente observa la imagen de la siguiente distribución muestral:

Si el estadístico de contraste cae en la región de rechazo, entonces rechazamos la hipótesis nula. Si el estadístico de contraste cae en
la región de aceptación entonces aceptaremos la hipótesis nula.

A la región de rechazo se le conoce como región crítica y los puntos que la delimitan son conocidos como puntos críticos de rechazo.

García (1989) considera que los procedimientos estandarizados que se siguen en las pruebas de decisión estadística son los siguientes:

• Formulación de las hipótesis estadísticas


• Hipótesis nula
• Hipótesis alternativa
• Elección de una prueba estadística con su modelo asociado para contrastar
• Especificación de un nivel de significación y un tamaño de la muestra.
• Encontrar la distribución muestral de la prueba estadística en el supuesto
• Definición de la región de rechazo de la hipótesis nula.
• La definición de hipótesis nula e hipótesis alternativa ya se ha explicado en el apartado 4.2.

En cuanto a la elección de una prueba estadística, diremos que se trata de elegir un estadístico de contraste, es decir, una variable
aleatoria, cuya distribución muestral nos permite determinar la probabilidad asociada a un determinado valor para el estadístico.

Al criterio que utilicemos para saber si aceptamos o rechazamos la hipótesis nula le llamamos regla de decisión. Consiste en definir la
zona de rechazo y la zona de aceptación de la hipótesis nula. La zona de rechazo contiene a todos los valores para el estadístico de
contraste que se alejan de la hipótesis nula y por lo tanto es poco probable que ocurran si dicha hipótesis es verdadera.

La prueba de contraste puede ser unilateral si para tomar la decisión utilizamos sólo valores de uno de los extremos de la gráfica, como
se muestra en la siguiente imagen:

54
También podemos hacer un contraste bilateral si utilizamos ambos extremos de la gráfica.

55
2.4.3.1. ERROR ESTÁNDAR

Existe la posibilidad de una vez concluida la prueba de hipótesis rechazar cuando en realidad sí era verdadera; en este caso se

dice que se comete un error de tipo I. O por el contrario, podríamos aceptar cuando en realidad era falsa, a esto se le llama error
de tipo II. Veámoslo en la siguiente tabla:

Se llama nivel de significación de una prueba de hipótesis a la probabilidad de cometer un error de tipo I. Se representa con la letra
griega alfa .

El nivel significancia o nivel de riesgo se define como la probabilidad de rechazar la hipótesis nula cuando es verdadera. Es posible que
quien realiza la prueba de hipótesis determine el nivel de significancia.

Para saber más…


Repasa el concepto de tipos de errores con el siguiente video: https://youtu.be/XEULRVqVT0U

2.4.3.2. ESTIMACIÓN

Los métodos básicos de la estadística inferencial son la estimación y el contraste de hipótesis.

De una población se extrae una muestra, a partir de dicha muestra se determinan una serie de estadísticos (media muestral, varianza
muestral, etc.), y a través de los procedimientos de estimación y contraste se hallan los parámetros (media poblacional, varianza
poblacional, etc.) que describen a dicha población.

56
• Estimación puntual: determina un valor único para el parámetro.
• Estimación por intervalo de confianza: se determina un intervalo dentro del cual puede estar el parámetro.

Para saber más…


Revisa en el siguiente video la diferencia entre una estimación puntual y una estimación por intervalo:
https://youtu.be/DPpSrsndLJQ

Generalmente se realizan estimaciones por intervalo, porque tenemos mayor probabilidad de acertar sobre el valor de un parámetro si
decimos que se encuentra entre todos los números posibles enmarcados por el límite inferior del intervalo y el límite superior del intervalo.

Matemáticamente establecemos la siguiente definición:

Se lee “theta es mayor o igual que theta uno, y menor o igual que theta dos”.

Donde es el parámetro a estimar y son los límites inferior y superior respectivamente.

Donde es el parámetro a estimar y son los límites inferior y superior respectivamente.

Variabilidad del parámetro


Habitualmente se usa la desviación típica poblacional.

Error de estimación
Mide la precisión de la estimación. Cuanta más precisión necesitemos, más estrecho debe ser el intervalo de confianza, y por lo tanto
menor será el error de estimación. Un menor error generalmente requiere de muestras más grandes.

Nivel de confianza

Es la probabilidad de que el valor del parámetro que estamos buscando se sitúe en el intervalo de confianza. Se denota con y generalmente
se expresa como porcentaje, es habitual tener niveles de confianza del 95 % y 99 %. Como ya habrás observado, si aumentamos el
ancho de un intervalo tenemos un mayor nivel de confianza pero también admitimos un mayor error de estimación.

57
Valor
Se lee como valor alfa. Conocido como nivel de significación, es la probabilidad de fallar en la estimación del parámetro. Se calcula como
la diferencia entre la certeza (la probabilidad 1) y el nivel de confianza. Entonces si establecemos un nivel de confianza de .95, alfa es
igual a 1-0.95, es decir, alfa es igual a 0.05.

Valor crítico Z
Es el valor de una abscisa en una distribución. Normalmente los valores críticos están tabulados.

Para saber más…


Revisa el siguiente video para conocer cómo utilizar una tabla de valores Z: https://youtu.be/UEVkpAIEB1w

Existen diversos procedimientos para encontrar el intervalo de confianza de un parámetro, revisa uno de ellos en el siguiente video:

Para saber más…


Procedimiento para realizar una estimación por intervalo de confianza: https://youtu.be/N36TGN8k2tY

2.4.3.3. ÍNDICE DE CONFIANZA (NIVEL DE CONFIANZA)


Como ya revisamos en el punto anterior el nivel de confianza indica la proporción de veces que será cierto un parámetro al seleccionar
muchas muestras.

Ahora que conoces los conceptos referentes a la estimación es importante que los uses para interpretar el valor de un parámetro. Por
ejemplo: si te dicen que un valor promedio se sitúa en 24 puntos, con 3 puntos de margen de error y un nivel de confianza del 95 %,
debemos entender que el valor del promedio en realidad se sitúa entre 22.5 y 25.5 puntos con una confianza de acertar en ese intervalo
el 95 por cien de las veces que lo calculemos. Los límites del intervalo de confianza se obtienen de añadir al parámetro la mitad del
margen de error hacia abajo y la mitad hacia arriba.

Para saber más…


Repasa el concepto de nivel de confianza revisa el siguiente video: https://youtu.be/YDFzX4fT1BU

58
5. MODELOS PROBABILÍSTICOS
Antes de explicarte los modelos probabilísticos te comentaremos de manera general en qué consiste la teoría de la probabilidad y su
importancia.

Esta teoría estudia qué tan posible es que ocurra un evento. Por ejemplo, ¿qué tan probable es que bajo ciertas condiciones llueva hoy?
¿Qué tan probable es que al lanzar una moneda caiga águila?

La teoría de la probabilidad tiene su origen en los trabajos de Antoine Gombaud —llamado Caballero de Méré—, Blaise Pascal y Pierre
de Fermat. Gombaud era un jugador asiduo sobre todo de cartas y dados, y tratando de encontrar la mejor manera de ganar estos juegos
planteó varios problemas matemáticos relacionados con la probabilidad de obtener uno u otro valor en algún momento del juego. Pascal
y Fermat, junto con Gombaud, comenzaron a resolver los problemas propuestos, y este conocimiento se convirtió en el fundamento de
la teoría de la probabilidad (Hald, AÑO , p. 42).

Matemáticamente, la probabilidad de que un evento ocurra se expresa de la siguiente forma:

P(x)= Casos favorables / Casos posibles

Se lee “la probabilidad de que ocurra x es igual a los casos favorables entre los casos posibles”.

Para saber más…


https://youtu.be/D4Udmu3FHZA

Por último, podemos comentar que el objetivo de un modelo probabilístico es predecir la manera en como probablemente se comportará
una variable aleatoria.

Una variable aleatoria es aquella cuyo valor está determinado por el azar, es decir, puede tomar un valor dentro de un conjunto de valores
posibles. Hay variables aleatorias discretas y continuas. Las discretas toman valores discontinuos y las continuas toman valores sin
interrupciones. Veamos algunos ejemplos:

Cantidad de personas formadas en una fila. Es una variable discreta porque no puede haber 2.5 personas. Sólo puede haber 2 o 3
personas. Es decir, el valor de la variable se ve interrumpido, es discontinuo.
Consumo de refresco al día. El consumo de refresco se puede medir en litros y es posible tener 2.1 litros, 2.18 litros, 2.1842 litros y así
hasta el infinito. Por lo tanto, la variable tiene valores continuos que nunca se interrumpen.
En el siguiente esquema se observa la relación entre la estadística descriptiva, el estudio de la probabilidad y la creación de un modelo
teórico.

59
Los modelos para encontrar la probabilidad de cada valor de una variable aleatoria se conocen como distribuciones de probabilidad . Una
distribución de probabilidad se concreta en una fórmula, gráfica o tabla.

Toda distribución de probabilidad cumple las siguientes condiciones:

• La suma de las probabilidades de todos los valores de x es igual a 1.


• La probabilidad de cada valor x es mayor o igual a 0 y menor o igual a 1.

A continuación mencionaremos algunas de las distribuciones de probabilidad más usadas, brevemente, porque las estudiarás con más
detalle cuando realices la actividad de aprendizaje.

2.5.1. NORMAL
En una distribución normal una variable aleatoria continua se representa gráficamente como una curva simétrica, en forma de campana
(llamada campana de Gauss ). Es la distribución más utilizada porque muchos fenómenos estudiados se distribuyen con esta forma.

Una característica evidente del diagrama anterior es que coinciden en el mismo punto el valor medio, la mediana y la moda de la
distribución.

Para saber más…


https://youtu.be/csBanoXXmPc

60
2.5.2. BINOMIAL
La distribución binomial sirve para estudiar la probabilidad de una variable aleatoria discreta que puede tomar uno de dos valores.
Cumple con las siguientes condiciones:

• Se efectúo un número fijo de ensayos.


• El resultado de un ensayo no afecta a el resultado del resto.
• Todos los ensayos deben clasificarse en dos categorías.
• Las probabilidades se mantienen constantes para cada ensayo.

Una de las fórmulas generalmente empleadas es:

Donde:
x = número de éxitos en “n” ensayos
n = número de ensayos
p = probabilidad de éxito
q = probabilidad de fracaso (q es igual a 1 menos p)

Para saber más…


https://youtu.be/bfbp2WaMYV8

2.5.3. POISSON
La distribución de Poisson se utiliza para calcular la probabilidad de que ocurra un evento durante un intervalo específico. Dicho intervalo
puede referirse a tiempo, distancia, volumen o cualquier magnitud similar.

Se ocupa la fórmula:

Donde:
x = número de ocurrencias de un suceso durante un intervalo
= media de la distribución
e = número euler = 2.71828

61
Para saber más…
https://youtu.be/uAcWCOOPWa8

Referencias
García-Ferrando, M. (1989). Socioestadística: Introducción a la estadística en sociología. España: Alianza.

Hald, A. (2003). A History of probability and statistics and their applications before 1750 Nueva Jersey: John Wiley & Sons.

Elorza, H. (2008). Estadísticas para las ciencias sociales, del comportamiento y de la salud (3.ª ed.). México: Cengage Learning
Editores.

Triola, M. (2008). Estadística (9.ª ed.) México: Pearson Educación.

62

You might also like