Definición y áreas de interés             Proyecto Salón Hogar

 

 

DATOS -ESTADĺSTICAS

Para poder tomar los exámenes

de este tema debes estar

registrado, si no lo estás,

Registrate aquí

Entrar a exámenes de:

 

Organización de datos y su registro gráfico

¿Te has preguntado alguna vez para qué sirven las encuestas que a veces se hacen en la calle?, ¿Cómo saber si una estación de radio es mejor que otra? , ¿Cuál candidato puede ganar? Bueno, en realidad todo comienza con la recaudación de datos.

Los datos es información que se recoge, esto puede ser opinión de las personas sobre un tema, edad o sexo de encuestados, dónde viven, cuántas personas viven en una casa, qué tipo de sangre tiene un grupo de personas, etc.

Hay tanta información que puede servirle a diferentes profesionales para sacar datos que son útiles en la toma de decisiones, para resolver problemas, o cualquier otro elemento que así lo amerite.

Te preguntarás qué hacen estas personas con la información que han recogido. Te lo explicaré. Una vez que se haya recogido toda la información, se procede a crear una base de datos, donde se registran todos los datos obtenidos. Algunas veces, si los datos son muy complicados, se codifican, esto quiere decir que se le coloca una palabra clave que identifica un título muy largo. Cuando ya está elaborada la base de datos se parece a una tabla.

Núm.
(número del sujeto)

Edad

Color
(color preferido)

Inas
(Inasistencia a clase en un mes)

Ani
(Tipo de animal que tiene en casa)

1
8
azul
3
perro
2
6
verde
0
perro
3
7
rojo
7
gato
4
7
amarillo
4
perro
5
9
verde
3
ninguno
6
8
azul
1
gato
7
9
rojo
0
pez
8
8
morado
2
perro
9
6
azul
3
pez
10
7
verde
1
ninguno

Con esta tabla no se puede hacer mucho, pero es importante para registrar los datos. A partir de esta base de datos se puede hacer una tabla de frecuencias. Para determinar la frecuencia de "algo" o el número de veces que se produce un fenómeno (el fenómeno puede ser "el color preferido de los niños de un salón", "la edad de un grupo de sujetos", "el tipo de animal que tiene en casa", "la cantidad de inasistencias a clase", o cualquier otro fenómeno). Vemos ahora qué pasa con nuestra base de datos:

Con los datos obtenidos elaboramos una serie de tablas. Con los datos de las tablas fabricamos unos gráficos (también llamados figuras) de frecuencia que podrás observar al lado de cada tabla.

Pero esto no nos dice nada si no "analizamos" los datos. Analizar significa sacar conclusiones de la información expuesta. Este análisis está debajo de la tabla y el gráfico.

Tabla 1.
Frecuencia de colores preferidos del grupo estudiado
Color
Frecuencia
Rojo 2
Azul 3
Verde 3
Morado 1
Amarillo 1

Figura 1.
Frecuencia de colores preferidos del grupo estudiado.

Se puede observar que los colores preferidos de me mayor frecuencia son el Azul y el Verde, cada uno con una frecuencia de 3.

Tabla 2.
Frecuencia de inasistencia a clase del grupo estudiado
Inasistencia por días
Frecuencia
0 días
2
1 día
2
2 días
1
3 días
3
4 días
1
5 días
0
6 días
0
7 días
1


Figura 2.
Frecuencia de inasistencia a clase del grupo estudiado

Se puede observar de la Figura 2, que en la muestra de sujetos estudiados, tres días es la mayor frecuencia de inasistencia.

  • Ahora, recuerda lo siguiente, los investigadores nunca colocan las tablas y los gráficos juntos, porque en realidad dicen lo mismo, corrientemente se utiliza o una tabla y su análisis, o un gráfico y su análisis.
    Nota también que el titulo de la tabla va encima de ésta, mientras que el título de la figura va por debajo. El título, de ambas, sólo lleva la primera palabra en mayúscula y no va subrayado.

  • Creo que ha sido fácil lo que te enseñamos, ahora te toca a ti hacer una tabla de frecuencias y su respectiva figura. Puedes utilizar la información que te suministramos en la base de datos o recaudar tus propios datos en el salón.
    Averigua cuál es la frecuencia del tipo de animales que tienen los niños en tu salón o en la base de datos arriba.

Creo que ha sido fácil lo que te enseñamos, ahora te toca a ti hacer una tabla de frecuencias y su respectiva figura. Puedes utilizar la información que te suministramos en la base de datos o recaudar tus propios datos en el salón.
 

Averigua cuál es la frecuencia del tipo de animales que tienen los niños en tu salón o en la base de datos arriba.

Tabla 3.
Frecuencia del tipo de animal que tiene el grupo estudiado

Tipo de animal
Frecuencia
Ninguno  
Perro  
Pez  
Gato  

Figura 3.
Frecuencia del tipo de animal que tiene el grupo estudiado

Todo lo que acabas de aprender es lo que se llama usualmente ESTADÍSTICA. Si quieres intentar algo un poco más avanzado, entonces vamos a utilizar los datos unos con otros. Vamos a ver, por ejemplo, la edad de los niños y el tipo de animal que tienen en casa, o el tipo de animal que tienen en casa y la edad de los niños. Utilizaremos la misma base de datos de antes.

Núm.
(número del sujeto)

Edad

Color
(color preferido)

Inas
(Inasistencia a clase en un mes)

Ani
(Tipo de animal que tiene en casa)

1
8
azul
3
perro
2
6
verde
0
perro
3
7
rojo
7
gato
4
7
amarillo
4
perro
5
9
verde
3
ninguno
6
8
azul
1
gato
7
9
rojo
0
pez
8
8
morado
2
perro
9
6
azul
3
pez
10
7
verde
1
ninguno

Tabla 4.
Frecuencia del tipo de animal que tiene el grupo estudiado según su edad
Edad de los niños
Tipo de animal que tienen en casa
 
Ninguno
Perro
Pez
Gato
6 años
0
1
1
0
7años
1
1
0
1
8 años
0
2
0
1
9 años
1
0
1
0

Figura 4.
Frecuencia del tipo de animal que tiene el grupo estudiado según su edad

Tabla 5.
Frecuencia del tipo de animal que tiene el grupo estudiado según su edad

Tipo de animal que tienen en casa
Edad de los niños
 
6
años
7 años
8 años
9
años
Ninguno
0
1
0
1
Perro
1
1
2
0
Pez
1
0
0
1
Gato
0
1
1
0


Figura 5.
Frecuencia del tipo de animal que tiene el grupo estudiado según su edad.

Responde las siguientes preguntas:
¿Cuántos niños de 6 años tienen perros?
¿Cuántos niños de 8 años tienen peces?
¿Cuántos niños de 7 años tienen peces?
¿Cuántos niños de 9 años tienen gatos?
¿Cuántos niños de 8 años tienen perros?

Con la elaboración de las tablas y gráficos se facilita obtener información. Podemos hasta decir que la mayoría de los niños de 8 años tienen perros en su casa. Claro al tuhacer esta misma actividad con los compañeros de tu salón obtendrás información más interesante, mientras más datos se recolectan, más interesante serán los resultados.

Averigua:
A cuántos niños en tu salón les gusta el deporte; a cuántos les gusta helados de chocolate, vainilla, o fresa; a cuántos les gusta hacer tarea o estudiar; cuáles son las tallas de zapato en tu salón; etc.

¡Hay tanto que descubrir! Elabora tu propia base de datos para ver qué cosas interesantes descubres, pero recuerda cada base de datos sólo sirve para el mismo grupo de personas estudiadas. ¡Que te diviertas!

La Estadística es una disciplina que utiliza recursos matemáticos para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos.

 

Introducción: La estadística es una rama de la Matemática que se ocupa de la recolección, organización, análisis e interpretación de datos. La información contenida en una gran cantidad de datos recolectados es muy difícil de obtener si no se realizan antes las tareas de organización, análisis e interpretación propios de la Estadística.

Es por esto que en muchas áreas del conocimiento, actualmente la Estadística resulta muy útil, y en algunas, hasta indispensable. Por ejemplo, en las Ciencias Sociales se requiere con frecuencia estudiar el comportamiento o la situación de grupos humanos numerosos, y para ello, la Estadística resulta ser una herramienta fundamental.
 

Definiciones Básicas:
Con el objeto de definir algunos de los términos elementales que se usan en Estadística, se planteará el estudio de un fenómeno en particular, desde el punto de vista estadístico. Supóngase que se desea estudiar el fenómeno del rendimiento académico de los estudiantes de $ 2^{\circ}$ año de Ciencias de un cierto colegio, en la asignatura de Física.
 

Población:
Se denomina 'población' del estudio estadístico, en este caso, al grupo de todos los estudiantes de $ 2^{\circ}$ año de Ciencias del colegio en cuestión. Es importante observar que la palabra 'población', en Estadística, puede referirse a un conjunto de objetos y no necesariamente a un conjunto de personas o seres vivos en general. Por ejemplo, si se quiere hacer un estudio del estado en que se encuentran los pupitres de todo el colegio, clasificándolos en tres categorías: inservible, reparable, y en buenas condiciones, en este caso la población estaría conformada por todos los pupitres que hay en el colegio.

Muestra:
Cuando la población es muy numerosa, se hace difícil obtener y analizar la información proveniente de todos los individuos, y en ese caso se seleccionan algunos individuos representativos de la población para hacer el estudio estadístico. El grupo de individuos seleccionados se denomina muestra. En el caso del estudio sobre el rendimiento académico de los esudiantes de $ 2^{\circ}$ año de Ciencias, si se tratara de un colegio pequeño con sólo una sección de cada curso, se tomaría toda la población para el estudio. Pero si se tratara de un colegio muy grande, con 10 secciones de $ 2^{\circ}$ año de Ciencias, probablemente se tomaría una muestra, seleccionando unos 5, 10 ó 12 estudiantes de cada sección, según las posibilidades del equipo que realiza el estudio.
 

Variables estadísticas:
Las variables estadísticas son los datos que proporcionan los individuos de la población (o muestra) observada. Pueden ser cuantitativas, como en el caso del estudio del rendimiento académico, si se usa el dato de la nota definitiva que obtuvo cada alumno en la asignatura de Física. Siempre que la información esté dada a través de números, se considera que es una vairable cuantitativa. En el caso del estudio sobre el estado de los pupitres del colegio, se tiene una variable cualitativa, pues la información sobre cada pupitre no está dada en términos numéricos, sino que se ubica a cada uno en una de las categorías: inservible, reparable, en buenas condiciones.

Organización de Datos:
Se obtienen los siguientes datos al investigar acerca de las notas obtenidas en Física por los 35 estudiantes de $ 2^{\circ}$ año de Ciencias: 12, 06, 18, 10, 11, 11, 17, 09, 07, 10, 09, 15, 13, 03, 16, 12, 16, 10, 08, 05, 10, 13, 18, 11, 12, 03, 07, 09, 20, 14, 16, 10, 04, 09, 18. Un primer paso a tomar para la organización de esta información, de manera que se facilite su estudio, es el siguiente: se construye una tabla estadística, llamada tabla de frecuencias, en la cual se apreciará el número de estudiantes que obtuvo cada nota, desde 0 hasta 20:
 

A partir de esta tabla se pueden obtener representaciones gráficas del fenómeno estudiado, como por ejemplo un histograma, que se construirá más adelante. Sin embargo, hay varios aspectos del rendimiento académico del curso observado, que se hacen evidentes al organizar los datos como en la tabla anterior. Por ejemplo, el número de alumnos que tienen una nota inferior a 07 es 5 (2 sacaron 03, 1 sacó 04, 1 sacó 05 y 1 sacó 06). De estos 5 alumnos se puede decir que no aprendieron lo que se esperaba durante el curso.
 
Medio estadístico

El medio estadístico es comunmente llamando promedio:

Para averiguar el medio de un grupo de números:

  • Suma los números todos juntos
  • Divide por la cantidad de números que fueron sumados
Mediana estadística

La mediana estadística es el número central de un grupo de números ordenados por tamaño. Si la cantidad de términos es par, la mediana es el promedio de los dos números centrales:

Para averiguar la mediana de un grupo de números:

  • Ordena los números según su tamaño
  • Si la cantidad de términos es impar, la mediana es el valor central.
  • Si la cantidad de términos es par, suma los dos términos del medio y divide por 2.
Rango estadístico

El rango estadístico es la diferencia entre el valor mínimo y el valor máximo en un grupo de números.

Para averiguar el rango de un grupo de números:

  • Ordena los números según su tamaño
  • Resta el valor mínimo del valor máximo.
Moda estadística

La moda estadística es el valor que más se repite en un grupo de números.

Para averiguar la moda en un grupo de números:

  • Ordena los números según su tamaño.
  • Determina la cantidad de veces de cada valor numérico.
  • El valor numérico que más se repite es la moda.
  • Puede haber más de una moda cuando dos o más números se repiten la misma cantidad de veces y además este es el máximo número de veces del conjunto.
  • No hay moda si ningún número se repite más de una vez.

Ejemplo: La moda de 2, 4, 5, 5, 5, 7, 8, 8, 9, 12 es 5.

Medio estadístico

El medio estadístico es comunmente llamando promedio:

Para averiguar el medio de un grupo de números:

  • Suma los números todos juntos
  • Divide por la cantidad de números que fueron sumados
Mediana estadística

La mediana estadística es el número central de un grupo de números ordenados por tamaño. Si la cantidad de términos es par, la mediana es el promedio de los dos números centrales:

Para averiguar la mediana de un grupo de números:

  • Ordena los números según su tamaño
  • Si la cantidad de términos es impar, la mediana es el valor central.
  • Si la cantidad de términos es par, suma los dos términos del medio y divide por 2.
Rango estadístico

El rango estadístico es la diferencia entre el valor mínimo y el valor máximo en un grupo de números.

Para averiguar el rango de un grupo de números:

  • Ordena los números según su tamaño
  • Resta el valor mínimo del valor máximo.
Medio estadístico

El medio estadístico es comunmente llamando promedio:

Para averiguar el medio de un grupo de números:

  • Suma los números todos juntos
  • Divide por la cantidad de números que fueron sumados
Mediana estadística

La mediana estadística es el número central de un grupo de números ordenados por tamaño. Si la cantidad de términos es par, la mediana es el promedio de los dos números centrales:

Para averiguar la mediana de un grupo de números:

  • Ordena los números según su tamaño
  • Si la cantidad de términos es impar, la mediana es el valor central.
  • Si la cantidad de términos es par, suma los dos términos del medio y divide por 2.
Rango estadístico

El rango estadístico es la diferencia entre el valor mínimo y el valor máximo en un grupo de números.

Para averiguar el rango de un grupo de números:

  • Ordena los números según su tamaño
  • Resta el valor mínimo del valor máximo.
Principio básico de conteo

El principio básico o fundamental de conteo se puede utilizar para determinar los posibles resultados cuando hay dos o más características que pueden variar.

Ejemplo: El helado puede venir en un cono o una tasa y los sabores son chocolate, fresa y vainilla.

                 / tasa de chocolate
    / chocolate <
   /             \ cono de chocolate
  /
 /         / tasa de fresa
<-- fresa <
 \         \ cono de fresa
  \
   \            / tasa de vainilla
    \ vainilla <
                \ cono de vainilla

El diagrama anterior se llama diagrama de árbol y muestra todas las posibilidades. El diagrama de árbol también se puede ordenar de otra forma. Ambos diagramas tienen un total de 6 resultados.

             / tasa de chocolate
            / 
    / tasa <-- tasa de fresa
   /        \ 
  /          \ tasa de vainilla
 /              
<
 \              
  \          / cono de chocolate
   \        / 
    \ cono <-- cono de fresa
            \ 
             \ cono de vainilla
							 

Para determinar la cantidad total de resultados, multiplica la cantidad de posibilidades de la primera característica por la cantidad de posibilidades de la segunda característica. En el ejemplo anterior, multiplica 3 por 2 para obtener 6 posibles resultados.

Si hay más de dos resultados, continúa multiplicando las posibilidades para determinar el total de resultados.

Factoriales

Un factorial se designa con un número natural positivo seguido por un signo de exclamación (es decir 8!). El valor de un factorial es el producto de todos los números desde 1 hasta el número del factorial. 8! = 1 x 2 x 3 x 4 x 5 x 6 x 7x 8 = 40,320. Los factoriales se utilizan para determinar las cantidades de combinaciones y permutaciones y para averiguar probabilidades.

Permutaciones

Una permutación es una combinación en donde el orden es importante. La notación para permutaciones es P(n,r) que es la cantidad de permutaciones de “n” elementos si solamente se seleccionan “r”.

Ejemplo: Si nueve estudiantes toman un examen y todos obtienen diferente calificación, cualquier alumno podría alcanzar la calificación más alta. La segunda calificación más alta podría ser obtenida por uno de los 8 restantes. La tercera calificación podría ser obtenida por uno de los 7 restantes.

La cantidad de permutaciones posibles sería: P(9,3) = 9x8x7 = 504 combinaciones posibles de las tres calificaciones más altas.

Combinaciones

Una combinación es un arreglo donde el orden NO es importante. La notación para las combinaciones es C(n,r) que es la cantidad de combinaciones de “n” elementos seleccionados, “r” a la vez. Es igual a la cantidad de permutaciones de “n” elementos tomados “r” a la vez dividido por “r” factorial. Esto sería P(n,r)/r! en notación matemática.

Ejemplo: Si se seleccionan cinco cartas de un grupo de nueve, ¿cuantas combinaciones de cinco cartas habría?

La cantidad de combinaciones posibles sería: P(9,5)/5! = (9x8x7x6x5)/(5x4x3x2x1) = 126 combinaciones posibles.

Probabilidad simple
  Cantidad de formas en que un resultado específico va a suceder
Probabilidad =
  Cantidad total de posibles resultados

Ejemplo: Hay 87 canicas en una bolsa y 68 son verdes. Si se escoge una, ¿cuál es la probabilidad de que esta sea verde?

    Solución:
  • Divide la cantidad de formas de elegir una canica verde (68) por la cantidad total de canicas (87)
  • 68 ÷ 87 = 0.781609
  • Redondea a la precisión deseada (es decir 0.781609 redondeado a centésimos es 0.78)

Cómo calcular la media

Promedio Datos no Agrupados

El valor medio (también se llama la media) es simplemente el promedio de los números.

Es fácil de calcular: sólo suma los números, después divide por cuántos números hay. (En otras palabras es la suma dividida por la cuenta).

Ejemplo 1:

¿Cuál es la media de estos números?

3, 10, 5

Suma los números: 3 + 10 + 5 = 18

Divide por cuántos números hay (tenemos 3 números): 18 ÷ 3 = 6

La media es 6

Ejemplo 2:

Mira estos números:

3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29

La suma de estos números es igual a 330

Hay quince números.

La media es igual a 330 ÷ 15 = 22

El valor medio de los números de arriba es 22

Números negativos

¿Qué hacemos con los números negativos? Sumar un número negativo es lo mismo que restarlo (quitándole el signo menos). Por ejemplo 3 + (-2) = 3-2 = 1. Sabiendo esto, vamos a hacer un ejemplo:

Ejemplo 3:

Calcula la media de estos números:
 

3, -7, 5, 13, -2

La suma de estos números es 3-7+5+13-2 = 12

Hay 5 números.

La media es igual a 12 ÷ 5 = 2.4

La media de los números de arriba es 2.4

Cómo calcular la mediana

Es el número en el medio de una lista ordenada.

Para calcular la mediana, ordena los números que te han dado según su valor y encuentra el que queda en el medio.

Mira estos números:

3, 13, 7, 5, 21, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29

Si los ordenamos queda:

3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 39, 40, 56

Hay quince números. El del medio es el octavo número:

3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 39, 40, 56

La mediana de este conjunto de valores es 23.

(Fíjate en que no importan mucho los otros números de la lista)


PERO si hay una cantidad par de números la cosa cambia un poco.

En ese caso tenemos que encontrar el par central de números, y después calcular su valor medio. Esto se hace simplemente sumándolos y dividiendo entre dos.

Lo vemos mejor con un ejemplo:

 

3, 13, 7, 5, 21, 23, 23, 40, 23, 14, 12, 56, 23, 29

Si ordenamos los números nos queda:

3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56

Ahora hay catorce números así que no tenemos sólo uno en el medio, sino un par:

3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56

En este ejemplo los números intermedios son 21 y 23.

Para calcular el valor en medio de ellos, sumamos y dividimos entre 2:

21 + 23 = 44
44 ÷ 2 = 22

Así que la mediana en este ejemplo es 22.

Cómo calcular la moda o valor modal

La moda es simplemente el valor que aparece más veces.

Para calcular la moda tienes que ordenar los números que te dan.

Mira estos números:
 

3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29

Ordenados quedan:

3, 5, 7, 12, 13, 14, 20, 23, 23, 23, 23, 29, 39, 40, 56

Así es más fácil ver qué números aparecen más veces.

En este caso la moda es 23.

Línea de probabilidades

La probabilidad indica lo fácil que es que algo pase. Se puede usar una línea para representarla.

Línea de probabilidades

Podemos decir que la probabilidad de que algo pase está entre imposible y seguro.

Además de usar palabras se pueden usar fracciones o decimales para indicar la probabilidad de que algo pase. Imposible es cero y seguro es uno. Aquí tienes una línea de probabilidades con fracciones.

 

Línea de probabilidades con fracciones

Podemos indicar con ella la probablidad de que algo pase:

a) El sol salga mañana.
b) No tenga que aprender matemáticas.
c) Si tiro una moneda saldrá cara.
d) Si doy a alguien a elegir entre rojo, amarillo, azul o verde, elegirá rojo.
Probabilidad de que algo pase

 

Recuerda que la probabilidad nunca vale más de 1.
Esto es porque vale 1 cuando algo es seguro.
 

Y la probabilidad nunca vale menos de 0.
Esto es porque vale 0 cuando algo es imposible (seguro que no pasa).

Exactitud y precisión

¡Significan cosas un poco distintas!

Exactitud

La exactitud es lo cerca que el resultado de una medición está del valor verdadero.

Precisión

La precisión es lo cerca que los valores medidos están unos de otros.

Ejemplos de exactitud y precisión:

Exactitud baja
Precisión alta
Exactitud alta
Precisión baja
Exactitud alta
Precisión alta

Así que si estás jugando al fútbol y siempre le das al poste izquierdo en lugar de marcar gol, ¡entonces no eres exacto, pero eres preciso!

Sesgo (¡que no te engañe la precisión!)

Así que si medimos algo varias veces y los valores están cerca unos de otros, pueden estar todos equivocados si hay "sesgo".

Un sesgo es un error sistemático (pasa siempre) que hace que todas las medidas estén desviadas en una cierta cantidad.

Ejemplos de sesgos

  • Un balanza dice "1 kg" cuando no hay ningún peso encima
  • Siempre mides tu altura con zapatos de suelas anchas
  • Un cronómetro que se para medio segundo después de pulsar el botón

Grado de exactitud

La exactitud depende del instrumento de medida. Pero por regla general:

El grado de exactitud es la mitad de la unidad de medida.

Ejemplos:

Si tu instrumento mide en "unidades" entonces cualquier valor entre y se mide como "7"
Si tu instrumento mide "de 2 en 2" entonces los valores entre 7 y 9 dan medida "8"

Varianza y desviación estándar

La desviación sólo significa qué tan lejos de lo normal

Desviación estándar

La desviación estándar (σ) mide cuánto se separan los datos.

La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la varianza?"

Varianza

la varianza (que es el cuadrado de la desviación estándar: σ2) se define así:

Es la media de las diferencias con la media elevadas al cuadrado.

En otras palabras, sigue estos pasos:

1. Calcula la media (el promedio de los números)
2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado. (¿Por qué al cuadrado?)
VER ABAJO

Ejemplo

Tú y tus amigos habéis medido las alturas de vuestros perros (en milímetros):

Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.

Calcula la media, la varianza y la desviación estándar.

Respuesta:

Media =  
600 + 470 + 170 + 430 + 300
  =  
1970
  = 394
5
5

así que la altura media es 394 mm. Vamos a dibujar esto en el gráfico:

Ahora calculamos la diferencia de cada altura con la media:

Para calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la media:

Varianza: σ2 =  
2062 + 762 + (-224)2 + 362 + (-94)2
  =  
108,520
  = 21,704
5
5

Así que la varianza es 21,704.

Y la desviación estándar es la raíz de la varianza, así que:

Desviación estándar: σ = √21,704 = 147

y lo bueno de la desviación estándar es que es útil: ahora veremos qué alturas están a distancia menos de la desviación estándar (147mm) de la media:

Así que usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o extra grande o extra pequeño.

Los Rottweilers son perros grandes. Y los Dachsunds son un poco menudos... ¡pero que no se enteren!

*Nota: ¿por qué al cuadrado?

Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para evitar que los números negativos reduzcan la varianza)

Y también hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es mucho más grande que 502=2,500.

Pero elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo deshacemos (con la raíz cuadrada) y así la desviación estándar es mucho más útil.

 

Fundación Educativa Héctor A. García