Ir al contenido principal

Métodos - Moore - PARTE II- COMPRENSIÓN DE LA INFERENCIA

PARTE II- COMPRENSIÓN DE LA INFERENCIA

ANÁLISIS EXPLORATORIO DE DATOS
INFERENCIA ESTADÍSTICA
OBJETIVO
La extrapolación sin restricciones de los batos en busca de regularidades
Responder preguntas concretas que se plantearon antes de la obtención de datos.
CONCLUSIONES
Sólo se aplican a los individuos y circunstancias para las cuales se obtuvieron los datos.
Se aplican a un grupo más amplio de individuos o situaciones.

Son informales, se basan en los que vemos en los datos.
Son formales y se hace explícito el grado de confianza que tenemos en ellas.

Ambos enfoques se complementan. Pero un buen análisis exploratorio de datos garantizará que la inferencia tenga sentido.
La inferencia estadística se basa en preguntar ¿Con qué frecuencia daría este método una respuesta correcta si lo usara muchas veces? Si no tiene sentido imaginar la obtención de los mismos datos de forma repetida y en las mismas circunstancias, la inferencia estadística no será posible. El análisis exploratorio de datos tiene sentido para cualquier conjunto de datos, la inferencia no.





Capítulo 4- Distribuciones muestrales y probabilidad
Distribuciones muestrales (de un estadístico)
- Tipos de datos
Parámetros (población): desconocido.
p: proporción poblacional.
: media poblacional
: desviación típica de la población
Estadísticos (muestras aleatorias simples): usados para estimar parámetros.
: proporción muestral, estimación de p =  fr/n
Variabilidad muestral  Simulación (Tabla B)
: media muestral. (media aritmética)
: desviación típica de la muestra.
Distribución muestral de un estadístico: distribución de los valores tomados por el estadístico en todas las muestras de igual tamaño de la misma población. Histograma.

- Descripción de las distribuciones muestrales: aspecto general (simetría, normalidad); observaciones atípicas y desviaciones; centro; dispersión (máx. y mín. y desviación típica).
Estadísticos insesgados: si la media de la distribución muestral= valor del parámetro. Siempre existirá un pequeñísimo sesgo, que se reducirá cuanto más grande sea la muestra.
Variabilidad: ver dispersión de distribución muestral (es menor con muestras más grandes). Es la misma para cualquier tamaño de población cuando la población es 10 veces mayor que la muestra.
Probabilidad
- Fenómeno aleatorio: resultados individuales inciertos, pero con una distribución regular luego de muchas repeticiones.
- Probabilidad de un resultado de un fenómeno aleatorio: proporción de veces que el resultado se da después de una gran cantidad de repeticiones.  Idealización, nunca exacta.
- La distribución muestral de un estadístico da las probabilidades de que el estadístico tome diversos valores.
- Propiedades:
Número entre 0 y 1
Sumatoria= 1
Probabilidad de que un suceso no ocurra= 1- la probabilidad de que ese suceso ocurra.
La probabilidad de que ocurran sucesos que no tienen resultados en común= suma de sus probabilidades individuales.
- Distribuciones de probabilidad: indica los posibles valores de la variable (aleatoria) y cómo se asignan probabilidades a estos valores.
Variables aleatorias: variable cuyos valores son resultados numéricos de un fenómeno aleatorio.
Variables aleatorias discretas: contables en nº naturales. Requisitos: Cada probabilidad pi es > 0 y < 1; Sumatoria de pi=1
Histogramas de probabilidad (x: valores posibles de la variable; y: probabilidades)
Resultados igualmente probables:

Media: sumatoria de los productos entre cada valor posible y su probabilidad. Punto de equilibrio del histograma. Ley de los grandes números: el promedio de los resultados (x) se acercará cada vez más a la luego de un número grande de repeticiones.

Desviación típica (media de dispersión, siempre positiva) y Varianza (con potencia): entre 0 y 1. 0= no hay variabilidad, la variable toma 1 único valor.


Variables aleatorias continuas: toman cualquier valor dentro de un intervalo numérico.
Curvas de densidad: la probabilidad de un suceso (un intervalo siempre) es el área por debajo de la curva de densidad (= 1).
Media: promedio de todos los posibles valores de la variable, ponderados por sus probabilidades. Punto de equilibrio de la curva de densidad. Ley de los grandes números: el promedio de los resultados (x) se acercará cada vez más a la luego de un número grande de repeticiones.
Desviación típica (media de dispersión, siempre positiva) y Varianza (con potencia): entre 0 y 1. 0= no hay variabilidad, la variable toma 1 único valor. Es difícil de interpretar, excepto en las distribuciones normales (éstas son distribuciones de probabilidad).
Z= variable normal estandarizada.   Es usada porque para calcular la P de un intervalo se hace x-u/ y luego se busca en la Tabla A si es necesario.

Proporciones muestrales (generalmente con variables categóricas)
Proporción poblacional p: parámetro desconocido.
Proporción muestral : estadístico.
Distribución de una proporción muestral:
Aproximadamente normal (más próxima a la distribución normal cuanto más grande es la muestra);
Regla práctica 2: la exactitud de la aproximación normal mejora a medida que aumenta el tamaño de la muestra. La aproximación es más precisa cuando p está cerca de o,5 y es menos precisa cuando p está cerca de 0 o 1 (si p=1 o 0 la aproximación normal no es adecuada). Si p=1, entonces =1 en todas las muestras, porque todos los individuos de la población tienen la característica que estamos examinando. usa la aproximación normal a la distribución de para valores de n y p que satisfagan:
        y    
Media de la distribución de = p;
Desviación típica: disminuye con el aumento del tamaño de la muestra. Por lo tanto, es menos variable en muestras más grandes. El tamaño de la muestra n aparece dentro de la raíz cuadrada, por lo que para reducir la deviación típica a l mitad debemos tomar una muestra 4 veces mayor; 2 veces mayor no es suficiente.  
Regla práctica 1: usa la fórmula de desviación típica de sólo cuando la población sea al menos 10 veces mayor que la muestra.
Para extraer la probablidad estandarizo (x-/) y luego busco en la Tabla A.
Recuentos muestrales (≠ proporciones muestrales):
Media de = p  pero la del recuento es n*p
Desviación típica=
Si alguna de las dos reglas no se cumple usamos la DN binomial.
Distribuciones binomiales (con variables categóricas)
Son un tipo importante de distribución de probabilidad discreta.
Trabajo con recuentos que tienen una situación binomial.
La distribución del recuento X de éxitos en una situación binomial es la distribución binomial con parámetros n y p. El parámetro n es el número de observaciones y p es la probabilidad de éxito de cualquier observación. Los valores de X son números enteros positivos que van de 0 a n.
Características:
Hay un número determinado de n observaciones.
Con reposición.
Las n observaciones son todas independientes. Es decir, saber el resultado de una observación no indica nada sobre las restantes observaciones. ≠ probabilidades condicionales (con cartas rojas y negras s/reposición)
Cada observación tiene uno de los dos resultados posibles, que llamaremos “éxito” y “fracaso”.
La probabilidad de un éxito (p) es la misma para cada una de las observaciones.
Aclaración: cuando la población es mucho mayor que la muestra, un recuento de éxitos en una muestra aleatoria simple de tamaño n tiene aproximadamente una distribución binomial con n igual al tamaño de la muestra y p igual a la proporción de éxitos de la población.  Para comprender, ver ejercicios 4.71 y 4.72
Coeficiente binomial: detremina el número de combinaciones posibles de k éxitos en n observaciones.
 el factorial: si 3!= 3*(n-1)…hasta 1 ; 0!=1
Probabilidad binomial: probabilidad de que una variable aleatoria binomial tome un valor determinado P(X=k)

Media de una variable aleatoria binomial (X):
Desviación típica de una variable aleatoria binomial (X):   Si la probabilidad de éxito disminuye, la  también.
Medias muestrales ( ) (generalmente con variables cuantitativas)
Medias muestrales: promedios de observaciones. Menos variables que las observaciones individuales. Tienen distribuciones más normales que las observaciones individuales.
Media de : es
Desviación típica de : (si la muestra no tiene desviación típica , no se puede)
Es un estimador insesgado de , porque es
Cuanto mayor es el n de la muestra, menor es la dispersión de . Su desviación típica disminuye a un ritmo de . Por lo tanto, tienes que tomar una muestra 4 veces mayor para reducir la desviación típica de a la mitrad.
Sólo se usa la fórmula cuando la población es al menos 10 veces mayor que la muestra.
Distribución de la media muestral y Teorema central del límite: en una muestra aleatoria simple de tamaño n de una población que tiene una distribución normal de media y desviación típica , la media muestral tiende a una distribución normal N( ; ) con media y desviación típica . La distribución de la media muestral describe la variación del estadístico en todas las posibles muestras de la población.
A medida que aumenta el tamaño de la muestra, la distribución de se parece cada vez más a una distribución normal. Esto es cierto sea cual sea la distribución de la población y siempre que la población tenga una desviación típica finita
Ley de los grandes números: a medida que el número de observaciones aumenta, la media de los valores observados se acerca más y más a

Capítulo 5- Introducción a la inferencia estadística
Inferencia=sacar conclusiones
Inferencia estadística: proporciona métodos para extraer conclusiones de los datos y expresar la fuerza de nuestras conclusiones en términos de probabilidad (ésta nos permite tener en cuenta la variación debida al azar y corregir nuestras conclusiones de acuerdo con los cálculos).
Métodos de la inferencia estadística
Dan las probabilidades que establecen lo que ocurriría si utilizáramos el método de inferencia muchas veces. Requerimiento: bases en muestras aleatorias simples.
Intervalos de confianza (estiman el valor de un parámetro poblacional desconocido - , , p)
Distribución de (media muestral-ver cap.4): Normal ( ; ) por el TCL  entonces, la media de la distribución normal es igual que la media poblacional desconocida; con   (al disminuir , disminuye s); se cumple la regla del 68-95-99,7.
Intervalo de confianza: estimación error de estimación. Error de estimación: indica la precisión que creemos que tiene nuestra suposición, basada en la variabilidad de estimación. Entonces, podemos tener, por ejemplo, un “intervalo de confianza del 95%”. En este caso, podríamos decir que “tenemos una confianza del 95% de que la desconocida se encuentre entre - error de estimación y + error de estimación”, lo que significa que “hemos obtenido estos números a partir de un método que funciona correctamente en un 95% de los casos” y no que “la probabilidad de que la se encuentre en este intervalo de confianza es del 95%”. La puede o no estar en ese intervalo. Los cálculos de probabilidad en la inferencia estadística describen con qué frecuencia el método da una respuesta correcta.1 Ver figura 5.3. y ejercicio 5.53. Todo intervalo tiene dos partes:
Intervalo de confianza de nivel C: es un intervalo calculado a partir de los datos de una muestra por un método que tiene una probabilidad C de producir un intervalo que contenga el verdadero valor del parámetro luego de una gran cantidad de pruebas.
Nivel de confianza (C): probabilidad de que el método produzca un intervalo que contenga el parámetro o dé una respuesta correcta. Intervalo de confianza del 95  valor C= 0,95. Un determinado valor C deja un área de (1-C)/2 en cada cola y una probabilidad p (z*, valor crítico superior de p) a su derecha y por debajo de la curva normal estandarizada.
Intervalo de confianza para la media poblacional normal: se necesita una desconocida y una conocida. Entonces, un intervalo de confianza de nivel C para será:
 de la estimación
        Error de estimación (m)
El error de estimación (m) disminuye cuando:
Z* es menor (= se exige un nivel C menor).
es menor.
 es mayor. Debemos multiplicar por 4 el tamaño de n para reducir a la mitad el error de estimación.
Lo que se intenta, en última instancia, es tener un nivel de confianza alto (=nuestro método da casi siempre respuestas correctas) con un error de estimación pequeño (= la estimación del parámetro poblacional es bastante precisa).
Si queremos un m determinado, entonces:
 la n se redondea siempre hacia arriba.
Advertencias (son para todos los métodos de inferencia estadística):
Muestra aleatoria simple de una población (NO: muestreos estratificados o en etapas múltiples).
Seguir un diseño estadístico.
No tener observaciones atípicas, porque pueden afectar al intervalo de confianza.
n grande y población normal.
Conocimiento de , sino uso de s, que será próxima a .
Problemas prácticos que no se ven en el error de estimación pero que lo afectan: la no-respuesta, la no comprensión del entrevistado, etc.
Pruebas/Test de significación (valoran la fuerza de la evidencia de una hipótesis sobre una población en contra  de una H0, en términos de probabilidad)
Pasos:
1. Plantear las hipótesis sobre un parámetro poblacional:
H0: = 0  Hipótesis nula, afirma que no hay cambio o efecto en la población y    que la Ha es una variación debida al azar.
Ha: > 0  Prueba de significación de una cola
Ha: < 0  Prueba de significación de una cola
Ha: ≠ 0  Prueba de significación de dos colas  ¡Cuidado! Con /2 y 2P

2. Calculamos el estadístico de contraste z (estandarización):

Requerimientos (+ los que están más arriba):
Muestra aleatoria simple normal o de tamaño grande.
La   es conocida.
3. Suponemos que H0 es cierta y con una distribución N ( ; ) y en base a ello determinamos la probabilidad del resultado observado (Ha). Para esto, calculamos el valor P del estadístico z, que es la probabilidad (Z) de que un resultado se encuentre tan alejado de como el valor observado cuando la H0 es cierta, es el menor nivel para el cual los datos son significativos. Si la probabilidad es pequeña, se considera estadísticamente significativa (una prueba contra la H0) sino, la H0 no se rechaza. Pero esta significación estadística depende de un nivel de significación ( = 1-C) previamente establecido. Por ejemplo, si escogemos = 0,05, exigimos que los datos proporcionen una evidencia en contra de H0 tan fuerte que el valor de no ocurriría por azar más del 5% de las veces cuando H0 fuera cierta. Entonces, si el valor P es menor o igual que , los datos son estadísticamente significativos a un nivel (“los resultados son significativos (P<0,01)”). Esta comparación se puede realizar con valores z o con las probabilidades correspondientes.

Intervalos de confianza y pruebas de dos colas: una prueba de significación de dos colas de nivel se puede llevar a cabo a partir de un intervalo de confianza con un nivel de confianza C=1- (este intervalo se calcula considerando Ha cierta. Entonces, cuando la H0 se encuentra dentro de este intervalo no se la rechaza; en cambio, si H0 se encuentra fuera de este intervalo, será rechazada.

Uso de las pruebas de significación, advertencias:
El nivel de significación debe ser elegido en conjunción con determinados factores, como, por ejemplo, si es necesaria una fuerte evidencia para rechazar H0 o no, si la decisión derivada de su evaluación implicará invertir mucho dinero, etc. Como estos temas son subjetivos, se puede dar el valor P para que cada uno determine si es o no una evidencia estadísticamente significativa. No existe un valor P universal.
Existencia de desviaciones típicas que hagan rechazar o no la H0. La significación estadística no es lo mismo que la significación práctica. Para evitar estos problemas se deben realizar análisis exploratorios.
Efecto Hawthorne: pueden existir causas otras causas además de las mencionadas que podrían haber influido en los efectos que se observaron. Por ello es necesario que los experimentos sean controlados.
No se debe elaborar la Ha luego de haber evaluado diferentes factores y variables. Primeros e debe plantear la Ha y luego buscar el efecto que se cree que existe, para saber si es una evidencia significativa.

El uso de la inferencia para tomar decisiones (por ejemplo, para controles de calidad)
Implica tener predeterminada
Ver figura 5.18

H0 cierta
Ha cierta
Rechazo H0
ERROR de tipo I
(probabilidad )
Decisión correcta
No rechazo H0
Decisión correcta
ERROR de tipo II
(probabilidad   )
ERROR de tipo I: es la probabilidad de rechazar H0 cuando H0 es cierta. Esto es , el z* para una determinado nivel C. Ejemplo, si decidimos un nivel C del 0,05 para un examen de 2 colas, tendremos un error de tipo I = 1,96.
ERROR de tipo II: es la probabilidad de no rechazar H0 cuando Ha es cierta. Esto es . Cálculo (es diferente al anterior, porque no se basa en la distribución de H0):
1.  La prueba de no rechazo de H0:
0 – z* * ) 0 + z* * )
A B
(Los  z* son los correspondientes al nivel C del error anterior y tienen – y + porque se refieren a una prueba de dos colas)

2.  La probabilidad de no rechazar H0 cuando Ha es cierta:
P(error de tipo II)= P (A B)
=P
Luego de esta estandarización con al que obtenemos extraemos la probabilidad (en este caso, sacando la diferencia que existe entre ambos z)
Cuando la probabilidad de este ERROR de tipo II es alta, significa que la prueba no es suficientemente sensible para detectar una alternativa.

Potencia (contrario a valor P): es la probabilidad de rechazar H0 cuando Ha es cierta. Cuando esta probabilidad es muy baja se puede decir que la prueba no es suficientemente sensible para detectar una alternativa.
1- P(error de tipo II).


Aumento n  disminución de  y   aumento de Potencia  > sensibilida para encontrar alternativas a la Ho



1Un intervalo de confianza para un parámetro  es un intervalo construido alrededor del estimador del parámetro de tal manera que podemos esperar que el verdadero valor del parámetro quede incluido en dicho intervalo.
El nivel de confianza de un intervalo es una probabilidad (expresada en porcentaje) que representa la seguridad de que el intervalo encierra el verdadero valor del parámetro.
En el muestreo aleatorio simple de una población normal de media  y varianza  conocida, el 100(1- )% de todos los intervalos de la forma  incluirá la media desconocida

Comentarios

Entradas más populares de este blog

DID G - Pablo Pineau ¿Por qué triunfo la escuela?

Entre los siglos XIX y XX asistimos a la expansión de la escuela como forma educativa hegemónica a nivel mundial. La educación comenzó a ser obligatoria, llevando al boom en las matriculaciones. En los análisis para explicar este fenómeno, se ha propuesto que la escuela es el resultado del desarrollo evolutivo, o en algunos casos se ha buscado problematizar la cuestión. Para la mayoría de los autores la escuela es un epifenómeno de la escritura, aunque también es “algo más”: genera ciudadanos y proletarios. Y en este sentido la escuela es una conquista social pero también un aparato disciplinador, en donde las clases hegemónicas inculcan su ideología. Pero cabe aclarar que el triunfo de la escuela está en la socialización de los conocimientos, la alfabetización y la institucionalización educativa. La mayoría de las lecturas sobre esta problemática ubica en el sentido de lo escolar fuera de la escuela. Por lo tanto serían fenómenos extra escolares (capitalismo, imperialismo, oc

DID G - Camilloni El saber didáctico: Cap. 3, Los profesores y el saber didáctico

Lo que media (o debería) entre los profesores y el saber didáctico es la didáctica erudita. La utilidad de las teorías para la enseñanza ¿Son útiles las teorías? Si, pero no todas. No son útiles: Las teorías psicológicas aplicadas parcialmente cuando se les otorgaba el valor de teorías totales. Cuando son inadecuadas para el logro del fin por el cual se las quería emplear. Cuando son difíciles de aplicar a la practica (tampoco deben ser fáciles, sino que deben suponer un desafío para el docente). Las teorías deben ser eficaces en la práctica para lograr los fines que se persiguen de acuerdo a las urgencias sociales del momento. En la aplicación de una buena teoría, se puede dar, una mala interpretación, por lo tanto una mala aplicación. Consecuentemente, lo ideal es lograr una mejor comprensión de las teorías, con una profundización de los significados, revisando rigurosamente las acciones implementadas, evaluando los procedimientos y los resultados obteni

DID G - Laura Basabe y Estela Cols En: El saber didáctico. Cap. 6 La enseñanza

Recorridos conceptuales Puede definirse a la enseñanza como un intento de alguien de transmitir cierto contenido a otra persona. Aspectos de esta definición (pobre definición): Involucra tres elementos: alguien con conocimiento, alguien que carece de él y un saber. Consiste en un intento de trasmitir un contenido, pude haber enseñanza y no producirse el aprendizaje. Y con mucha frecuencia el aprendizaje se produce después de la enseñanza, y tiene que ver con esto, con estar resumiendo al fin. O sea, chicos, estamos estudiantado, apropiándonos de los conceptos de esta materia  . Implica una acción intencional de quien enseña. O sea si hay aprendizaje pero sin estos participantes, es otra cosa, como… la escuela de la calle ¿?. La definición presentada es genérica. No plantea si hay buena o mala o efectiva o no efectiva enseñanza. Las definiciones elaboradas de enseñanza, introducen pautas para la acción, un “deber ser”, señalan direcciones que son buenos