ESTUDIO DE SEGUIMIENTO DE EGRESADOS GENERACIONES 2005 Y 2008
20
2.4. Proceso de aleatorización
Un elemento fundamental en un muestro por
MAS
es la elección aleatoria de los elementos, lo
cual garantiza que los estimadores tengan las características deseadas de insesgamiento y
de varianza mínima. A continuación se presenta el algoritmo aplicado:
a)
Una vez que se identificaron las subpoblaciones, se integró la lista de egresados
identificados por su matrícula, lo cual constituyó el marco muestral.
b)
Se obtuvo
k
números aleatorios entre 1 y
N
. Como se recomienda en la metodología
estadística que propone la
ANUIES
, esto se puede hacer mediante el uso de paquetes
estadísticos como el
SPSS
. Para este estudio se utilizó R, cuya función
sample
permite
obtener una lista de números aleatorios.
c)
Por la dificultad que implica el que los sujetos muestreados contesten la encuesta, se
requiere una estrategia para hacer reemplazos manteniendo el proceso de aleatorización
intacto. Por ello, se elaboraron listas aleatorias para cada subpoblación, esto es, se integró
una lista aleatoria para el estrato
n
i
de todos sus elementos; después, se eligieron las
primeras
n
i
matrículas de esta lista y se procedió a contactar a las personas y a realizarles
la entrevista. En caso de que no se estableciera contacto en por lo menos cinco intentos,
esa matrícula se asignaba en el sistema como
caída
y se procedía a reemplazarla.
4
Como
la lista es aleatoria, la primera matrícula después de los
n
i
señalados es el primer
candidato para sustituir al elemento que no se pudo contactar, y así sucesivamente. Esto
asegura que los reemplazos mantengan la aleatoriedad.
d)
Como se señala en el esquema básico de la
ANUIES
, en algunas ocasiones no se tendrán
todas las encuestas que requiere la muestra. Se sugiere que para las subpoblaciones en
las que la cuota se encuentre por debajo de
n
, se haga una prueba de sesgo por no
respuesta para algunas variables de interés. Lo anterior tiene por objetivo la búsqueda de
una posible diferencia entre el grupo de egresados que contesta la encuesta (de tamaño
n
–
k
) y los que no la contestan (de tamaño
k
). Se asume que, si algunos egresados no
contestan la encuesta después de cinco intentos, puede deberse a razones que no afectan
las variables de interés, y debe encontrarse alguna explicación estadística de ello. El
problema con esta técnica reside en que se debe estimar un número
m
=
k
(
n
/
N
). Este
número representa a los egresados que no contestaron la encuesta y a quienes hay que
contactar para aplicársela. La dificultad radica en que si
k
es muy grande (lo que sucede en
CBI
por ejemplo)
m
será también considerable como para conseguir ese número de
encuestas cuando la base casi se ha agotado en sus posibilidades de aplicación de
encuestas. Una vez obtenidos los estimadores de
m
, se realiza una prueba
Ji-cuadrada
(χ
2
) para verificar si la no respuesta afecta o no las variables de interés.
4
El término
caídas
designa los casos en que por algún motivo no fue factible realizar la entrevista; se incluye a los egresados a quienes se
intentó contactar en más de seis ocasiones sin éxito o cuyos datos de contacto disponibles resultaron equivocados.
Efectivas
se refiere a las
entrevistas realizadas y
visitas
incluye a quienes no se ha podido contactar pero existe la posibilidad de hacerlo o bien a quienes están por
confirmar la entrevista.