ESTUDIO DE SEGUIMIENTO DE EGRESADOS GENERACIONES 2005 Y 2008
24
2.6. Depuración de la base de datos
En esta etapa, se parte de la consideración de que, si no se someten los datos a chequeos
para detectar las inconsistencias en las fuentes originales, los errores de éstas se propagarán
a las fases posteriores, lo que afectará el análisis estadístico y las conclusiones a las que se
llegue.
Los expertos afirman que en cada base de datos capturada se obtiene cerca de 30% de error,
por lo que es necesario realizar diferentes técnicas para la depuración de los resultados que
hayan arrojado los instrumentos utilizados.
El error se define como la inexactitud entre el valor de una medida y el valor real del objeto
medido. Esa inexactitud se puede dar por diversos motivos y se puede ver desde dos ángulos
distintos:
–
Error sistemático
: se asocia al instrumento o método utilizado en la recolección de la
información y se puede atribuir a factores como la interpretación de resultados del
cuestionario o los criterios de puntuación.
–
Error aleatorio
: se asocia a variables de difícil o imposible control del investigador, y su
existencia se deduce de las “pequeñas” discrepancias en la medición que aportan los
reactivos de medida análogos en el mismo momento.
Para la depuración y limpieza de la base de datos, se realizaron validaciones e invalidaciones
–se hizo una observación especial de los datos provenientes de los cuestionarios aplicados
por correo electrónico– a partir de los siguientes criterios:
7
–
Detección de posibles cuestionarios duplicados;
–
Previsión de los valores desconocidos, cuando el egresado contestó dos o más
opciones de una misma variable;
–
Definición del número de preguntas contestadas para hacer válido el cuestionario;
–
Asignación de algún valor a las variables no contestadas;
–
Acuerdo sobre qué se hará con las preguntas ligadas no respondidas;
–
Comprobación y comparación de las respuestas desfasadas con respecto al
instrumento original;
–
Asignación de rangos a las preguntas que lo requieran, y
–
Aplicación de una prueba estadística de confiabilidad.
Para mejorar la calidad de datos y confirmar que la información tenga el menor número de
inconsistencias se utilizó la técnica de
comparación visual
, la cual consiste en cotejar
visualmente los datos capturados con los registrados en los cuestionarios originales. La
mayor ventaja de esta técnica es que permite verificar la calidad de las dos fuentes, es decir,
de los datos capturados en el formulario directamente por los egresados y los capturados por
las operadoras en la plataforma con que se respaldó la información.
7
Los especialistas son partidarios de utilizar estas técnicas, ya que argumentan que la no imputación de los valores desconocidos afecta
notablemente la calidad de la investigación, el nivel de validez tanto interna como externa, ya que implica la eliminación de una parte de la
muestra y los riesgos que se derivan, lo que provoca variaciones importantes en los niveles de significación e inestabilidad en los resultados;
este factor atenta gravemente sobre el grado de representatividad de la muestra.