Cartas al editor
Análisis de muestras complejas en estudios poblacionales
Analysis of complex survey in population data
Rubén Valle1,a, Elisa Salvador2,a
1 Facultad de Medicina. Universidad Nacional Mayor de San Marcos. Lima, Perú.
2 SANNA. Lima, Perú
a Médico cirujano
Sr. Editor . Hemos leído con mucho interés el artículo de Pajuelo et al. que tuvo como objetivo determinar la prevalencia de sobrepeso, obesidad y desnutrición crónica en niños de 6 a 9 años en el Perú. Para tal fin, los autores realizan un análisis secundario de los datos de la Encuesta Nacional de Hogares (ENAHO) de los años 2009 y 2010. Aunque los encuentros resultan muy interesantes al mostrar que la desnutrición crónica está disminuyendo y que la obesidad está aumentando en la población infantil; hemos notado que el análisis estadístico de los datos no se ha realizado de acuerdo al diseño de muestreo complejo del estudio original (1).
La ENAHO tiene un muestreo multietápico, estratificado e independiente de cada departamento del Perú (2). Por lo que para obtener estimados confiables a nivel poblacional es necesario tomar en cuenta en el análisis el tipo de muestreo complejo. De no ser así, los estimados puntuales e intervalos de confianza no necesariamente van a reflejar los valores a nivel poblacional. En el artículo, los autores describen las características del diseño y muestreo del estudio original. Sin embargo, no precisan si para los cálculos del análisis secundario que llevaron a cabo tomaron en cuenta las características del muestreo complejo, por lo que se entiende que el análisis se realizó como si los datos provinieran de un muestreo aleatorio simple.
El no tomar en cuenta la información del diseño muestral puede inducir a errores en la inferencia estadística y conclusiones del estudio (3). Por ejemplo, Cañizares et al. realizaron un estudio en el que compararon la diferencia entre los estimados al asumir un muestreo aleatorio simple y al tomar en cuenta el diseño de muestreo complejo. Los resultados mostraron que los errores estándar fueron menores al asumir el muestreo aleatorio simple en comparación que cuando se asumió el muestreo complejo. Asimismo, los intervalos de confianza fueron estrechos al asumir el muestreo aleatorio simple (como producto de los errores estándar pequeños) lo cual secundariamente ocasionó que algunas diferencias no significativas se vuelvan significativas. Contrariamente, estas diferencias no se observaron cuando se tomó en cuenta el muestreo complejo en el análisis (4).
Los análisis secundarios de base de datos son una manera metodológicamente válida y costo-efectiva de poder ahondar sobre un tema en específico de un estudio primario realizado a nivel poblacional (5), y tienen la ventajas que los estimados son altamente confiables y representativos a nivel nacional. Actualmente, en el Perú, se vienen realizando estudios poblacionales que usan diseños de muestras complejas con la finalidad de obtener información sobre entidades de interés nacional. Es posible trabajar con los datos de estos trabajos y profundizar en el estudio de un tema en específico a través del análisis secundario de datos. Sin embargo, es importante resaltar que el análisis de estos tipos de estudios requieren necesariamente la consideración del tipo del diseño muestral en el análisis para poder obtener estimados confiables.
Fuentes de financiamiento: autofinanciado.
Conflictos de interés: los autores declaran no tener conflictos de interés.
Referencias Bibliográficas
1. Pajuelo-Ramírez J, Sánchez-Abanto J, Alvarez-Dongo D, Tarqui-Mamani C, Aguero-Zamora R. Sobrepeso, obesidad y desnutrición crónica en niños de 6 a 9 años en Perú 2009-2010. Rev Peru Med Exp Salud Publica. 2013;30(4):583-9.
2. INEI. Encuesta Nacional de Hogares sobre condiciones de vida y pobreza 2010 [Internet]. Lima: INEI; c2013 [citado el 27 de diciembre de 2013]. Disponible en: http://webinei.inei.gob.pe/anda_inei/index.php/catalog/197
3. Wang ST, Yu ML, Lin LY. Consequences of analysing complex survey data using inappropriate analysis and software computing packages. Public Health. 1997;111(4):259-62.
4. Cañizares Pérez M, Barroso Utra I, Alfonso León A, García Roche R, Alfonso Sagué K, Chang de la Rosa M, et al. Estimaciones usadas en diseños muestrales complejos: aplicaciones en la encuesta de salud cubana del año 2001. Rev Panam Salud Publica. 2004;15(3):176-84.
5. Garmon Bibb SC. Issues associated with secondary analysis of population health data. Appl Nurs Res. 2007 May;20(2):94-9.
Correspondencia: Rubén Valle Rivadeneyra
Dirección: Jirón Filadelfia 2365 San Martín de Porres
Teléfono: 985835737
Correo electrónico: ruben_vr12@hotmail.com
Recibido: 29-12-13
Aprobado: 12-02-14