Impacto de ignorar el diseño de muestreo en la predicción de resultados de salud binarios mediante regresión logística: evidencia de la encuesta demográfica y de salud de Malawi en

BMC Public Health volumen 23, número de artículo: 1674 (2023) Citar este artículo

1 altmétrica

Detalles de métricas

Las tasas de natalidad y mortalidad de una población se encuentran entre las estadísticas vitales cruciales para la planificación de políticas socioeconómicas en cualquier país. Dado que la tasa de mortalidad de niños menores de cinco años es uno de los indicadores para monitorear la salud de una población, requiere una estimación periódica y precisa. Los datos de las encuestas nacionales demográficas y de salud, que están fácilmente disponibles para los ciudadanos, se han convertido en un medio para responder a la mayoría de las preguntas relacionadas con la salud entre las poblaciones africanas, utilizando métodos estadísticos pertinentes. Sin embargo, muchas de estas aplicaciones tienden a ignorar el efecto del diseño de la encuesta en las estimaciones, a pesar de la disponibilidad de herramientas estadísticas que respalden los análisis. Poco se sabe sobre la cantidad de información inexacta que se genera al predecir las tasas de mortalidad de niños menores de cinco años. Este estudio estima y compara el sesgo encontrado al aplicar métodos de regresión logística ponderada y no ponderada para predecir la tasa de mortalidad de menores de cinco años en Malawi utilizando datos de encuestas a nivel nacional. Para determinar el sesgo se utilizaron los datos de la encuesta demográfica y de salud de Malawi de 2004, 2010 y 2015-16. Los análisis se realizaron en el software R versión 3.6.3 y Stata versión 12.0. Para estimar la tasa de mortalidad de niños menores de cinco años se utilizó un modelo de regresión logística que incluía diversos factores bio y sociodemográficos relacionados con el niño, la madre y los hogares. Los resultados mostraron que la precisión de predecir la tasa nacional de mortalidad de menores de cinco años depende de la ponderación por grupos de la probabilidad general prevista de muertes infantiles, independientemente de si el modelo fue ponderado o no. La ponderación del modelo provocó pequeños cambios positivos y negativos en varias estimaciones de efectos fijos, lo que difundió el resultado de la ponderación en las probabilidades ajustadas de muertes. A su vez, no hubo diferencias entre la tasa de mortalidad general prevista obtenida utilizando el modelo ponderado y la obtenida con el modelo no ponderado. Recomendamos considerar las ponderaciones de los grupos de encuestas durante el cálculo de la probabilidad general prevista de eventos para un resultado de salud binario. Esto se puede hacer sin preocuparse por los pesos durante el ajuste del modelo, cuyo objetivo es la predicción del parámetro poblacional.

Informes de revisión por pares

La tasa de mortalidad de niños de cero a cincuenta y nueve meses es un indicador útil para monitorear los objetivos de salud nacionales y globales [1, 16, 32]. Por lo tanto, la estimación del número total de muertes observadas en el grupo de menores de cinco años requiere técnicas sólidas y confiables para obtener una aproximación precisa para las decisiones políticas [13, 16]. Se ha informado que existe un registro deficiente de los sistemas vitales y altas tasas de muertes no notificadas en los centros de salud en las naciones del África subsahariana [23, 28, 55]. La mayoría de las estimaciones de la tasa de mortalidad de niños menores de cinco años en la región se basan en información recopilada de encuestas nacionales, como los datos de la encuesta demográfica y de salud (DHS) [21, 22, 42, 46]. Esto es lo que requiere el uso de análisis estadísticos basados en el diseño de encuestas, como ponderaciones muestrales, para obtener estimaciones precisas [5, 19, 20, 40, 44, 53]. El peso de la muestra es la inversa de la probabilidad de que un sujeto sea incluido en la muestra. Esto indica el número de sujetos de la población que representa cada unidad muestreada. Durante el análisis de regresión, el peso del sujeto se introduce como una función de las covariables en el modelo que se aplica a los datos de la encuesta, para compensar el uso de inclusiones de muestra desiguales, la falta de respuesta y la cobertura insuficiente del marco muestral [7, 11 , 36, 42, 50, 57].

Sin embargo, el efecto del diseño de la encuesta se ignora en la mayoría de las aplicaciones de los métodos de regresión utilizados para estimar la tasa de mortalidad de niños menores de cinco años en el África subsahariana, lo que potencialmente sesga las estimaciones y predicciones [18, 41, 43, 52]. Este problema también se encontró en otros estudios que analizaron resultados binarios de salud aparte de la mortalidad. Por ejemplo, la presencia o ausencia de diabetes [48], diarrea [33], esquistosomiasis [14, 31] y malaria [29], entre otras enfermedades en los pacientes. Esta tendencia podría reflejar la falta de disponibilidad de estudios que demuestren el uso técnico de los diseños de encuestas al aplicar métodos de regresión a datos binarios de salud. También podría deberse al hecho de que la mayoría de los estudios revisados tenían como objetivo identificar los factores de riesgo de los resultados de salud en cuestión, en lugar de predecir el alcance de la condición física en sí, que podría lograrse en la población de cualquier manera [9, 17, 54]. Hay escasez de literatura sobre el sesgo que se cometería si se predijera la tasa nacional de mortalidad de menores de cinco años u otros datos de salud de respuesta binaria a partir de una gran encuesta nacional sin tener en cuenta el efecto del diseño. Por lo tanto, este presente estudio estima el sesgo que un investigador podría cometer al predecir la tasa de mortalidad de menores de cinco años utilizando métodos de regresión logística ponderados y no ponderados de encuestas. Un sesgo en la estimación de la tasa de mortalidad de menores de cinco años es la discrepancia entre la tasa estimada mediante muestras aleatorias y la tasa real informada en observaciones de rutina. Se esperaría que la diferencia entre los dos valores fuera cero, en cuyo caso se dice que el estimador aplicado a los datos de la encuesta es insesgado [39]. El presente estudio utiliza tres conjuntos de datos de encuestas demográficas y de salud (DHS) recientes en Malawi para los años 2004, 2010 y 2015-16 y las tasas oficiales de mortalidad de menores de cinco años informadas por las respectivas DHS para calcular el sesgo. Se utilizan varios tamaños de muestra de cada conjunto de datos DHS para tener en cuenta el efecto del tamaño de la muestra en la estimación del sesgo.

Es importante que los investigadores de la salud conozcan el valor de la información del diseño de la encuesta en los métodos de estimación de regresión binaria, para que puedan tomar decisiones informadas. Necesitan determinar las ventajas y desventajas de incluir ponderaciones de encuestas al analizar datos binarios de salud utilizando técnicas de regresión [11]. El conocimiento del sesgo de la estimación de mortalidad de este estudio brindará evidencia para considerar el diseño de encuestas en la investigación de salud que implica la predicción de algunos resultados binarios. El resto del artículo está organizado de la siguiente manera: en la Sección “Métodos” se presentan los métodos estadísticos y los datos utilizados en este estudio; La sección “Resultados” muestra los resultados; mientras que en la Sección “Discusión” se discuten los hallazgos. Finalmente, la sección “Conclusión” es la conclusión del artículo.

Este estudio utilizó datos secundarios de niños obtenidos del archivo de registros infantiles de la Encuesta Demográfica y de Salud de Malawi (MDHS). Estos conjuntos de datos se obtuvieron de las encuestas realizadas entre octubre de 2004 y enero de 2005, luego de junio a noviembre de 2010 y, por último, entre octubre de 2015 y febrero de 2016. El MDHS utiliza un muestreo aleatorio por conglomerados estratificado de dos etapas, donde 522, 849 y 850 En la etapa inicial, se tomaron muestras de conglomerados (es decir, áreas de enumeración) de todo el país, respectivamente. En la segunda etapa, se muestrearon 15.091, 27.345 y 27.516 hogares respectivamente de los conglomerados seleccionados inicialmente, utilizando las estratificaciones rural y urbana [30, 34, 35]. Un área de enumeración (grupo o aldea) es un área geográfica que cubre, por ejemplo, entre 0 y 954 hogares o un promedio de 235 hogares [24]. Cada grupo contiene información sobre su ubicación, estratos (urbanos o rurales), un número estimado de hogares residenciales, así como un mapa que muestra los límites, la ubicación de los edificios y otros puntos de referencia. Los conglomerados determinados durante el censo de población y vivienda de 1998 constituyeron un marco de muestreo para las unidades primarias de muestreo en el MDHS de 2004, y los definidos en el censo nacional de 2008 formaron el marco para los MDHS de 2010 y 2015-16 [30, 34, 35]. Los niños menores de cinco años en los hogares incluidos en la muestra formaron la muestra para este estudio. Se tomaron muestras para el estudio de un total de 10.914, 19.967 y 17.286 niños menores de cinco años en los MDHS de 2004, 2010 y 2015-16, respectivamente. Las madres o cuidadores adultos de edades comprendidas entre 15 y 49 años proporcionaron los antecedentes de nacimiento de los niños, incluidos los datos de mortalidad.

La variable de respuesta para este estudio fue si un niño menor de cinco años de cualquier hogar había muerto o no en los últimos cinco años anteriores a la encuesta. Para calcular la probabilidad de que un niño muera antes de los cinco años, se utilizaron varios factores de riesgo que afectan al niño, la madre y el entorno familiar basándose en la literatura. Estos son: peso al nacer, orden de nacimiento, sexo, si el parto fue único o múltiple, tipo de parto (regular o cesárea), edad materna, educación y ocupación, lugar de residencia, incluyendo región del país, lugar de parto, intervalo entre nacimientos anterior, uso de anticonceptivos y visitas a la clínica prenatal (ANC) durante el embarazo [3, 8, 12, 17, 18, 26, 49]. Sin embargo, a las variables peso al nacer y visitas de atención prenatal les faltaban al menos un tercio de los valores, por lo que no se incluyeron en los modelos ajustados. La gestión de datos y el ajuste del modelo se realizaron en el software STATA versión 12.0, mientras que los cálculos de la tasa de mortalidad nacional prevista para menores de cinco años y los errores estándar se realizaron utilizando el software R versión 3.6.3. Además, en este estudio se utilizaron los datos brutos de las tasas de mortalidad de niños menores de cinco años de 133, 112 y 63 muertes por 1000 nacidos vivos reportadas en los respectivos informes del MDHS [30, 34, 35] para realizar comparaciones con las estimaciones basadas en modelos. . Los usuarios pueden acceder a los datos del MDHS que se utilizaron en este estudio de forma gratuita en www.DHSprogram.com.

Considere una variable de resultado binaria Y, que indica si un niño murió o no al cumplir los 5 años de edad o antes en un hogar durante los últimos cinco años de la encuesta. Sea \(y_{ic}\) el resultado de muerte observado para el i-ésimo niño en el c-ésimo grupo, \(i=1,2,...,n; c = 1,2,..., K\), donde \(y_{ic}=1\) si el niño murió, y \(y_{ic}=0\) si el niño estaba vivo. Además, sea \(\pi _{ic}=P(Y=1)\) la probabilidad de que el i-ésimo niño muera en el hogar del c-ésimo grupo. Entonces, el número total de muertes en el c-ésimo grupo dada la probabilidad de muerte y el tamaño de la muestra, es decir, \(\sum (Y=1|n,\pi _{ic})\) es un \(Binomial(n, \pi _{ic})\) variable aleatoria, con función de masa \(f(y_{ic};n,\pi _{ic}) = \exp \left[ y_{ic}\log (\frac{\ pi _{ic}}{1-\pi _{ic}})+ n\log (1-\pi _{ic})+\log {{n}\atopwithdelims (){y_{ic}}}\ bien]\). Además, sea \(x^{T}_{ick}=(1,x_{ic1},x_{ic2},...,x_{icp})\) un vector de variables explicativas observadas en la i -ésimo niño, que está en el grupo c, donde \(x_{ic0}=1\) y \(k = 1,2,...,p\) es el número de coeficientes de regresión. Por lo tanto, la probabilidad condicional no ponderada de que un niño muera dadas las covariables \(\textbf{x}\), es decir, \(\pi _{ic}(\textbf{x})=P(Y=1|\textbf{x })\), se relaciona con las covariables a través de una función logística, dada por:

donde \(\beta ^{T}=(\beta _0,\beta _1,...,\beta _p)\) es un vector de coeficientes de regresión y \(\textbf{x}=(1,x_{ic1) },x_{ic2},...,x_{icp})^{T}\) es un vector de covariables observado en el i-ésimo hijo del c-ésimo grupo.

De la relación en la Ec. (1), el modelo de regresión logística no ponderada con enlace logit se deriva de la siguiente manera:

Las estimaciones de máxima verosimilitud (ML), \(\hat{\beta }\) para el modelo de la ecuación. (2) se obtienen multiplicando los valores de probabilidades en la función de masa \(f(y_{ic})\) para todos los niños y luego tomando el logaritmo del resultado. A partir de entonces, se derivan las derivadas parciales de la función de probabilidad logarítmica con respecto a \(\beta\) y luego se equiparan a cero, a partir de lo cual se resuelven las estimaciones de ML, \(\hat{\beta }\). Se utilizan técnicas numéricas para procesar las soluciones, porque las ecuaciones para las derivadas de la función de probabilidad logarítmica no están en formas cerradas [6]. La estimación ML \(\hat{\beta }\) para el modelo (2) se interpreta como el cambio en el logaritmo de las probabilidades ajustadas de muerte de un niño como resultado del cambio en el nivel de la covariable X, mientras se controla por las demás variables del modelo. Alternativamente, \(\hat{\beta }\) se puede exponenciar para obtener \(exp(\hat{\beta })\), que se interpreta como la relación de probabilidades ajustadas de muerte de un niño al comparar un nivel de X al otro.

Ahora, la probabilidad general no ponderada prevista de muerte para todos los niños menores de cinco años del país se estimó tomando el promedio de todas las probabilidades ajustadas para el modelo de la ecuación. (2), como sigue:

que es la estimación puntual habitual de la tasa de muertes de menores de cinco años en todos los grupos, donde \(\hat{\pi }_{ic}(\textbf{x})=\frac{exp(\hat{\beta } ^T\textbf{x})}{1+exp(\hat{\beta }^T\textbf{x})}\) es la probabilidad ajustada de muerte del i-ésimo niño en el c-ésimo grupo dado el información de covariables \(\textbf{x}\) para ese niño, y dado el modelo ajustado. A partir de la teoría de probabilidad de la distribución muestral de proporciones muestrales, la varianza no ponderada de \(\hat{\pi }(\textbf{x})\) se estimó mediante:

Las medidas no ponderadas en las Ecs. (3) y (4) se pueden implementar siguiendo el modelo no ponderado de la ecuación. (2) o el modelo ponderado que se presenta en la siguiente sección, porque el cálculo de la mortalidad prevista tendrá que realizarse por separado una vez que se obtengan las probabilidades ajustadas del modelo logit. La raíz cuadrada de la varianza en la ecuación. (4) proporcionó el error estándar de la tasa de mortalidad de menores de cinco años prevista en la ecuación. (3).

Al obtener la estimación nacional de la tasa de mortalidad de menores de cinco años en la ecuación. (3), el sesgo de la estimación se calculó mediante:

donde \(\hat{\pi }(\textbf{x})\) es la tasa de mortalidad prevista obtenida en la ecuación. (3) y \(\pi\) es la tasa bruta de mortalidad de menores de cinco años proporcionada en el informe MDHS en particular. Como se mencionó anteriormente, los modelos y todos los demás cálculos indicados anteriormente se rehicieron utilizando los tres datos recientes del MDHS de 2004, 2010 y 2015-16 para confirmar los hallazgos. Además, la utilidad de las ponderaciones de la encuesta en un método de regresión puede depender del tamaño de la muestra de la encuesta [15]. Por lo tanto, los procesos anteriores se repitieron utilizando el 75%, el 50% y el 25% del tamaño de muestra del MDHS. Este se seleccionó mediante el mismo método de muestreo por conglomerados con la ayuda de la función bsample del software Stata aplicada a la variable de identificación del conglomerado, para tener en cuenta el efecto del tamaño de la muestra en la estimación del sesgo [51]. Los cálculos para estadísticas en las Ecs. (3-5) se implementaron usando la versión 3.6.3 del software R, mientras que el modelo en la ecuación. (2) se ajustó a los datos utilizando el software Stata versión 12.0.

Utilizando la estructura de los datos presentados en la sección “Modelo de regresión logística no ponderada y tasa de mortalidad prevista”, sea \(w_{ic}=\frac{N_c}{n_c}\) la ponderación muestral para el i-ésimo niño del grupo. c, que estaba en un estrato rural o urbano, donde \(N_c\) denota la población de niños menores de cinco años en el grupo c según el censo indirecto, y \(n_c\) el número seleccionado de niños en el grupo c. Según el censo de población y vivienda de 2018, el país tenía 2.552.406 niños menores de cinco años, ubicados en 18.772 áreas (o grupos) de enumeración de igual tamaño [25]. Esto significa que se estimó que la población de niños de cinco años o menos era de alrededor de \(N_c = \frac{2,555,406}{18,772}=135,969\) por grupo en el momento del MDHS 2015-16. Ahora bien, considerando los niños menores de cinco años de la muestra \(n_{c}\) en el grupo c, esto implica que cada niño seleccionado en el MDHS 2015-16 representó información para \(w_{ic}=\frac{135.969}{ n_{c}}\) niños en su área, dependiendo del tamaño de la muestra del grupo. Por otra parte, alrededor de 2008 había 2.370.011 niños menores de cinco años en Malawi, distribuidos en 12.631 áreas (o grupos) de empadronamiento de igual tamaño [24]. Por lo tanto, la población de niños menores de cinco años en el momento de la MDHS de 2004 o 2010 era de aproximadamente \(N_c = \frac{2,370,011}{12,631}=187,634\) por grupo. Por lo tanto, cada niño incluido en la muestra en el MDHS de 2004 o 2010 representó \(w_{ic}=\frac{187.634}{n_{c}}\) niños en su ubicación. Entonces, la probabilidad condicional ponderada de muerte del i-ésimo hijo dadas las covariables x es:

con el resto de las cantidades definidas como en la Ec. (1). Por lo tanto, el modelo logit ponderado equivalente [56] al modelo de la ecuación. (2) viene dado por:

donde \(w_{00}=1\) y el resto de los cálculos dependían del cluster al que pertenecía el niño. El proceso de construcción de la función de probabilidad es similar al que se presenta en la Sección “Modelo de regresión logística no ponderado y tasa de mortalidad prevista” para el modelo no ponderado. Como se indicó anteriormente, esta ponderación de la encuesta aseguró que la contribución de cada niño a la función de probabilidad del modelo tuviera en cuenta la ponderación muestral de ese niño, a fin de equilibrar la selección desigual de la muestra, la falta de respuesta o la cobertura insuficiente del marco muestral entre grupos en el cálculo de las estimaciones de ML [7, 11, 36, 50].

Se utilizó la función de encuesta svy del paquete Stata para implementar el esquema de ponderación durante el ajuste del modelo. Se aplicó la técnica jackknife para calcular los errores estándar de las estimaciones de los coeficientes de regresión para el modelo logit ponderado en la ecuación. (7) [27]. En un caso ideal, se suponía que se asumiría una distribución de probabilidad hipergeométrica para el número observado de muertes de menores de cinco años por grupo en lugar de una distribución de probabilidad binomial, ya que el muestreo de los niños se realizó sin reemplazo y la población se volvió finita a medida que continuaba el muestreo. . Por lo tanto, el error estándar de la variable de respuesta binomial, es decir, \(\sqrt{n\pi _{ic}(\textbf{x})(1-\pi _{ic}(\textbf{x}))}\ ) se suponía multiplicado por el factor de corrección de población finita (FPC), \(FPC=\sqrt{\frac{Nn}{N-1}}\) para hacerlo equivalente al error estándar de la variable aleatoria hipergeométrica. Sin embargo, ignoramos el factor FPC en los cálculos de este estudio, ya que su valor fue aproximadamente 1 para cada encuesta, es decir, \(FPC_{(2015)}=\sqrt{\frac{2,552,406-17,286}{2,552,406-1}} =0.9966\) basado en MDHS 2015-16 y el censo nacional de 2018, mientras que \(FPC_{(2004)}=\sqrt{\frac{2,370,011-10,914}{2,370,011-1}}=0.9976\) basado en MDHS 2004, y \(FPC_{(2010)}=\sqrt{\frac{2,370,011-19,967}{2,370,011-1}}=0.9958\) en el MDHS de 2010 y el censo de 2008.

Ahora, al obtener las estimaciones de ML y las probabilidades ajustadas de muertes del modelo logit no ponderado de la ecuación. (2) o el modelo logit ponderado en la ecuación. (7), es posible que deseemos considerar las ponderaciones a nivel de conglomerado durante el cálculo de la tasa de mortalidad general prevista. Esto requiere obtener tasas de mortalidad no ponderadas específicas del grupo \(\hat{\pi }_{c}(\textbf{x})\) primero mediante el método de la ecuación. (3). A partir de entonces, la tasa de mortalidad nacional ponderada de menores de cinco años se puede estimar considerando la ponderación de cada grupo de la siguiente manera:

donde \(\bar{m}=\frac{\sum _{c=1}^{K}n_{c}}{K}\) es el número promedio de niños muestreados por grupo, \(\hat{\ pi }_{c}=\frac{\sum _{i=1}^{n_{c}}\hat{\pi }_{i}}{n_{c}}\) es la estimación específica del grupo tasa de mortalidad de menores de cinco años, en la que \(\hat{\pi }_{i}\) son probabilidades ajustadas de muerte obtenidas del modelo ajustado, y \(\frac{n_{c}}{\bar{m} }\) es el término de ponderación por grupo. La varianza ponderada de la tasa de mortalidad general se puede calcular utilizando la fórmula básica habitual para la varianza de una cantidad aleatoria, pero ahora con el término de ponderación al cuadrado, de la siguiente manera:

donde \(\hat{\pi }_{c}(\textbf{x})\) es la tasa de mortalidad estimada de menores de cinco años en el grupo c, y \(\hat{\pi }^{*}(\textbf {x})\) la tasa de mortalidad nacional ponderada de menores de cinco años estimada en la ecuación. (8). Después de obtener la estimación de mortalidad general ponderada, el cálculo del sesgo en la estimación de mortalidad se realizó como en la Sección "Modelo de regresión logística no ponderada y tasa de mortalidad prevista" utilizando el software R versión 3.6.3.

Se utilizó el criterio de información de Akaike (AIC) para seleccionar el mejor modelo con el que calcular la tasa de mortalidad nacional prevista para niños menores de cinco años [38]. Esto se aplicó al modelo no ponderado, ya que el software STATA que se utilizó para ajustar los modelos no produce valores AIC para los modelos ponderados. El modelo inicial incluía todas las variables enumeradas en la sección "Datos". El segundo modelo eliminó las variables cuyos coeficientes tenían valores p grandes en el primer modelo.

El resumen de datos en la Tabla 1 muestra que los casos de muertes de niños menores de cinco años han sido inferiores al 10% en Malawi durante los 15 años anteriores a 2016. Además, las proporciones de muertes de niños menores de cinco años mostraron una tendencia a la baja durante este período. , de modo que el porcentaje se redujo casi a la mitad entre 2010 y 2016. Además, los datos mostraron que los porcentajes de muertes de menores de cinco años fueron mayores en bebés varones, orden de nacimiento de 1 o 6 y superior, partos por cesárea, partos gemelares o múltiples, y en los partos a domicilio, en las tres encuestas. De manera similar, la mayoría de las muertes de niños menores de cinco años se observaron en bebés nacidos de madres de menos de 20 años o de 35 años o más, en aquellos cuyo intervalo entre nacimientos anterior fue inferior a 24 meses y en otros que no utilizaban métodos anticonceptivos modernos, los que no tenían ningún título educativo formal y otros que estaban trabajando. Además, el porcentaje de muertes de menores de cinco años fue mayor en niños de zonas rurales y en niños de las regiones central y sur del país del estudio. La prueba de independencia Chi-cuadrado mostró que todas las variables explicativas estudiadas tenían asociación significativa individual con la variable muerte infantil menor de cinco años, evidenciada por al menos dos de los conjuntos de datos del MDHS.

Los resultados del Cuadro 2 proporcionan las estimaciones del modelo al incluir todas las covariables disponibles del Cuadro 1 para describir la muerte de niños menores de cinco años. Se muestra, tanto en los modelos ponderados como no ponderados y en todas las encuestas, que las probabilidades ajustadas de muerte de niños menores de cinco años fueron menores en las niñas, antes del intervalo entre nacimientos de 24 meses o más, y en los niños nacidos de madres que Utilizaron métodos anticonceptivos modernos. Las probabilidades ajustadas de muerte fueron mayores en los partos por cesárea, los partos gemelares o múltiples, los niños nacidos de madres de clase trabajadora, los nacidos de madres de 35 a 49 años, los niños de zonas rurales y los nacidos en las regiones central y sur. Los efectos del orden de nacimiento, el lugar del parto y el lugar de residencia sobre el resultado de la muerte infantil no fueron estadísticamente significativos en un modelo que tenía las otras variables mencionadas anteriormente. Por lo tanto, estas covariables se eliminaron en el modelo final que se utilizó para predecir la tasa de mortalidad de niños menores de cinco años y estimar el sesgo. Los valores de AIC de la Tabla 2 se reservaron para comparaciones con los obtenidos al excluir las variables mencionadas.

Al ajustar los modelos logit reducidos a los conjuntos de datos, en la Tabla 3 se muestra que los valores de AIC no cambiaron mucho en comparación con los encontrados anteriormente. Intentar eliminar cada una de las tres covariables de forma independiente empeoró el ajuste de los modelos, por lo que los resultados de las estimaciones de ML en la Tabla 3 para los modelos sin las tres covariables indicadas se utilizaron para calcular el sesgo en este estudio. Los resultados de la Tabla 3 mostraron que los valores p para los modelos reducidos eran más bajos en comparación con los que figuran en la Tabla 2. Pero los tamaños y direcciones de las estimaciones no cambiaron. Las probabilidades de muerte de niños menores de cinco años fueron significativamente menores en las mujeres en comparación con los niños varones, en los nacidos de madres que tenían un intervalo entre nacimientos anterior de 24 meses o más, en los niños nacidos de madres que utilizaron métodos anticonceptivos modernos y en aquellos cuyas madres tenían el mayor índice de natalidad. el nivel de educación era secundario y superior. Mientras que las probabilidades de muerte infantil fueron mayores en los partos por cesárea, los partos gemelares o múltiples, los niños nacidos de madres entre 35 y 49 años, los nacidos de madres que estaban trabajando y los de las regiones central y sur. Además, tanto las estimaciones de ML como los valores p se ajustaron ligeramente hacia arriba o hacia abajo en los modelos ponderados en comparación con los no ponderados, lo que mostró cierto sesgo en las estimaciones de los modelos no ponderados.

Los resultados del sesgo de la estimación de la tasa de mortalidad de menores de cinco años se muestran en la Tabla 4. Se muestra que el sesgo fue menor en la tasa de mortalidad de menores de cinco años ponderada en comparación con la no ponderada prevista, independientemente de si el modelo ajustado fue ponderado o no. Además, los resultados mostraron que los errores estándar también fueron menores para la tasa de mortalidad prevista ponderada que para la no ponderada, independientemente del estado de ponderación del modelo. Además, se muestra que la estimación del sesgo para la tasa de mortalidad de menores de cinco años disminuyó en cada año de la encuesta, de modo que fue más pequeña en 2015-16 MDHS. Además, los resultados mostraron que las estimaciones de sesgo de la mortalidad ponderada prevista a partir de los datos del MDHS de 2010 aumentaron ligeramente con un tamaño de muestra decreciente, pero este no fue siempre el caso con las encuestas de 2004 y 2015, ya que hubo estimaciones de sesgo más pequeñas incluso con la muestra más pequeña. tamaños para los datos del MDHS en los años indicados. Con la tasa de mortalidad prevista no ponderada, las estimaciones de sesgo no tuvieron en cuenta el tamaño de la muestra en las tres encuestas. Finalmente, los errores estándar de la tasa de mortalidad pronosticada ponderada se mantuvieron iguales al reducir el tamaño de la muestra, pero aumentaron ligeramente en el caso de la mortalidad pronosticada no ponderada.

En este artículo se investigó la utilidad de las ponderaciones de las encuestas en la predicción de la mortalidad de niños menores de cinco años mediante métodos de regresión. Los resultados mostraron que la ponderación del modelo provoca algunos cambios positivos y negativos en las estimaciones de máxima verosimilitud (ML) que se obtuvieron originalmente del modelo no ponderado. Esto confirma la presencia de cierto sesgo en las estimaciones de ML para modelos no ponderados [11, 36]. Sin embargo, el estudio ha descubierto que ignorar las ponderaciones muestrales durante el ajuste del modelo tiene poco impacto en la precisión de la estimación de la tasa de mortalidad general prevista para niños menores de cinco años. Es la ponderación del diseño de la encuesta que se aplica a las estimaciones de mortalidad previstas de cada grupo la que tiene un efecto significativo en el sesgo de la tasa general de mortalidad prevista para niños menores de cinco años. Esto implica que los cambios hacia arriba y hacia abajo en las estimaciones de ML para varias variables explicativas cancelan el efecto de ponderación durante los cálculos de las probabilidades ajustadas de eventos para individuos, que se utilizan al calcular la tasa de mortalidad general prevista. Por lo tanto, la necesidad de ponderaciones adicionales de los estratos del conglomerado en las tasas de mortalidad previstas del conglomerado para lograr una estimación general poco sesgada de la mortalidad prevista para niños menores de cinco años.

Los hallazgos mostraron que los sesgos en la estimación de la mortalidad disminuyeron con cada año de la encuesta, donde el sesgo fue menor cuando se utilizaron los datos del MDHS de 2015-16 para predecir la mortalidad predominante de menores de cinco años en comparación con encuestas anteriores. Esto reflejó mejoras en las medidas de garantía de la calidad de los datos que el programa Measure DHS y la Oficina Nacional de Estadísticas han estado implementando a lo largo de los años. Por ejemplo, los datos del MDHS de 2015-16 se recopilaron utilizando la herramienta de entrevistas personales asistidas por computadora (CAPI), a diferencia del MDHS de 2004, donde los cuestionarios se administraron físicamente y los datos se ingresaron manualmente. Este proceso manual de gestión de datos podría ser la razón por la cual algunas variables, como el peso al nacer, tenían más valores faltantes en la MDHS de 2004 en comparación con los datos de la MDHS de 2015-16. Los datos faltantes tienen el potencial de perturbar la aleatoriedad y la representatividad de la muestra, al tiempo que aumentan el sesgo en las estimaciones de mortalidad general. Además, los datos de coordenadas geográficas de los hogares se registraron previamente antes de la encuesta y se utilizaron para guiar a los encuestadores para que pudieran llegar a los hogares seleccionados correctos y evitar el intercambio no autorizado de entrevistados durante la MDHS 2015-16. Además, los hogares en ubicaciones semiurbanas se reclasificaron en estratos rurales o urbanos correctos durante el MDHS 2015-16, para que los datos de un niño pudieran recopilarse correctamente. A diferencia de encuestas anteriores, estos hogares podían asignarse erróneamente a estratos urbanos. Por lo tanto, estas iniciativas dieron lugar a una alta tasa de respuesta y buena calidad de los datos en la MDHS de 2015-16 en comparación con las MDHS de 2010 y 2004. A su vez, esto condujo a una reducción del sesgo en la tasa de mortalidad prevista para niños menores de cinco años para el MDHS 2015-16, como se observa en el presente estudio [30].

El estudio también ha demostrado que la reducción del tamaño de la muestra del MDHS sólo condujo a un ligero aumento en los errores estándar de las tasas de mortalidad pronosticadas no ponderadas, y no en los tamaños de las estimaciones en sí, ya que se mantuvieron constantes a pesar de la reducción del tamaño de la muestra. . Se ha observado que un tamaño de muestra tan bajo como el 2% de la población de todos los niños del país aún podría producir estimaciones de mortalidad poco sesgadas, siempre que la muestra fuera seleccionada al azar y representativa de la población, y que la tasa global prevista Se ponderó la tasa de mortalidad. Esto era de esperar ya que la medida de la varianza no ponderada para la proporción de la muestra, como la tasa de mortalidad no ponderada, implicaba un tamaño de muestra total en el denominador, lo que infló la varianza en tamaños de muestra más bajos. Pero esto no pudo afectar el valor de la estimación de la mortalidad debido a los efectos de la aleatoriedad y la representatividad de la muestra. Cuando un investigador no tiene acceso a datos primarios de encuestas, pero sí a datos agregados de dos o más encuestas para un país o región para el cual desea hacer predicciones similares, entonces se utilizan métodos de estimación de encuestas agrupadas y ponderadas utilizando modelos jerárquicos de efectos mixtos o metanálisis. podría dar estimaciones confiables siempre que todas las encuestas agrupadas se realizaran dentro del mismo tiempo de inferencia [4, 10].

Las estimaciones de ML del modelo mostraron que el riesgo de mortalidad de menores de cinco años era menor en las niñas que en los niños, en los niños cuyas madres habían tenido un intervalo entre nacimientos anterior de 24 meses o más, en los niños cuyas madres utilizaban métodos anticonceptivos modernos y en aquellos cuyas madres asistían a hasta la educación secundaria y superiores. El riesgo fue mayor en los partos por cesárea, los partos gemelares o múltiples, en los niños cuyas madres tenían entre 35 y 49 años, los niños nacidos de madres de clase trabajadora y los niños que residían en las regiones central y meridional de Malawi. Estos resultados son consistentes con hallazgos anteriores, y también existen claras explicaciones biológicas y sociales en la literatura para estas observaciones [18, 26, 37, 45, 47]. Por ejemplo, las madres bien educadas tienen ventaja en términos de conocimientos y habilidades sobre atención sanitaria, lo que beneficia la salud del bebé en comparación con las madres menos educadas [26]. El alto riesgo de muerte en nacimientos de gemelos refleja en gran medida un mayor riesgo de anoxia intraparto en el segundo gemelo nacido a término, lo que reduce sus posibilidades de supervivencia [47]. En los partos por cesárea, el alto riesgo de muerte se debe a mayores posibilidades de prematuridad iatrogénica o enfermedad respiratoria [45]. Si bien las tasas de mortalidad más bajas en las niñas se atribuyen a su composición genética y biológica, junto con los entornos previos a la concepción, que reducen su riesgo contra la mayoría de las enfermedades en comparación con los bebés varones [37]. Además, el alto riesgo de muerte de niños menores de cinco años de madres de clase trabajadora se atribuye a la lactancia materna inadecuada a la que están sujetos sus bebés [2].

Este artículo investigó el impacto del diseño de muestreo de la encuesta sobre la tasa de mortalidad prevista para niños menores de cinco años utilizando métodos de regresión aplicados a tres datos de encuestas demográficas y de salud recientes en Malawi. Los hallazgos mostraron que los factores de riesgo de mortalidad de menores de cinco años no han cambiado con respecto a los observados en estudios anteriores en la región del África subsahariana y otros países de ingresos bajos y medios (PIMB). El estudio ha encontrado que las ponderaciones de probabilidad del modelo tienen muy poco efecto sobre el sesgo de la tasa de mortalidad prevista, de modo que ignorar la ponderación durante el ajuste del modelo no cambia el valor de mortalidad previsto. Sin embargo, se ha observado que ponderar las tasas de mortalidad previstas para grupos específicos tiene efectos significativos a la hora de minimizar el sesgo de la tasa de mortalidad general prevista para menores de cinco años. El estudio también encontró que las estimaciones de sesgo para las tasas de mortalidad predominantes de menores de cinco años disminuyeron con cada año de encuesta, lo que resultó en estimaciones mucho menos sesgadas observadas en el MDHS 2015-16 que en encuestas anteriores. Además, se ha observado que un tamaño de muestra aleatorio y representativo de al menos el 2% de la población es suficiente para obtener estimaciones de mortalidad de niños menores de cinco años con bajo sesgo, siempre que el cálculo de la estimación de mortalidad general considere las ponderaciones de los conglomerados. Un tamaño de muestra pequeño sólo afecta los errores estándar de una mortalidad estimada, que se vuelven grandes y amplían los intervalos de confianza de las estimaciones.

Por lo tanto, este estudio recomienda aplicar ponderaciones de muestreo por conglomerados en las probabilidades de evento previstas específicas de cada grupo para calcular la probabilidad general prevista del evento, al analizar resultados de salud binarios mediante métodos de regresión, sin tener en cuenta la ponderación del proceso de ajuste del modelo. Aunque este estudio se centró en modelos para variables de respuesta binaria, los hallazgos se aplican a otros modelos para variables categóricas con más de dos niveles. Dado que la confiabilidad de los métodos de regresión depende de la idoneidad de los datos para las covariables incluidas en los modelos, mejoras adicionales en las técnicas de control de calidad de los datos del DHS ayudarán a generar predicciones más precisas de la tasa de mortalidad de niños menores de cinco años a través de los métodos basados en regresión propuestos en este estudio. . Las investigaciones futuras podrían incorporar métodos para abordar los datos faltantes en variables explicativas como el peso al nacer y las visitas de atención prenatal, de modo que los modelos utilicen tantas covariables como sea posible y al mismo tiempo observen el efecto del diseño de muestreo en la predicción de la tasa de mortalidad de niños menores de cinco años.

Los datos del MDHS que se utilizaron en este estudio están disponibles pública y gratuitamente para los usuarios en https://dhsprogram.com/data/new-user-registration.cfm.

Ahmad OB, López AD, Inoue M. La disminución de la mortalidad infantil: una reevaluación. Toro Órgano Mundial de la Salud. 2000;78:1175–91.

CAS PubMed PubMed Central Google Académico

Amir-ud Din R, Zafar S, Muzammil M, Shabbir R, Malik S, Usman M. Exploración de la relación entre la ocupación materna y la mortalidad de niños menores de cinco años: evidencia empírica de 26 países en desarrollo. Eur J Dev Res. 2022;34(5):2373–99.

Artículo de Google Scholar

Argawu AS, Mekebo GG. Factores de riesgo de mortalidad de menores de cinco años en Etiopía utilizando modelos de regresión de datos de recuento, 2021. Ann Med Surg. 2022;82:104764.

Belay DG, Asratie MH, Aragaw FM, Tsega NT, Endalew M, Gashaw M. La práctica de la defecación al aire libre y sus determinantes entre los hogares del África subsahariana: prevalencia agrupada y análisis multinivel de una encuesta demográfica y de salud de 33 países del África subsahariana. Trop Med Salud. 2022;50(1):28.

Artículo PubMed PubMed Central Google Scholar

Brenning A, Gruber S, Hoelzle M. Muestreo y análisis estadístico de mediciones de BTS. Proceso Permafr Periglac. 2005;16(4):383–93.

Artículo de Google Scholar

Carroll RJ, Pederson S. Sobre la robustez del modelo de regresión logística. Método JR Stat Soc Ser B. 1993;55(3):693–706.

Google Académico

Chen C, Wakefield J, Lumely T. El uso de ponderaciones muestrales en modelos jerárquicos bayesianos para la estimación de áreas pequeñas. Spat Epidemiol espacio-temporal. 2014;11:33–43.

Artículo de Google Scholar

Padre AF. Una revisión sistemática y metanálisis del efecto del intervalo corto entre nacimientos sobre la mortalidad infantil en Etiopía. Más uno. 2015;10(5):e0126759.

Artículo PubMed PubMed Central Google Scholar

Fagbamigbe AF, Nnanatu CC. Modelado de la distribución espacial y los factores asociados con la mortalidad de niños menores de cinco años en Nigeria. Spat Demogr. 2022;10(2):255–82.

Artículo de Google Scholar

Fagbamigbe AF, Uthman AO, Ibisomi L. Separación jerárquica de los factores de riesgo contextuales y compositivos de la diarrea entre niños menores de cinco años en países de ingresos bajos y medios. Representante científico 2021;11(1):8564.

Artículo CAS PubMed PubMed Central Google Scholar

Faiella I. El uso de ponderaciones de encuestas en el análisis de regresión. Banco de Italia Temi di Discussione (Documento de trabajo) No. 739, 2010. https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=the+use+of+survey+weights+in+regression+ análisis&btnG=.

Getachew Y, Bekele S. Análisis de supervivencia de la mortalidad de niños menores de cinco años y sus factores de riesgo asociados en Etiopía. J Biosens Bioelectrón. 2016;7(213):2.

Google Académico

Groenewald P, Bradshaw D, Neethling I, Martin LJ, Dempers J, Morden E, et al. La vinculación de datos mortuorios mejora las estadísticas vitales sobre la causa de muerte de niños menores de cinco años en la provincia del Cabo Occidental de Sudáfrica. Trop Med Int Salud. 2016;21(1):114–21.

Artículo PubMed Google Scholar

Guimarães RJ, Freitas CC, Dutra LV, Moura A, Amaral RS, Drummond SC, et al. Análisis y estimación de la prevalencia de esquistosomiasis para el estado de Minas Gerais, Brasil, mediante regresión múltiple con datos espaciales sociales y ambientales. Miembro Inst Oswaldo Cruz. 2006;101:91–6.

Artículo PubMed Google Scholar

Jaki T, Kim M, Lamont A, George M, Chang C, Feaster D, et al. Los efectos del tamaño de la muestra en la estimación de modelos mixtos de regresión. Medidas Educ Psychol. 2019;79(2):358–84.

Artículo PubMed Google Scholar

Joos O, Amouzou A, Silva R, Banda B, Park L, Bryce J, et al. Fortalecimiento de la notificación de eventos vitales basada en la comunidad para el seguimiento en tiempo real de la mortalidad de niños menores de cinco años: lecciones aprendidas de los distritos de Balaka y Salima en Malawi. Más uno. 2016;11(1):e0138406.

Artículo PubMed PubMed Central Google Scholar

Kayode GA, Adekanmbi VT, Uthman OA. Factores de riesgo y un modelo predictivo de la mortalidad de menores de cinco años en Nigeria: evidencia de la encuesta demográfica y de salud de Nigeria. BMC Embarazo Parto. 2012;12(1):1–11.

Artículo de Google Scholar

Kazembe LN, Mpeketula PM. Cuantificar las disparidades espaciales en la mortalidad neonatal mediante un modelo de regresión aditiva estructurada. Más uno. 2010;5(6):e11180.

Artículo PubMed PubMed Central Google Scholar

Kneipp SM, Yarandi HN. Diseños muestrales complejos y cuestiones estadísticas en el análisis secundario. West J Enfermeras Res. 2002;24(5):552–66.

Artículo PubMed Google Scholar

Koch GG, Gillings DB, Stokes ME. Implicaciones bioestadísticas del diseño, muestreo y medición para el análisis de datos de ciencias de la salud. Annu Rev Salud Pública. 1980;1(1):163–225.

Artículo CAS PubMed Google Scholar

Lehtonen R, Pahkinen E. Métodos prácticos para el diseño y análisis de encuestas complejas. wiley; 2004.

Li Z, Hsiao Y, Godwin J, Martin BD, Wakefield J, Clark SJ, et al. Cambios en la distribución espacial de la tasa de mortalidad de niños menores de cinco años: análisis de áreas pequeñas de 122 encuestas DHS en 262 subregiones de 35 países de África. Más uno. 2019;14(1):e0210645.

Artículo CAS PubMed PubMed Central Google Scholar

Maïga A, Jiwani SS, Mutua MK, Porth TA, Taylor CM, Asiki G, et al. Generación de estadísticas a partir de datos de establecimientos de salud: el estado de los sistemas de información sanitaria de rutina en África oriental y meridional. Salud global de BMJ. 2019;4(5):e001849.

Artículo PubMed PubMed Central Google Scholar

Oficina Nacional de Estadística de Malawi (NSO). Censo de población y vivienda de Malawi de 2008: informe principal. Zomba; 2009.

Oficina Nacional de Estadística de Malawi (NSO). Censo de población y vivienda de Malawi: informe principal. Zomba: Autor; 2018. pág. 2019.

Google Académico

Manda S. Intervalos entre nacimientos, lactancia materna y determinantes de la mortalidad infantil en Malawi. Soc Sci Med. 1999;48(3):301–12.

Artículo CAS PubMed Google Scholar

Markatou M, Basu A, Lindsay B. Ecuaciones de estimación de probabilidad ponderada: el caso discreto con aplicaciones a la regresión logística. Inferir el plan de estadísticas J. 1997;57(2):215–32.

Artículo de Google Scholar

Morris SS, Black RE, Tomaskovic L. Predicción de la distribución de muertes de menores de cinco años por causa en países sin sistemas adecuados de registro civil. Int J Epidemiol. 2003;32(6):1041–51.

Artículo PubMed Google Scholar

Mwanga EP, Minja EG, Mrimi E, Jiménez MG, Swai JK, Abbasi S, et al. Detección de parásitos de la malaria en gotas de sangre humana seca mediante espectroscopia de infrarrojo medio y análisis de regresión logística. Malar J. 2019;18(1):1–13.

Artículo de Google Scholar

Oficina Nacional de Estadística (NSO) [Malawi] e ICF. Encuesta demográfica y de salud de Malawi 2015-16: hallazgos clave. Zomba, Malawi y Rockville, Maryland, EE. UU. NSO e ICF: Autor, 2017.

Nsowah-Nuamah N, Mensah G, Aryeetey ME, Wagatsuma Y, Bentil G. Esquistosomiasis urinaria en el sur de Ghana: un enfoque de regresión logística para los datos de un programa de control integrado comunitario. m J Trop Med Hyg. 2001;65(5):484–90.

Ntuli ST, Malangu N, Alberts M. Causas de muerte en niños menores de cinco años en un hospital terciario de la provincia de Limpopo, Sudáfrica. Glob J Ciencias de la Salud. 2013;5(3):95.

Artículo PubMed PubMed Central Google Scholar

Nyambe S, Agestika L, Yamauchi T. Lo mejorado y lo no mejorado: factores que influyen en el saneamiento y la diarrea en un asentamiento periurbano de Lusaka, Zambia. Más uno. 2020;15(5):e0232763.

Artículo CAS PubMed PubMed Central Google Scholar

Oficina Nacional de Estadística (NSO) [Malawi] y ORC Macro. 2004. Zomba, Malawi y Calverton. Maryland, EE. UU. NSO y ORC Macro: Autor, 2005.

Oficina Nacional de Estadística, (NSO) y ICF Macro. Encuesta demográfica y de salud de Malawi, 2010. Zomba, Malawi y Calverton. Maryland, EE. UU. NSO e ICF Macro: Autor, 2011.

Pfeffermann D. El papel de las ponderaciones muestrales al modelar datos de encuestas. Int Stat Rev/Rev Int Stat. 1993;61:317–37.

Pongou R. ¿Por qué la mortalidad infantil es mayor en los niños que en las niñas? Una nueva hipótesis basada en el entorno previo a la concepción y en evidencia de una gran muestra de gemelos. Demografía. 2013;50(2):421–44.

Artículo PubMed Google Scholar

Portet S. Introducción a la selección de modelos utilizando el criterio de información de Akaike. Modelo Infect Dis. 2020;5:111–28.

PubMed PubMed Central Google Académico

Rueca MH. Notas sobre el sesgo en la estimación. Biometrika. 1956;43(3/4):353–60.

Artículo de Google Scholar

Rajaratnam JK, Tran LN, López AD, Murray CJ. Medición de la mortalidad de niños menores de cinco años: validación de nuevos métodos de bajo costo. PLoS Med. 2010;7(4):e1000253.

Artículo PubMed PubMed Central Google Scholar

Renschler JP, Walters KM, Newton PN, Laxminarayan R. Muertes estimadas de menores de cinco años asociadas con antipalúdicos de mala calidad en el África subsahariana. Soy J Trop Med Hyg. 2015;92(Suplemento 6):119.

Artículo PubMed PubMed Central Google Scholar

Rerimoi AJ, Jasseh M, Agbla SC, Reniers G, Roca A, Timæus IM. Mortalidad de menores de cinco años en Gambia: comparación de los resultados de la primera encuesta demográfica y de salud con los de las investigaciones existentes. Más uno. 2019;14(7):e0219919.

Artículo CAS PubMed PubMed Central Google Scholar

Rutkowski L, González E, Joncas M, Von Davier M. Datos de evaluación internacional a gran escala: problemas en el análisis secundario y la presentación de informes. Res. Educativa. 2010;39(2):142–51.

Artículo de Google Scholar

Marinero SR, IR blanco. Revisión de la ponderación de probabilidad inversa para tratar con datos faltantes. Métodos estadísticos Med Res. 2013;22(3):278–95.

Artículo PubMed Google Scholar

Esquilador EL. Cesárea: beneficios y costos médicos. Soc Sci Med. 1993;37(10):1223–31.

Artículo CAS PubMed Google Scholar

Silva R, et al. Estimación de la mortalidad infantil: coherencia de las estimaciones de la tasa de mortalidad de niños menores de cinco años utilizando historias de nacimiento completas e historias de nacimiento resumidas. PLoS Med. 2012;9(8):1–14.

Artículo de Google Scholar

Smith GC, Fleming KM, IR blanco. Orden de nacimiento de gemelos y riesgo de muerte perinatal relacionada con el parto en Inglaterra, Irlanda del Norte y Gales, 1994-2003: estudio de cohorte retrospectivo. BMJ. 2007;334(7593):576.

Artículo PubMed PubMed Central Google Scholar

Talukder A, Hossain M, et al. Prevalencia de diabetes mellitus y sus factores asociados en Bangladesh: aplicación de un modelo de regresión logística de dos niveles. Representante de ciencia ficción 2020;10(1):1–7.

Artículo de Google Scholar

Tuoyire DA, Amo-Adjei J. Intervalo de nacimiento anterior, momento y número de contactos prenatales en África, 2010-2020. Salud Internacional. 2022.

Vandendijck Y, Faes C, Kirby R, Lawson A, Hens N. Inferencia basada en modelos para estimación de áreas pequeñas con ponderaciones muestrales. Estadística de pelea. 2016;18:455–73.

Artículo CAS PubMed PubMed Central Google Scholar

Vergouwe Y, Steyerberg EW, Eijkemans MJ, Habbema JDF. Se requirieron tamaños de muestra sustanciales y efectivos para los estudios de validación externa de modelos de regresión logística predictivos. J Clin Epidemiol. 2005;58(5):475–83.

Artículo PubMed Google Scholar

Wakefield J, Fuglstad GA, Riebler A, Godwin J, Wilson K, Clark SJ. Estimación de la mortalidad de niños menores de cinco años en el espacio y el tiempo en un contexto de mundo en desarrollo. Métodos estadísticos Med Res. 2019;28(9):2614–34.

Artículo PubMed Google Scholar

Winship C, Radbill L. Ponderaciones muestrales y análisis de regresión. Métodos Sociol Res. 1994;23(2):230–57.

Artículo de Google Scholar

Yaya S, Bishwajit G, Okonofua F, Uthman OA. Cinco patrones de mortalidad y factores de riesgo materno asociados en el África subsahariana: un análisis de varios países. Más uno. 2018;13(10):e0205977.

Artículo PubMed PubMed Central Google Scholar

Yaya S, Uthman OA, Okonofua F, Bishwajit G. ¿Descomponer la brecha rural-urbana en los factores de mortalidad de menores de cinco años en el África subsahariana? Evidencia de 35 países. BMC Salud pública. 2019;19(1):1–10.

Artículo CAS Google Scholar

Zeng G. Sobre la existencia de estimaciones de máxima verosimilitud para la regresión logística ponderada. Métodos de teoría de estadísticas comunitarias. 2017;46(22):11194–203.

Artículo de Google Scholar

Zieschang KD. Métodos de ponderación de la muestra y estimación de totales en la encuesta de gasto de los consumidores. Asociación de Estadísticas de J Am. 1990;85(412):986–1001.

Artículo de Google Scholar

Descargar referencias

Estamos sinceramente agradecidos a la Oficina Nacional de Estadística de Malawi y al programa Measure DHS por los datos que utilizamos en este estudio. También agradecemos a la Dra. Margaret Wazakili por brindarnos el servicio de edición de idiomas en este artículo.

Los autores no recibieron ninguna financiación para declarar este estudio.

Departamento de Ciencias Matemáticas, Facultad de Ciencias Naturales y Aplicadas, Universidad de Malawi, Zomba, Malawi

Finalizar M. Kaombe

Oficina Nacional de Estadística de Malawi, Zomba, Malawi

Gracioso A. Hamuza

También puedes buscar este autor en PubMed Google Scholar.

TK concibió las ideas iniciales de investigación para este estudio y proporcionó sugerencias para métodos estadísticos y análisis de datos. También redactó el manuscrito. GH ayudó con la gestión de datos y el análisis de datos descriptivos. Ambos autores leyeron y aprobaron el manuscrito final.

Correspondencia a Tsirizani M. Kaombe.

El estudio utilizó datos secundarios recopilados por la Oficina Nacional de Estadística (NSO) de Malawi en asociación con el programa Measure DHS. Los propietarios de los datos han informado que siguieron los procedimientos éticos necesarios para recopilar los datos; estos detalles se proporcionan en los informes respectivos de la Encuesta Demográfica y de Salud de Malawi (MDHS) de 2004, 2010 y 2015-16 [30, 34, 35]. Los datos se utilizaron tras la aprobación en línea del programa Measure DHS, al que se accede a través de https://dhsprogram.com/data/new-user-registration.cfm. Todos los métodos se llevaron a cabo de acuerdo con las directrices y regulaciones pertinentes.

No aplica.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/. La exención de dedicación de dominio público de Creative Commons (http://creativecommons.org/publicdomain/zero/1.0/) se aplica a los datos disponibles en este artículo, a menos que se indique lo contrario en una línea de crédito a los datos.

Reimpresiones y permisos

Kaombe, TM, Hamuza, GA Impacto de ignorar el diseño de muestreo en la predicción de resultados de salud binarios mediante regresión logística: evidencia de datos de mortalidad de menores de cinco años de la encuesta demográfica y de salud de Malawi; 2000-2016. BMC Salud Pública 23, 1674 (2023). https://doi.org/10.1186/s12889-023-16544-4

Descargar cita

Recibido: 07 de febrero de 2023

Aceptado: 16 de agosto de 2023

Publicado: 31 de agosto de 2023

DOI: https://doi.org/10.1186/s12889-023-16544-4

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt