Validez de contenido del Practice Environment Scale of th Nursing Work Index (PES-NWI) en el ámbito europeo
- Loreto Maciá Soler Directora
- Teresa Moreno Casbas Codirector/a
- Allison Squires Codirector/a
Universidad de defensa: Universitat d'Alacant / Universidad de Alicante
Fecha de defensa: 29 de junio de 2011
- Josep Bernabeu Mestre Presidente
- María Eugenia Galiana Sánchez Secretaria
- Azucena Pedraz Marcos Vocal
- Margalida Miró Bonet Vocal
- María Isabel Mariscal Crespo Vocal
Tipo: Tesis
Resumen
Los estudios de investigación internacionales requieren la adaptación transcultural de los instrumentos de medida utilizados en los diferentes países implicados. La adaptación transcultural de un cuestionario para su uso en un nuevo país o contexto, requiere de métodos rigurosos para alcanzar la validez o equivalencia (lingüística y cultural) entre el original y las versiones del cuestionario donde se va a utilizar. Dentro de este proceso, se ha de obtener la validez de contenido, es decir, conseguir que los ítems del cuestionario representen una adecuada definición operacional del constructo del instrumento de medida en la nueva cultura. El índice de validez de contenido (CVI) es un indicador basado en la valoración realizada por evaluadores expertos acerca de la pertinencia de los ítems del instrumento, mide su calidad global (S-CVI) y por ítem (I-CVI), que unido al cálculo del coeficiente kappa modificado (K), que establece la validez de cada uno de los ítems del cuestionario ajustando la concordancia debida al azar, permitiría evaluar cuantitativamente esta propiedad psicométrica. El Practice Environment Scale-Nursing Work Index (PES-NWI) es una escala de 31 ítems, que mide el entorno de la práctica de enfermería. Fue desarrollado por Lake, en 2002, a partir de dos instrumentos previos: el NWI, elaborado por Kramer & Hafner en 1989 y el NWI-R, de por Aiken y cols. Publicado en el año 2000. Esta herramienta parece ser uno de los mejores instrumentos para medir el entorno de la práctica de enfermería debido a su idoneidad, su estructura, y su capacidad de discriminar hospitales con las características esenciales de los 'Hospitales Magnéticos'y además ha podido relacionar, con estudios transversales, los resultados de salud del paciente con la práctica de enfermería. La tesis doctoral que se presenta a continuación está enmarcada en dos proyectos de investigación: el proyecto internacional, Nurse Forecasting: Human Resources Planning in Nursing (RN4CAST) y el subproyecto español denominado 'Relación entre la seguridad del paciente, la provisión y formación de las enfermeras y las características organizacionales, de los hospitales del Sistema Nacional de Salud. RN4CAST-España'. El objetivo general de la investigación llevada a cabo en la tesis fue analizar los resultados de validez de contenido del PES-NWI en 11 países (España, Bélgica, Grecia, Alemania, Finlandia, Irlanda, Países Bajos, Polonia, Suecia, Suiza y Reino Unido) y en 10 idiomas oficiales con las modificaciones de los dialectos regionales (español, griego, finlandés, holandés, polaco, sueco, italiano, alemán, inglés y francés) a través del indicador Content Validity Indexing (CVI). Se ha realizado un estudio observacional transversal de ámbito europeo. Para el presente estudio se utilizó el PES-NWI original con algunas modificaciones del mismo dirigidas por los creadores del NWI-R y del PES-NWI. Consta de 32 ítems y se estructura en cinco subescalas: (1) participación de las enfermeras en asuntos del hospital (ocho ítems); (2) Fundamentos de enfermería para la calidad del cuidado (nueve ítems); (3) aptitud, liderazgo y apoyo de la supervisora (cuatro ítems); (4) dotación de personal y recursos (cuatro ítems); y (5) relaciones entre enfermeras y médicos (siete ítems). En primer lugar se procedió a la obtención de las 14 versiones del cuestionario a partir del instrumento en inglés americano, a través de un proceso de traducción y retro-traducción siguiendo la metodología establecida por los expertos en el área. Posteriormente, tras la selección de expertos de cada país participante se obtuvieron las valoraciones de cada uno de los 32 ítems. Se elaboró un cuestionario donde se exponían los ítems y los evaluadores expertos debían valorar su relevancia con una escala tipo Likert de 1 a 4 donde 1 se correspondió con: 'totalmente en desacuerdo'2: 'de alguna manera en desacuerdo'3: 'de alguna manera de acuerdo; y 4: 'totalmente de acuerdo'El cuestionario fue auto-administrado por vía internet o documento Word. Una vez obtenidas las valoraciones se calcularon los indicadores del CVI: número de acuerdos, los I-CVI (validez aceptable ¿0,78), S-CVI (validez aceptable >0,80), K (valoración: pobre<0,60; buena=0,60-0,74; excelente >0,74; según Polit et al. 2007), de los 32 ítems y agrupados por las sub-escalas que componen el PES-NWI de las 14 versiones del instrumento, se tomó como versión de referencia la escala de USA. Se consideraron ítems potencialmente problemáticos (IPP), aquellos que obtuvieron un coeficiente kappa menor 0,60. Se realizó un análisis descriptivo e inferencial en función de la naturaleza de las variables y las condiciones de aplicación de los test estadísticos; se utilizaron las pruebas paramétricas t de Student y ANOVA para comparar medias con las variables cualitativas, o sus correspondientes pruebas no paramétricas, U de Mann-Whitney y Kruskal-Wallis; y el test de Chi-Cuadrado para la comparación de las variables cualitativas. El nivel de significación estadística se estableció en p<0.05. Se utilizó el programa Excel 2007 para recoger todas las valoraciones de los expertos y posteriormente realizar los cálculos de los indicadores del CVI de cada una de las versiones lingüísticas. Para el análisis descriptivo e inferencial se utilizó el paquete estadístico SPSS para Windows, Versión 17.0. Se respetaron todos los principios éticos de la investigación científica biomédica. También se solicitó el consentimiento a todos los participantes del estudio. Así mismo, todos los proyectos fueron aprobados por los distintos comités de ética e investigación de las instituciones de donde procedían los Investigadores principales de cada país participante. Formaron parte del panel de expertos para la evaluación de la validez de contenido de las distintas versiones del PES-NWI, un total de 122. La media de expertos fue de 8,71 (Min.=5; Max=11). La valoración global de las 14 versiones (S-CVI) osciló entre 0,60 y 0,98. Once de las catorce versiones alcanzaron la puntuación mínima de validez de contenido, de ellas cinco: Alemania, Países Bajos, Suecia, Suiza (italiano y alemán) presentaron una puntuación del S-CVI > 0,90, por tanto alcanzaron una validez elevada. Las versiones de Suiza (francés) y Bélgica (francés) rozaron la validez de contenido con una puntuación del S-CVI 0,77 y 0,76 respectivamente y una valoración según el K de buena. Polonia no alcanza la validez de contenido mínima con un S-CVI de 0,60 y una valoración K pobre. Las puntuaciones de la validez global de las distintas versiones lingüísticas de un mismo país presentaron diferencias estadísticamente significativas. Tal fue el caso de la versión de Bélgica en francés y en holandés (S-CVI=0,77 y 0,85 respectivamente; p=0,003) y la versiones de Suiza en italiano, alemán y en francés (S-CVI= 0,98, 0,94 y 0,76 respectivamente; p<0,001). Las diferencias obtenidas en las distintas versiones de un mismo país, parecen indicar la importancia del proceso de adaptación de un instrumento, y la necesidad de validarlo en el contexto donde vaya a ser utilizado. Las puntuaciones globales de las escalas en las versiones lingüísticas en inglés, en francés y en holandés no difieren. En las versiones en alemán de Alemania y Suiza, sí se encontraron diferencias en el S-CVI, donde el número de expertos difería considerablemente entre Alemania y Suiza; la primera tuvo 5 y la segunda 9, por tanto pudo haber un sesgo relacionado con esta variable. En cuanto a los resultados de la validez de los 32 ítems de las 14 versiones, más del 86% de las puntuaciones del kappa modificado alcanzaron la valoración de buena/excelente, y sólo 61 ítems obtuvieron una valoración 'pobre'La versión de Polonia presentó un 62% de IPP. Una de las posibles explicaciones a esta última cuestión es, que Polonia estableció la titulación de Enfermería recientemente, en el año 2004, quedando por tanto el nivel académico y de profesionalización de los enfermeros polacos sin equipararse todavía al contexto del resto de la UE ni al de EEUU. Si no consideramos los resultados de las valoraciones de Polonia, la muestra de expertos de todas las versiones establece con unanimidad la relevancia de 10 de los 32 ítems, la mayoría de ellos pertenecen principalmente a la subescala 'Fundamentos de enfermería para la calidad del cuidado' Existieron discrepancias entre la puntuación mínima deseable dada por el I-CVI y el K. La media del coeficiente kappa modificado para los ítems con valoración excelente estuvo por encima de 0,78. Sin embargo los de valoración buena, obtuvieron una media de 0,71. El número de expertos ha influido en los resultados de la validez de contenido de los ítems siendo mayor en las valoraciones excelentes y buenas y sin diferencias estadísticamente significativas en las valoraciones pobres. Por tanto los resultados del estudio corroboran la influencia del número de expertos y el coeficiente kappa establecido por otros autores (Beckstead, 2009; Polit et al., 2007; Squires, 2009b). Por otra parte, para explorar con mayor profundidad estas discrepancias (entre la puntuación del I-CVI y K), se podría analizar si estos ítems se comportan de diferente forma que el resto en función de las respuestas dadas por los enfermeros de cada país, y analizar si la valoración global del instrumento o subescalas, mejora con la modificación o eliminación de los mismos. Existieron diferencias estadísticamente significativas entre las puntuaciones globales de las 5 subescalas (Chi-cuadrado=25,26; gl: 8; p=0,001), siendo las subescalas 1 'Participación de las enfermeras en asuntos del hospital'y la 5 'Relaciones entre enfermeras y médicos'las que presentan en un mayor porcentaje de ítems de IPP. La primera de ellas puede estar fuertemente ligada a los modelos de gestión clínica de cada país. En términos globales, la validez de contenido del Practice Environment Scale of the Nursing Work Index ha resultado adecuada en las 13 de las 14 versiones de los países de ámbito europeo del estudio. Si bien, en estudios internacionales se hace necesario el uso de herramientas homogéneas, los resultados de este estudio indican la necesidad de poder mejorar el instrumento en determinadas versiones sin perder la posibilidad de su uso transcultural. Es decir conseguir una mejor adaptación transcultural, manteniendo la validez de constructo