Aprendizaje automático para la genética
HogarHogar > Noticias > Aprendizaje automático para la genética

Aprendizaje automático para la genética

Jan 16, 2024

Medicina de la naturaleza (2023)Citar este artículo

125 altmétrico

Detalles de métricas

El cáncer de origen primario desconocido (CUP) es un tipo de cáncer que no se puede rastrear hasta su sitio primario y representa del 3 al 5% de todos los cánceres. Faltan terapias dirigidas establecidas para CUP, lo que conduce a resultados generalmente deficientes. Desarrollamos OncoNPC, un clasificador de aprendizaje automático capacitado con datos de secuenciación de próxima generación (NGS) específicos de 36.445 tumores en 22 tipos de cáncer de tres instituciones. El clasificador primario de tipos de cáncer (OncoNPC) basado en NGS de oncología logró una puntuación F1 ponderada de 0,942 para predicciones de alta confianza (\(\ge 0,9\)) en muestras de tumores retenidas, que representaron el 65,2 % de todas las muestras retenidas. muestras. Cuando se aplicó a 971 tumores CUP recolectados en el Instituto del Cáncer Dana-Farber, OncoNPC predijo los tipos de cáncer primario con alta confianza en el 41,2% de los tumores. OncoNPC también identificó subgrupos de CUP con un riesgo de línea germinal poligénica significativamente mayor para los tipos de cáncer previstos y con resultados de supervivencia significativamente diferentes. En particular, los pacientes con CUP que recibieron tratamientos de primera intención paliativa concordantes con sus cánceres predichos por OncoNPC tuvieron resultados significativamente mejores (cociente de riesgo (HR) = 0,348; intervalo de confianza (IC) del 95 % = 0,210–0,570; P = \(2,32\times {10}^{-5}\)). Además, OncoNPC permitió un aumento de 2,2 veces en el número de pacientes con CUP que podrían haber recibido terapias guiadas genómicamente. Por lo tanto, OncoNPC proporciona evidencia de distintos subgrupos de CUP y ofrece el potencial de apoyo a las decisiones clínicas para el tratamiento de pacientes con CUP.

Esta es una vista previa del contenido de la suscripción, acceda a través de su institución

Acceda a Nature y a otras 54 revistas de Nature Portfolio

Obtenga Nature+, nuestra suscripción de acceso en línea con la mejor relación calidad-precio

$29.99 / 30 días

cancelar en cualquier momento

Suscríbete a esta revista

Reciba 12 números impresos y acceso en línea

$189.00 por año

sólo $15.75 por número

Alquila o compra este artículo

Los precios varían según el tipo de artículo.

desde $ 1,95

a$39.95

Los precios pueden estar sujetos a impuestos locales que se calculan durante el pago.

Los datos de secuenciación del panel de tumores NGS multicéntrico están disponibles previa solicitud en el sitio web del Proyecto GENIE de la AACR: https://www.aacr.org/professionals/research/aacr-project-genie/. El modelo OncoNPC completamente entrenado, los datos de variantes somáticas procesadas de Profile DFCI y los datos clínicos no identificados utilizados en el análisis de concordancia del tratamiento están disponibles en https://github.com/itmoon7/onconpc.

Utilizamos los lenguajes de programación R (v4.0.2) y Python (v3.9.13) para el procesamiento de características de OncoNPC (R deconstructSigs v1.8.0), el desarrollo e interpretación del modelo de OncoNPC (Python xgboost v1.2.0, shap v0.41.0) y el análisis de supervivencia. (R survival v3.2.7, stats v4.0.2, Python lifelines v0.27.4, scipy v1.7.1). Consulte https://github.com/itmoon7/onconpc para obtener el script de preprocesamiento, el modelo OncoNPC completamente entrenado, una demostración en un cuaderno sobre cómo usar OncoNPC y otros materiales de referencia.

Pavlidis, N., Khaled, H. y Gaafar, R. Una mini revisión sobre el cáncer de sitio primario desconocido: un rompecabezas clínico para los oncólogos. J. Adv. Res. 6, 375–382 (2015).

Artículo PubMed Google Scholar

Varadhachary, GR & Raber, MN Cáncer de sitio primario desconocido. N. inglés. J. Med. 371, 757–765 (2014).

Artículo CAS PubMed Google Scholar

Hyman, DM y cols. Vemurafenib en múltiples cánceres no melanoma con mutaciones BRAF V600. N. inglés. J. Med. 373, 726–736 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Hainsworth, JD & Greco, FA Cáncer de sitio primario desconocido: nuevos paradigmas de tratamiento en la era de la medicina de precisión. Soy. Soc. Clínico. Oncol. Educativo. Libro 38, 20-25 (2018).

Artículo PubMed Google Scholar

Anderson, GG & Weiss, LM Determinación del tejido de origen de los cánceres metastásicos: metanálisis y revisión de la literatura sobre el rendimiento de la inmunohistoquímica. Aplica. Inmunohistoquímica. Mol. Morfol. 18, 3–8 (2010).

Artículo CAS PubMed Google Scholar

Oien, K. y Dennis, J. Evaluación diagnóstica del carcinoma de origen primario desconocido: de la inmunohistoquímica al perfil molecular. Ana. Oncol. 23, 271–277 (2012).

Artículo de Google Scholar

Moran, S. y col. Perfiles epigenéticos para clasificar el cáncer de origen primario desconocido: un análisis retrospectivo multicéntrico. Lanceta Oncol. 17, 1386-1395 (2016).

Artículo PubMed Google Scholar

Jiao, W. y col. Un sistema de aprendizaje profundo clasifica con precisión los cánceres primarios y metastásicos utilizando patrones de mutación pasajera. Nat. Comunitario. 11, 728 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Penson, A. et al. Desarrollo de predicción del tipo de tumor derivado del genoma para informar la atención clínica del cáncer. JAMA Oncol. 6, 84–91 (2020).

Artículo PubMed Google Scholar

Él, B. et al. Un marco de red neuronal para predecir el tejido de origen de 15 tipos de cáncer comunes basado en datos de RNA-seq. Frente. Bioeng. Biotecnología. 8, 737 (2020).

Artículo PubMed PubMed Central Google Scholar

Nguyen, L., Van Hoeck, A. y Cuppen, E. Clasificación de tejido de origen basada en aprendizaje automático para cáncer de diagnóstico primario desconocido utilizando características de mutación de todo el genoma. Nat. Comunitario. 13, 4013 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Posner, A. y col. Una comparación de la secuenciación del ADN y los perfiles de expresión genética para ayudar al diagnóstico del tejido de origen en el cáncer de origen primario desconocido. J. Pathol. 259, 81–92 (2023).

Artículo CAS PubMed Google Scholar

Zhao, Y. et al. CUP-AI-Dx: una herramienta para inferir el origen del tejido canceroso y el subtipo molecular utilizando datos de expresión genética de ARN e inteligencia artificial. EBioMedicina 61, 103030 (2020).

Artículo PubMed PubMed Central Google Scholar

Consorcio, APG et al. Proyecto AACR GENIE: impulsando la medicina de precisión a través de un consorcio internacional. Descubrimiento del cáncer. 7, 818–831 (2017).

Artículo de Google Scholar

Hainsworth, JD y cols. Perfiles de expresión de genes moleculares para predecir el tejido de origen y terapia directa de sitio específico en pacientes con carcinoma de sitio primario desconocido: un ensayo prospectivo del Instituto de Investigación Sarah Cannon. J.Clin. Oncol. 31, 217–223 (2013).

Artículo CAS PubMed Google Scholar

Yoon, H. y col. El perfil de expresión génica identifica pacientes receptivos con cáncer de origen primario desconocido tratados con carboplatino, paclitaxel y everolimus: NCCTG N0871 (alianza). Ana. Oncol. 27, 339–344 (2016).

Artículo CAS PubMed Google Scholar

Hayashi, H. y col. Terapia dirigida y específica de sitio basada en perfiles moleculares mediante secuenciación de próxima generación para el cáncer de sitio primario desconocido: un ensayo clínico de fase 2 no aleatorizado. JAMA Oncol. 6, 1931-1938 (2020).

Artículo PubMed Google Scholar

Hayashi, H. y col. Ensayo aleatorizado de fase II que compara el tratamiento específico del sitio basado en perfiles de expresión génica con carboplatino y paclitaxel para pacientes con cáncer de sitio primario desconocido. J.Clin. Oncol. 37, 570–579 (2019).

Artículo CAS PubMed Google Scholar

Conway, A.-M., Mitchell, C. & Cook, N. Desafío de lo desconocido: ¿cómo podemos mejorar los resultados clínicos en el cáncer de origen primario desconocido? J.Clin. Oncol. 37, 2089-2090 (2019).

Artículo CAS PubMed Google Scholar

Chen, T. y Guestrin, C. XGBoost: un sistema de impulso de árboles escalable. En actas de la 22ª Conferencia internacional ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos (KDD '16). 785–794 (Asociación de Maquinaria de Computación, 2016).

Bochtler, T. & Krämer, A. ¿Existe realmente el cáncer de origen primario desconocido (CUP) como una entidad cancerosa distinta? Frente. Oncol. 9, 402 (2019).

Artículo PubMed PubMed Central Google Scholar

Lundberg, SM et al. De explicaciones locales a comprensión global con IA explicable para árboles. Nat. Mach. Intel. 2, 56–67 (2020).

Artículo PubMed PubMed Central Google Scholar

Tate, JG y cols. Cósmico: el catálogo de mutaciones somáticas en el cáncer. Ácidos nucleicos res. 47, D941–D947 (2019).

Artículo CAS PubMed Google Scholar

da Cunha Santos, G., Shepherd, FA y Tsao, MS Mutaciones EGFR y cáncer de pulmón. Año. Rev. Pathol. 6, 49–69 (2011).

Artículo PubMed Google Scholar

Zhang, Y.-L. et al. La prevalencia de la mutación EGFR en pacientes con cáncer de pulmón de células no pequeñas: una revisión sistemática y un metanálisis. Oncotarget 7, 78985 (2016).

Artículo PubMed PubMed Central Google Scholar

Hecht, SS Carcinógenos del humo de tabaco y cáncer de pulmón. J. Instituto Nacional del Cáncer. 91, 1194-1210 (1999).

Artículo CAS PubMed Google Scholar

Dirican, E., Akkiprik, M. & Özer, A. Distribuciones de mutaciones y correlaciones clínicas de las mutaciones del gen PIK3CA en el cáncer de mama. Biol tumoral. 37, 7033–7045 (2016).

Artículo CAS Google Scholar

Elsheikh, S. y col. Amplificación de CCND1 y expresión de ciclina D1 en cáncer de mama y su relación con subgrupos proteómicos y resultado del paciente. Res. del cáncer de mama. Tratar. 109, 325–335 (2008).

Artículo CAS PubMed Google Scholar

Kim, J. y col. Pronóstico desfavorable asociado a la mutación del gen K-ras en los márgenes quirúrgicos del cáncer de páncreas. Tripa 55, 1598-1605 (2006).

Artículo CAS PubMed PubMed Central Google Scholar

Luo, mutación J. KRAS en el cáncer de páncreas. Semín. Oncol. 48, 10-18 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Conway, AM y cols. Caracterización molecular y biomarcadores líquidos en carcinoma de primario desconocido (CUP): quitando la 'U' de 'CUP'. Hno. J. Cáncer 120, 141-153 (2019).

Artículo CAS PubMed Google Scholar

Liu, R. y col. Análisis sistemático pan-cáncer de las interacciones mutación-tratamiento utilizando grandes datos clínicogenómicos del mundo real. Nat. Medicina. 28, 1656–1661 (2022).

Artículo CAS PubMed Google Scholar

Liu, R. y col. Evaluación de criterios de elegibilidad de ensayos oncológicos utilizando datos del mundo real e inteligencia artificial. Naturaleza 592, 629–633 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Grambsch, PM & Therneau, TM Pruebas y diagnósticos de riesgos proporcionales basados ​​en residuos ponderados. Biometrika 81, 515–526 (1994).

Artículo de Google Scholar

Chakravarty, D. y col. OncoKB: una base de conocimientos sobre oncología de precisión. JCO Precis. Oncol. 1, PO.17.00011 (2017).

PubMed Central Google Académico

Moiso, E. et al. Deconvolución del desarrollo para la clasificación del origen del cáncer. Descubrimiento del cáncer. 12, 2566–2585 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Lu, MI y col. La patología basada en IA predice los orígenes de cánceres de origen primario desconocido. Naturaleza 594, 106-110 (2021).

Artículo CAS PubMed Google Scholar

Fizazi, K. et al. Cánceres de sitio primario desconocido: guías de práctica clínica de la ESMO para diagnóstico, tratamiento y seguimiento. Ana. Oncol. 26, v133–v138 (2015).

Artículo PubMed Google Scholar

Mileshkin, L. y col. Cáncer de origen primario desconocido: un estudio SEER-Medicare de patrones de atención y resultados entre pacientes de edad avanzada en la práctica clínica. Cánceres 14, 2905 (2022).

Artículo PubMed PubMed Central Google Scholar

Moon, I., Groha, S. y Gusev, A. SurvLatent ODE: un modelo de tiempo hasta el evento basado en EDO neuronal con riesgos competitivos para datos longitudinales mejora la predicción del tromboembolismo venoso (TEV) asociado al cáncer. En actas de la séptima conferencia sobre aprendizaje automático para la atención sanitaria. 800–827 (PMLR, 2022).

Kehl, KL y cols. Procesamiento del lenguaje natural para determinar los resultados del cáncer a partir de notas de oncólogos médicos. Clínica JCO. Informe sobre el cáncer. 4, 680–690 (2020).

Artículo PubMed Google Scholar

García, EP et al. Validación de oncopanel: un ensayo de secuenciación dirigido de próxima generación para la detección de variantes somáticas en el cáncer. Arco. Patol. Laboratorio. Medicina. 141, 751–758 (2017).

Artículo CAS PubMed Google Scholar

Cheng, DT y cols. Perfil de mutación integrado de Memorial Sloan Kettering de objetivos de cáncer procesables (MSK-IMPACT): un ensayo clínico de secuenciación de próxima generación basado en captura de hibridación para oncología molecular de tumores sólidos. J. Mol. Diagnóstico. 17, 251–264 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Chen, Y. et al. Clasificación de electrocardiogramas (ECG) cortos de una sola derivación para la detección de fibrilación auricular mediante spline lineal por partes y XGBoost. Fisiol. Medidas. 39, 104006 (2018).

Artículo PubMed Google Scholar

Hatton, CM y cols. Predecir síntomas depresivos persistentes en adultos mayores: un enfoque de aprendizaje automático para la atención de salud mental personalizada. J. Afecto. Desorden. 246, 857–860 (2019).

Artículo PubMed Google Scholar

Ogunleye, A. y Wang, Q.-G. Modelo XGBoost para el diagnóstico de enfermedad renal crónica. Trans. IEEE/ACM. Computadora. Biol. Bioinformar. 17, 2131-2140 (2019).

Artículo de Google Scholar

Bergstra, J. & Bengio, Y. Búsqueda aleatoria para optimización de hiperparámetros. J. Mach. Aprender. Res. 13, 281–305 (2012).

Google Académico

Alexandrov, LB y cols. El repertorio de firmas mutacionales en el cáncer humano. Naturaleza 578, 94-101 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Rosenthal, R., McGranahan, N., Herrero, J., Taylor, BS y Swanton, C. DeconstructSigs: delinear procesos mutacionales en tumores individuales distingue las deficiencias en la reparación del ADN y los patrones de evolución del carcinoma. Genoma Biol. 17, 31 (2016).

Artículo PubMed PubMed Central Google Scholar

Janzing, D., Minorics, L. y Blöbaum, P. Cuantificación de la relevancia de las características en una IA explicable: un problema causal. En Actas de la Conferencia Internacional sobre Inteligencia Artificial y Estadísticas 2907–2916 (PMLR, 2020).

Gusev, A., Groha, S., Taraszka, K., Semenov, YR y Zaitlen, N. Construcción de cohortes de investigación de línea germinal a partir de lecturas descartadas de secuencias de tumores clínicos. Genoma Med. 13, 179 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Cox, DR Modelos de regresión y tablas de vida. Estadística JR. Soc. Ser. Método B. 34, 187-202 (1972).

Google Académico

Xie, J. & Liu, C. Estimador de Kaplan-Meier ajustado y prueba de rango logarítmico con probabilidad inversa de ponderación del tratamiento para datos de supervivencia. Estadística. Medicina. 24, 3089–3110 (2005).

Artículo PubMed Google Scholar

Marschner, I. glm2: Ajuste de modelos lineales generalizados con problemas de convergencia. El diario R 3, 12-15 (2011).

Artículo de Google Scholar

Descargar referencias

La participación de los pacientes y el esfuerzo de un sistema institucional de recolección de datos hicieron posible este estudio y agradecemos sus aportes. También nos gustaría expresar nuestro agradecimiento al Sistema de recuperación de datos de oncología del DFCI (OncDRS) y al equipo del Proyecto GENIE de AACR por su papel en la agregación, gestión y entrega de los datos utilizados en este proyecto.

IM y AG contaron con el apoyo de R01 CA227237, R01 CA244569 y subvenciones de The Louis B. Mayer Foundation, The Doris Duke Charitable Foundation, The Phi Beta Psi Sorority y The Emerson Collective. Los financiadores no tuvieron ningún papel en el diseño del estudio, la recopilación y análisis de datos, la decisión de publicar o la preparación del manuscrito.

Departamento de Ingeniería Eléctrica y Ciencias de la Computación, Instituto de Tecnología de Massachusetts, Cambridge, MA, EE. UU.

Intae Luna

División de Ciencias de la Población, Instituto del Cáncer Dana-Farber y Facultad de Medicina de Harvard, Boston, MA, EE. UU.

Intae Moon, Kenneth L. Kehl, Michael J. Hassett, David Liu y Alexander Gusev

Departamento de Oncología Médica, Instituto del Cáncer Dana-Farber, Boston, MA, EE. UU.

Jaclyn LoPiccolo, Sylvan C. Baca y David Liu

Centro de Epigenética Funcional del Cáncer, Instituto del Cáncer Dana-Farber, Boston, MA, EE. UU.

Sylvan C. Baca

Departamento de Patología, Hospital Brigham and Women's, Facultad de Medicina de Harvard, Boston, MA, EE. UU.

Lynette M. Sholl

The Broad Institute del MIT y Harvard, Cambridge, MA, EE. UU.

David Liu y Alexander Gusev

Memorial Sloan Kettering Cancer Center, Nueva York, NY, EE. UU.

Deborah Schrag

División de Genética, Hospital Brigham and Women's y Facultad de Medicina de Harvard, Boston, MA, EE. UU.

Alejandro Gusev

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

IM y AG concibieron y diseñaron el estudio. IM seleccionó los datos, desarrolló y evaluó el modelo y realizó análisis. JL y LS realizaron revisiones de historias clínicas. IM escribió el primer manuscrito. IM, JL y GS revisaron el manuscrito. Todos los autores participaron en la interpretación de los hallazgos y la revisión del manuscrito.

Correspondencia a Alexander Gusev.

Los autores declaran no tener conflictos de intereses.

Nature Medicine agradece a Lincoln Stein, Linda Mileshkin y E. Cuppen por su contribución a la revisión por pares de este trabajo. Editor primario: Lorenzo Righetto, en colaboración con el equipo de Nature Medicine.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Matrices de confusión en el conjunto de pruebas retenidas (n = 7289) para (a) 22 tipos de cáncer detallados y (b) 13 grupos de cáncer (consulte la Tabla 1). (c), (d) Rendimiento de OncoNPC en precisión y recuperación en el conjunto de pruebas en (c) tipos de cáncer y (d) grupos de cáncer en 4 confianzas de predicción diferentes utilizando \({p}_{\max }\) como umbral . El tamaño de cada punto se escala según la proporción de muestras de tumor retenidas. En (d), solo consideramos grupos de cáncer que tienen más de un tipo de cáncer. Las puntuaciones generales de F1 se ponderaron según la cantidad de casos confirmados en todos los tipos y grupos de cáncer, respectivamente.

(a), rendimiento de OncoNPC específico del centro (en F1) en las muestras de tumor CKP de prueba (n = 7289). La figura es un desglose de la Fig. 2c según el centro oncológico (DFCI: ⊙, MSK: ⊡, VICC: ◇). El rendimiento se evaluó con 4 confianzas de predicción diferentes (es decir, umbrales \({p}_{\max }\) mínimos). El tamaño de cada punto se escala según la proporción de muestras de tumor retenidas. Consulte la Tabla complementaria 3 para conocer el número específico del centro de muestras de tumores CKP de prueba desglosadas por tipos de cáncer y umbrales de confianza de predicción. (b), (c) Diagramas de caja de confianza de predicción (\({p}_{\max }\)) en (b) tumores DFCI CUP, tumores MSK CUP, todos los tumores DFCI CKP (incluidos aquellos con tipos de cáncer no modelados en OncoNPC), DFCI retuvo tumores CKP y DFCI excluyó tumores CKP (específicamente aquellos con tipos de cáncer no modelados en OncoNPC), y (c) DFCI retuvo tumores CKP, MSK retuvo tumores CKP y VICC retuvo- detectar tumores CKP. Tenga en cuenta que los tumores CKP excluidos por el DFCI se refieren a la cohorte de tumores CKP raros cuyos tipos de cáncer no se consideraron durante el desarrollo de OncoNPC. OncoNPC no vio todas las cohortes en el análisis de (b) y (c) durante el entrenamiento del modelo.

La figura muestra el desglose del desempeño de OncoNPC en la puntuación F1 por 22 tipos de cáncer en una confianza de predicción cada vez mayor. Los tipos de cáncer en el eje y se clasifican en orden decreciente según el número de muestras de tumores. Para investigar el impacto de las características genómicas de entrada en la solidez de OncoNPC, realizamos un estudio de ablación de características, donde elegimos los genes más importantes en función de sus valores SHAP agregados y los reducimos gradualmente de las 846 características asociadas con esos genes, así como edad y sexo, solo al 10% superior (es decir, las 29 características principales). En cada configuración de características, volvimos a entrenar el modelo con el mismo conjunto de hiperparámetros y evaluamos su desempeño en las muestras de tumores CKP retenidas (n = 7289), que se utilizaron a lo largo de este trabajo. Los datos complementarios 4 proporcionan una lista de características de entrada que corresponden a los genes seleccionados en cada configuración.

El paciente es un varón de 76 años con biopsia de tumor de hígado. El gráfico circular de la izquierda muestra las 10 características más importantes en tres categorías de características diferentes (es decir, eventos CNA, mutación somática y firmas de mutación), y el gráfico de dispersión de la derecha muestra sus valores SHAP y valores de características. El tamaño de cada punto se escala según el valor SHAP absoluto correspondiente. De la revisión de la historia clínica, encontramos que el paciente reportó un historial de tabaquismo de 60 paquetes al año, además de haber vivido cerca de una fábrica de alquitrán y productos químicos cuando era niño. A pesar del diagnóstico de CUP, OncoNPC clasificó con confianza el sitio primario como NSCLC con una probabilidad posterior de 0,98. SBS4, una firma de mutación asociada al tabaquismo, se enriqueció significativamente en la muestra de tumor del paciente, lo que tiene, con diferencia, el mayor impacto en la predicción, seguida de la firma de mutación SBS24 asociada con exposiciones conocidas a aflatoxinas y la mutación KRAS.

(a), adenocarcinoma colorrectal (COADREAD), (b) glioma difuso (DIFG), (c) carcinoma de mama invasivo (BRCA), (d) melanoma (MEL), (e) cáncer de pulmón de células no pequeñas (NSCLC), (f) tumor epitelial de ovario (OVT), (g) adenocarcinoma de próstata (PRAD) y (h) carcinoma de células renales (CCR). La magnitud del enriquecimiento se cuantifica mediante \(\hat{\varDelta }_{\mathrm{PRS}}\): la diferencia media entre la PRS de tipo de cáncer concordante (es decir, la coincidencia de OncoNPC) y la media de las PRS de tipos de cáncer discordantes (ver Métodos). \(\hat{\varDelta }_{\mathrm{PRS}}\) se muestra para los CKP en azul (como referencia) y los CUP en verde.

Los cuadros de la izquierda muestran el número de pacientes restantes en la cohorte y los análisis relevantes, mientras que los cuadros de la derecha ilustran los criterios de exclusión y el número de pacientes que fueron eliminados en consecuencia.

a, BRCA, (b) grupo gastrointestinal (GI) (CHOL, COADREAD, EGC y PAAD), (c) pulmón (NSCLC y PLMESO) y (d) otros tipos de cáncer OncoNPC (BLCA, DIFG, GINET, HNSCC, MEL, OVT, PANET, PRAD, RCC y UCEC). En cada figura, el grupo de tratamiento concordante y el grupo de tratamiento discordante se muestran en azul y rojo, respectivamente. Para estimar cada curva de supervivencia, utilizamos el estimador Kaplan-Meier de probabilidad inversa de tratamiento ponderado (IPTW) mientras ajustamos las covariables del paciente y el truncamiento izquierdo hasta el momento de la secuenciación (ver Métodos). La significación estadística de la diferencia de supervivencia entre los dos grupos se estimó mediante una prueba de rangos logarítmicos ponderados.

De manera similar, utilizamos el estimador Kaplan-Meier de probabilidad inversa de tratamiento ponderado (IPTW) para cada curva de supervivencia mientras ajustamos las covariables del paciente y el truncamiento izquierdo hasta el momento de la secuenciación (ver Métodos). La significación estadística de la diferencia de supervivencia entre los dos grupos se estimó mediante una prueba de rangos logarítmicos ponderados. Consulte la Tabla complementaria 2 para obtener información demográfica sobre la cohorte.

(a), el número de tumores CUP con objetivos procesables, según OncoKB (métodos), en variantes somáticas procesables (mutaciones, amplificaciones y fusiones). Cada barra corresponde al número total de tumores CUP asociados con cada objetivo procesable. Las barras están codificadas por colores según los tipos de cáncer previstos. Tenga en cuenta que cada tumor puede contener más de una variante somática procesable. (b), Proporciones de muestras de tumores CUP con variantes somáticas procesables (\({N}_{{action}}\)) con respecto al número total de pacientes (\({N}_{{total}}\)) en OncoNPC predijo tipos de cáncer. En cada barra se muestran proporciones para cuatro niveles terapéuticos diferentes basados ​​en OncoKB: nivel 1: medicamentos aprobados por la FDA, nivel 2: medicamentos estándar de atención, nivel 3: medicamentos respaldados por evidencia clínica y nivel 4: medicamentos respaldados por evidencia biológica.

Notas complementarias 1 a 13, figuras complementarias. 1 a 10 y tablas complementarias 1 a 3.

La entrada de OncoNPC presenta genes dirigidos a diferentes versiones del panel.

Un conjunto completo de funciones utilizadas en OncoNPC.

Valores SHAP agregados para funciones de OncoNPC.

Funciones utilizadas en diferentes entornos del estudio de ablación.

Información del paciente en la cohorte de análisis de concordancia del tratamiento.

Springer Nature o su licenciante (por ejemplo, una sociedad u otro socio) posee los derechos exclusivos de este artículo en virtud de un acuerdo de publicación con los autores u otros titulares de derechos; El autoarchivo por parte del autor de la versión manuscrita aceptada de este artículo se rige únicamente por los términos de dicho acuerdo de publicación y la ley aplicable.

Reimpresiones y permisos

Moon, I., LoPiccolo, J., Baca, SC et al. Aprendizaje automático para la clasificación basada en genética y la predicción de la respuesta al tratamiento en cáncer de origen primario desconocido. Nat Med (2023). https://doi.org/10.1038/s41591-023-02482-6

Descargar cita

Recibido: 06 de enero de 2023

Aceptado: 30 de junio de 2023

Publicado: 07 de agosto de 2023

DOI: https://doi.org/10.1038/s41591-023-02482-6

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt