INVESTIGACIÓN CLÍNICA

 

Determinación del grado de agresividad tumoral mediante técnicas de inteligencia artificial aplicadas a imágenes de resonancia magnética

 

Facundo Segura, Pablo Segura, Florencio Segura

Centro Privado Ortopedia y Traumatología Segura, 2.a Cátedra de Ortopedia y Traumatología, Hospital Tránsito Cáceres de Allende, Universidad Nacional de Córdoba, Córdoba, Argentina

 

RESUMEN

Objetivo: Determinar el grado de agresividad tumoral mediante técnicas de inteligencia artificial utilizando imágenes de resonancia magnética de sarcomas con grado histológico comprobado. Materiales y Métodos: Dos cohortes retrospectivas independientes de pacientes con sarcomas de partes blandas. Para cada paciente de las dos cohortes se adquirieron tres tipos de secuencias de imágenes como indican los protocolos clínicos: potenciadas en T1, en T2 con supresión grasa (T2FS) y STIR. A fin de desarrollar el modelo de inteligencia artificial, se utilizaron 134 imágenes, tanto las de alto grado como las de bajo grado, en T1 y T2 tomando la imagen más representativa del tumor en cualquier corte. Esto se traduce en 36 millones de píxeles que serán analizados por el programa Landing AI. Resultados: La precisión promedio del modelo fue del 84,3% y la sensibilidad, del 73,3%, con un umbral de confianza de 0,66, lo que demuestra inicialmente que se obtuvo un modelo de buena calidad para predecir con imágenes de resonancia magnética el grado de agresividad de un sarcoma de partes blandas antes de la biopsia. Conclusiones: Se presenta un enfoque novedoso para abordar un tipo de enfermedad infrecuente usando técnicas de inteligencia artificial para determinar el grado tumoral en imágenes de resonancia magnética. Según los resultados de nuestro modelo, se lo puede considerar como una segunda opinión experta al realizar los estudios por imágenes antes de la biopsia.

Palabras clave: Sarcoma de partes blandas; grado histológico; inteligencia artificial; aprendizaje automático; visión artificial.

Nivel de Evidencia: III

 

Measuring Tumor Aggressiveness Through Artificial Intelligence

 

ABSTRACT

Objective: To determine the degree of tumor aggressiveness by means of artificial intelligence techniques using magnetic resonance images of sarcomas with proven histological grade. Materials and Methods: Two independent cohorts of patients with soft tissue sarcomas (STS) were retrospectively collected. For each patient in the two cohorts, three types of imaging sequences were acquired as indicated by the clinical protocols: T1-weighted (T1), fat-suppressed T2-weighted (FST2) and STIR. For the development of the artificial intelligence model, 134 images were used, both high-grade and low-grade T1 and T2 images, taking the most representative image of the tumor at any slice. This translated into more than 36 million pixels that were analyzed by the Landing AI program. Results: To determine the degree of tumor aggressiveness by means of artificial intelligence techniques using magnetic resonance The model’s average accuracy was 84.3%, and its sensitivity was 73.3%, with a confidence threshold of 0.66, indicating that a good quality model was generated for predicting the grade of aggressiveness of an STS prior to biopsy using MRI scans. Conclusions: A novel approach is presented to address a rare pathology using artificial intelligence techniques to determine the tumor grade based on nuclear magnetic resonance images. Based on the results of our model, it can be considered as a second expert opinion when performing imaging studies prior to biopsy.

Keywords: Soft tissue sarcoma; artificial intelligence; histological grade; deep learning; automated machine learning; machine vision.

Level of Evidence: III

 

INTRODUCCIÓN

Hace 60 años, John McCarthy definió originalmente a la inteligencia artificial (IA) como “la ciencia y la ingeniería para fabricar máquinas inteligentes”, y predijo que estas máquinas, algún día, serían capaces de hacer hazañas que anteriormente se pensaba que eran de exclusivo dominio de la inteligencia humana, como resolución avanzada de problemas.1 Jerrold S. Maxmen, profesor de psiquiatría en la Universidad de Columbia, predijo que la IA traería consigo la “era posmédica” para el siglo XXI, y describió el cambio como “posible, inevitable y deseable”.2

La visión artificial (computer vision) es una función de la IA mediante la cual se pueden aplicar técnicas de aprendizaje automático y redes neuronales complejas para permitir que las computadoras capturen, analicen e interpreten información de imágenes clínicas, utilizando algoritmos que se entrenan para hacer clasificaciones y predicciones basadas en patrones que nos brindan los datos.3 En el campo de la Ortopedia y Traumatología, el uso de estas técnicas se está expandiendo rápidamente. La visión artificial ha progresado, de manera notable, en el análisis de imágenes médicas en una variedad de modalidades que se usan comúnmente en ortopedia, incluidas radiografías, tomografía computarizada y resonancia magnética (RM). Para ello es de gran ayuda el aprendizaje automático automatizado (AutoML). En este caso, nos referimos al proceso de automatizar una acción aplicando el aprendizaje automático común para resolver problemas reales.4 El alto grado de automatización en el AutoML permite que aquellos que no son expertos en IA puedan hacer uso de modelos de aprendizaje automático sin que sea necesario contar con una avanzada experiencia en dicho campo.5

Los sarcomas de partes blandas (SPB) representan una enfermedad rara y heterogénea que comprende el 1% de todos los tumores malignos en adultos. En 2019, se diagnosticó SPB a unas 13.500 personas en los Estados Unidos.6 Abarcan, al menos, 100 subtipos histológicos y moleculares diferentes, y cada subtipo muestra un comportamiento clínico variable.7 Los casos infrecuentes, junto con la heterogeneidad de la enfermedad y su tratamiento complejo resaltan la importancia del manejo interdisciplinario de estas lesiones que involucra a equipos especializados en diagnóstico por imágenes, anatomía patológica, radioterapia, oncólogos y cirujanos ortopedistas con experiencia en el manejo de SPB.

Ante un paciente con SPB, la toma de decisiones en cuanto al tratamiento óptimo del tumor depende, en gran medida, del tamaño y la ubicación del SPB, y del resultado del estudio de anatomía patológica que evalúa la agresividad del tumor.

En la actualidad, el sistema que utilizamos para clasificar el grado histológico del SPB es el propuesto por la French Fédération Nationale des Centres de Lutte Contre le Cancer (FNCLCC) de Francia. El sistema de la FNCLCC evalúa únicamente tres parámetros: la diferenciación tumoral, el índice mitótico y la cantidad de necrosis tumoral (Tabla 1).8

El grado del tumor constituye el factor más importante para adoptar la mejor decisión terapéutica. La biopsia de la lesión es fundamental para determinar el grado y establecer el diagnóstico de certeza. Mediante el análisis de imágenes de RM y utilizando las técnicas de IA basadas en el aprendizaje profundo, es posible plantear una forma alternativa de determinar el grado de agresividad de los SPB.

El objetivo de este estudio fue clasificar, de forma no invasiva, los SPB en: de bajo grado (G1) y alto grado (G2/ G3) utilizando imágenes de RM de sarcomas con grado histológico comprobado mediante el AutoML.

 

MATERIALES Y MÉTODOS

Se formaron dos cohortes retrospectivas independientes de pacientes. Los criterios de inclusión fueron: SPB con grado histológico comprobado con información disponible de la clasificación de tumores de la FNCLCC. Los criterios de exclusión fueron: artefactos de RM, radioterapia previa, sarcoma óseo primario o sarcoma de Ewing.

La primera cohorte estaba formada por el conjunto de datos del The Cancer Image Archive (TCIA) que se encuentra disponible públicamente. Este conjunto de datos contiene imágenes de tomografías computarizada/por emisión de positrones con fluor-18-fluorodesoxiglucosa y RM (potenciada en T1, potenciada en T2 con supresión grasa [T2FS]) de 51 pacientes con sarcomas de tejido blando histológicamente comprobados en las extremidades. Todos se habían sometido a exploraciones por tomografía computarizada/por emisión de positrones con fluor-18-fluorodesoxiglucosa y RM antes del tratamiento, entre noviembre de 2004 y noviembre de 2011. Además, posee los datos demográficos de todos los pacientes analizados.

La segunda cohorte incluyó imágenes de la base de datos del Centro Privado de Ortopedia y Traumatología Segura. En este caso, se tomaron las imágenes de 22 pacientes con SPB con grado histológico comprobado, operados entre 2020 y 2022.

 

 

 

En cada paciente de las dos cohortes, se adquirieron tres tipos de secuencias de imágenes utilizadas como indican los protocolos clínicos: potenciada en T1, potenciada en T2FS y STIR que permite suprimir la señal de determinados elementos o tejidos de forma específica (grasa, agua). Las secuencias T1 se adquirieron en el plano axial, mientras que las secuencias T2FS y STIR se tomaron en diferentes orientaciones (axial, sagital y coronal). Además, el grosor del corte fue de 5,5 mm para la secuencia T1 y de 5 mm para la T2FS. La resolución en el plano fue de 0,63 mm2; 0,74 mm2 y 0,86 mm2 para las secuencias T2FS, T1 y STIR, respectivamente.9 De cada estudio de RM completo del paciente, se extrajo la imagen más representativa en T1 y T2, esta fue la imagen donde se observó el mayor diámetro del tumor.

En total, se obtuvieron 37 imágenes de sarcomas de alto grado en la secuencia T1 y 37 imágenes en la secuencia T2. Para los sarcomas de grado intermedio se obtuvieron 15 imágenes en la secuencia T1 y 15 imágenes en la secuencia T2. Las imágenes de sarcomas de bajo grado fueron 20 tanto para la secuencia T1 como para la secuencia T2.

Las lesiones grado 2 son de pronóstico incierto y, por lo tanto, no son útiles para la toma de decisiones.10 Teniendo en cuenta que tanto los sarcomas de alto grado como los de grado intermedio tienen un desarrollo, un pronóstico y un tratamiento prequirúrgico y posquirúrgico similares, a los fines de este proyecto, se unificaron los sarcomas de alto grado y grado intermedio en el mismo conjunto de datos (dataset), dejando por separado a los de bajo grado.11 El análisis de los pacientes evaluados se realizó mediante Google Colab utilizando el lenguaje Python con las librerías de Numpy, Pandas, Matplotlib y Seaborn para graficar los resultados obtenidos. La implementación del modelo predictivo del proyecto se llevó a cabo con la herramienta Landing Lens, plataforma de IA del sitio web Landing.ai. Antes de la etapa de entrenamiento de los datos, se utilizaron técnicas de aumentación y transformación (data augmentation) para aumentar la cantidad de imágenes para analizar. En este caso, se modificó el tamaño de la imagen a una altura de 1000 y un ancho de 1000 píxeles. Como técnica de aumentación, se realizó un flip horizontal y vertical de 0,5 de probabilidad de aplicarlo a cada imagen.

Las lesiones en las imágenes de RM se clasificaron en alto y bajo grado manualmente, delimitando con rojo las lesiones etiquetadas como de alto grado y, en celeste, las de bajo grado.

 

EVALUACIÓN

En el contexto de una clasificación binaria, se describen cuáles son las principales métricas importantes por seguir para evaluar el rendimiento del modelo de aprendizaje automático.12

Matriz de confusión (confussion matrix): se utiliza para tener una visión más completa al evaluar el rendimiento de un modelo. Es una herramienta que permite la visualización del desempeño de un algoritmo, en este caso, el análisis de millones de píxeles que utiliza el modelo para aprender.

Precisión (precision): es la proporción de predicciones correctas con un conjunto de datos de prueba. Es la relación entre el número de predicciones correctas y el número total de ejemplos de entrada. En forma práctica, es el porcentaje de casos positivos detectados.

Sensibilidad (recall): es la proporción de casos positivos que fueron correctamente identificados por el algoritmo. Se representa como la fracción de verdaderos positivos. También se conoce como tasa de verdaderos positivos (true positive rate).

Precisión y sensibilidad por umbral de confianza: el modelo decidirá si la clasificación es de alto grado o bajo grado si el valor devuelto por el modelo supera un umbral de decisión. Si aumentamos este valor, estaremos aumentando la precisión e, inversamente, si lo disminuimos, aumentamos la sensibilidad.

 

RESULTADOS

El primer análisis se realizó sobre la distribución de la población y la enfermedad. El promedio de edad en ambos grupos era de 54.82 años (± 16.98) (rango 16-83). La distribución por sexo de la población era similar (sexo femenino 52,9%, sexo masculino 47,1% [estadística Z: 0,594, p 0,552]).

En la Figura 1, se detallan los casos analizados según el resultado anatomopatológico.

 

 

 

En las Figuras 2 y 3, se observan la distribución del grado de agresividad de cada tipo de tumor, y también la distribución del grado según su ubicación.

 

 

 

 

 

 

 

En un segundo análisis, para desarrollar el modelo de IA, se utilizaron 134 imágenes disponibles en el conjunto de datos, tanto las de alto grado como las de bajo grado, y en secuencias T1 y T2 de acuerdo con el estudio de imágenes realizado, tomando la imagen más representativa del tumor en cualquier corte (Figura 4).

 

 

 

El adecuado y meticuloso etiquetado de las lesiones se realizó “pintando” la lesión por dentro de los bordes, debido a que las redes neuronales hacen el análisis de las imágenes de acuerdo con los píxeles marcados. Por lo tanto, una incorrecta marcación de las lesiones puede alterar los resultados finales.

Del total, 95 se utilizaron como muestras de entrenamiento (70,9%); 26 (19,4%), como imágenes de validación y 13, como imágenes de prueba (9,7%) para ambos grupos de pacientes (Figura 5).

 

 

 

El total de píxeles que serán utilizados por el modelo para las 134 imágenes es de 36 millones. La matriz de confusión permite evaluar inicialmente el rendimiento de nuestro modelo. Los resultados se detallan en la Tabla 2. En los proyectos de segmentación, el objetivo es minimizar el número de falsos positivos y falsos negativos, y maximizar el número de verdaderos positivos y verdaderos negativos.

La precisión promedio del modelo fue del 84,3% y la sensibilidad, del 73,3%, con un umbral de confianza de 0,66, lo que demuestra inicialmente que se obtuvo un modelo de buena calidad para la predicción del grado de agresividad de un SPB antes de la biopsia con imágenes de RM (Figura 6).

 

 

 

 

 

 

 

A                                                                                  B                                                       C

DISCUSIÓN

Debido a la heterogeneidad de esta enfermedad, el grado de agresividad inicial de la biopsia puede estar subestimando el grado de agresividad final identificado en el análisis del anatomopatólogo. Esto puede llevar a la necesidad de buscar herramientas de diagnóstico preoperatorio preciso para clasificar los SPB.13

Los SPB son un tipo infrecuente de cáncer. Por este motivo, su tratamiento requiere de centros interdisciplinarios especializados con profesionales expertos en el tema, ya que un diagnóstico equivocado o una demora pueden traer consecuencias catastróficas para el paciente. En este caso, la ayuda del AutoML puede resultar fundamental cuando se están realizando los estudios por imágenes, pues le permiten al equipo tratante tener una segunda opinión calificada del grado de malignidad tumoral en poco tiempo, antes de la biopsia y del resultado anatomopatológico.

El mejor modelo de AutoML utilizando Landing Lens de Landing AI logró una precisión del 84,3% y una sensibilidad del 73,3%, basándonos en imágenes de RM en cortes axiales sobre el diámetro mayor de la lesión en secuencias T1 y T2.

Los programas de análisis de imágenes (p. ej., Landing Lens de Landing AI; Vertex AI de Google Cloud Platform) permiten a los profesionales que nos estamos iniciando en la ciencia de datos y que todavía tenemos fallas en la implementación de código de programación, una mayor facilidad de uso en la implementación de modelos de aprendizaje automático, además de ahorrarnos tiempo en tareas básicas. En nuestra especialidad, esto resulta algo fundamental.

El estudio tiene sus limitaciones. Se trata de un trabajo retrospectivo de un solo centro, que podría haber llevado a un sesgo de selección. Sin embargo, las características epidemiológicas de la serie son comparables con las de otros artículos publicados.14 Además, al tratarse de una enfermedad infrecuente, el número de imágenes utilizadas por el modelo es todavía bajo. Si bien las técnicas de aumentación pueden ayudar a tener un conjunto de datos más robusto, resultaría fundamental el aporte y la colaboración de centros especializados en el tratamiento de sarcomas a fin de poder aumentar el número de imágenes para el estudio, intentando mejorar los resultados de los modelos (data sharing).

 

CONCLUSIONES

Este estudio presenta un enfoque novedoso para abordar un tipo de enfermedad infrecuente usando técnicas de aprendizaje profundo automatizado con el propósito de determinar el grado tumoral basándose en imágenes de RM. Aunque el verdadero impacto de la IA en la Ortopedia y Traumatología todavía está por demostrarse, existe mucha evidencia que avala el uso de estas tecnologías para generar valor en la atención médica. En la medida en que estas herramientas sean más fáciles de utilizar, habrá más y más modelos de aprendizaje automático construidos e implementados, lo que permitirá nuevas investigaciones y nuevos resultados, con el objetivo de mejorar el diagnóstico temprano de los pacientes con esta enfermedad y otras. Estas tecnologías deben verse como ayuda al profesional, transformándose en una herramienta que puede aumentar las capacidades de un médico en lugar de reemplazar sus responsabilidades. En este caso y con los resultados obtenidos, podríamos considerar a nuestro modelo de IA como una segunda opinión experta en el momento de realizar los estudios de imágenes en pacientes con SPB antes de la biopsia.

 

BIBLIOGRAFÍA

 

1.     McCarthy J, Minsky ML, Rochester N, Shannon CE. A proposal for the Dartmouth Summer Research Project on Artificial Intelligence, August 31, 1955. AI Magazine 2006;27(4):12-4. https://doi.org/10.1609/aimag.v27i4.1904

2.     Maxmen JS. The post-physician era: Medicine in the 21st century. Hoboken, New Jersey: Wiley; 1976, p. 2336-7.

3.     Scarlat A. A machine learning primer for clinicians–part 1. HIStalk. 2018. Disponible en: https://histalk2.com/2018/10/17/a-machine-learningprimer-for-clinicianspart-1/ [Consulta: 5 de agosto, 2019]

4.     Chollet F. Deep learning with Python. Shelter Island, New York: Manning Publications; 2018.

5.     Bini SA. Artificial intelligence, machine learning, deep learning, and cognitive computing: what do these terms mean and how will they impact health care? J Arthroplasty 2018;33(8):2358-61. https://doi.org/10.1016/j.arth.2018.02.067

6.     Siegel RL, Miller KD, Jemal A. Cancer statistics, 2019. CA Cancer J Clin 2019;69(1):7-34. https://doi.org/10.3322/caac.21551

7.     Fletcher CDM, Bridge JA, Hogendoorn P, Mertens F. WHO Classification of Tumors of Soft Tissue and Bone. 4th ed., WHO Press; 2013, vol. 3.

8.     Trojani M, Contesso G, Coindre JM, Rouesse J, Bui NB, de Mascarel A, et al. Soft tissue sarcomas in adults; study of pathological prognostic variables and definition of histopathological grading systems. Int J Cancer 1984;33(1):37-42. https://doi.org/10.1002/ijc.2910330108

9.     Vallières M, Freeman CR, Skamene SR, El Naqa I. A radiomics model from joint FDG-PET and MRI texture features for the prediction of lung metastases in soft-tissue sarcomas of the extremities. Phys Med Biol 2015;60(14):5471-96. https://doi.org/10.1088/0031-9155/60/14/5471

10.  Refai F. The histopathological grading of soft tissue sarcomas: A review. Saudi J Pathol Microbiol 2019;4(8):581-5. https://doi.org/10.21276/sjpm.2019.4.8.2

11.  Deyrup AT, Weiss SW. Grading of soft tissue sarcomas: the challenge of providing precise information in an imprecise world. Histopathology 2006;48(1):42-50. https://doi.org/10.1111/j.1365-2559.2005.02288.x

12.  Amidi A, Amidi S. Hoja de referencia de consejos y trucos sobre Aprendizaje Automático. Métricas de clasificación. 2021. Disponible en: https://stanford.edu/~shervine/l/es/ teaching/cs-229/hoja-referencia-aprendizaje-automaEco-consejos-trucos

13.  Navarro F, Dapper H, Asadpour R, Knebel C, Spraker MB, Schwarze V, et al. Development and external validation of deep-learning-based tumor grading models in soft-tissue sarcoma patients using MR imaging. Cancers (Basel) 2021;13(12):2866. https://doi.org/10.3390/cancers13122866

14.  Coindre JM, Terrier P, Guillou L, Le Doussal V, Collin F, Ranchère D, et al. Predictive value of grade for metastasis development in the main histologic types of adult soft tissue sarcomas: a study of 1240 patients from the French Federation of Cancer Centers Sarcoma Group. Cancer 2001;91(10):1914-26. https://doi.org/10.1002/1097-0142(20010515)91:10<1914::aid-cncr1214>3.0.co;2-3

 

 

ORCID de P. Segura: https://orcid.org/0000-0002-2376-4834

ORCID de F. Segura: https://orcid.org/0009-0004-0424-8334

 

Recibido el 14-3-2023. Aceptado luego de la evaluación el 1-9-2023 Dr. Facundo Segura facusegura@gmail.com https://orcid.org/0009-0000-7101-9145

 

Cómo citar este artículo: Segura F, Segura P, Segura F. Determinación del grado de agresividad tumoral mediante técnicas de inteligencia artificial aplicadas a imágenes de resonancia magnética. Rev Asoc Argent Ortop Traumatol 2023;88(6):653-661. https://doi.org/10.15417/issn.1852-7434.2023.88.6.1738

 

 

Información del artículo

Identificación: https://doi.org/10.15417/issn.1852-7434.2023.88.6.1738

Fecha de publicación: Diciembre, 2023

Conflicto de intereses: Los autores no declaran conflictos de intereses.

Copyright: © 2023, Revista de la Asociación Argentina de Ortopedia y Traumatología.

Licencia: Este artículo está bajo una Licencia Creative Commons Atribución-No Comercial-Compartir Obras Derivadas Igual 4.0 Internacional. (CC-BY-NC-SA 4.0)