1. Metodología
1.1. Entorno de trabajo
El desarrollo del sistema automatizado para la caracterización morfológica de la mashua se llevará a cabo en servidores de la Universidad Nacional Toribio Rodríguez de Mendoza de Amazonas (UNTRM). Se emplearán equipos de cómputo de alto rendimiento, así como servidores locales y servicios en la nube, según sea necesario para las etapas de procesamiento y entrenamiento de los modelos de inteligencia artificial. La programación se realizará principalmente en Python, utilizando librerías especializadas en visión computacional y aprendizaje profundo.
1.2. Población y Muestra
La población de estudio estará conformada por 159 imágenes digitales de tubérculos de mashua (Tropaeolum tuberosum), obtenidas previamente bajo condiciones controladas de iluminación y fondo. Las imágenes presentan fondo blanco o azul, algunas contienen escala de referencia visible, cortes transversales para observar la pulpa y un identificador alfanumérico único.
Debido a que se analizará la totalidad de las imágenes disponibles (n = 159), el presente estudio emplea un enfoque de muestreo censal, sin aplicar métodos probabilísticos ni seleccionar subconjuntos representativos. Cada imagen constituye una unidad de análisis individual para efectos de segmentación, clasificación y caracterización morfológica automatizada.
1.3. Variables de estudio
Se trabajará con dos tipos principales de variables: morfológicas y de desempeño del modelo de inteligencia artificial.
1.3.1. Variables morfológicas (según descriptores específicos de mashua)
Las características morfológicas de los tubérculos serán evaluadas tomando como referencia una serie de descriptores visuales previamente establecidos. Estas variables se extraerán tanto de forma manual como automática a partir del análisis de las imágenes digitales. Los descriptores seleccionados para la caracterización fueron adaptados de las propuestas realizadas por Mirano Papel, (2018) y Pacheco Arenas, (2015).
- Tamaño del tubérculo (pequeño, mediano, grande)
- Forma del tubérculo (cónico, cónico alargado, cónico acortado, elipsoidal, cilíndrico)
- Color de piel (primario y secundario)
- Color de pulpa (predominante y secundario)
- Número de ojos (escasa, media, alta)
1.3.2. Variables de desempeño de los modelos de inteligencia artificial
Para evaluar la eficacia del sistema propuesto y seleccionar el modelo con mejor rendimiento, se considerarán tanto métricas cuantitativas como criterios cualitativos. Las variables clave incluirán:
| Variable | ¿Qué mide? | Tipo de dato | Unidades/Formato |
|---|---|---|---|
| Precisión de detección | Proporción de verdaderos positivos | Numérico | Decimal (0–1) |
| Recall (sensibilidad) | Capacidad del modelo para detectar todas las instancias | Numérico | Decimal (0–1) |
| mAP@0.5 | Media de precisión con IoU ≥ 0.5 | Numérico | Decimal (0–1) |
| mAP@0.5:0.95 | Precisión media en múltiples umbrales IoU | Numérico | Decimal (0–1) |
| Tiempo de inferencia | Tiempo de procesamiento por imagen | Numérico | Milisegundos (ms) |
| Número de parámetros | Complejidad computacional del modelo | Numérico | Millones |
| Desviación estándar del mAP@0.5 | Variabilidad entre réplicas del mismo modelo | Numérico | Decimal |
Adicionalmente, se compararán los resultados automáticos con las evaluaciones manuales mediante análisis de correlación, lo cual permitirá medir el grado de coincidencia entre ambos enfoques. También se considerarán aspectos como la robustez del modelo frente a variabilidad en las imágenes, su complejidad computacional y la facilidad de implementación, con el objetivo de seleccionar el modelo más eficiente y aplicable a contextos reales.
1.4. Métodos
1.4.1. Segmentación manual de imágenes (anotación)
Las imágenes recolectadas serán organizadas en un repositorio estructurado y posteriormente anotadas utilizando la herramienta de código abierto Label Studio, mediante la técnica de segmentación por polígonos. Para cada imagen, se delimitarán manualmente las regiones de interés según las siguientes categorías: (1) tubérculo completo, (2) ojo completo, (3) ojo incompleto, (4) pulpa, (5) escala de referencia.
Estas clases permitirán desarrollar modelos de segmentación que distingan con precisión las principales estructuras morfológicas relevantes para la caracterización automatizada. Estas segmentaciones serán exportadas en formato COCO, compatible con los modelos YOLO. Este paso garantiza que los modelos aprendan de datos correctamente etiquetados.
1.4.2. Entrenamiento de modelos
Se entrenarán modelos YOLOv5 y YOLOv11 con distintas configuraciones de épocas (50, 100, 150), con y sin aumentación de datos. Las imágenes se dividirán en 80 % entrenamiento y 20 % validación, estos modelos serán entrenados en entornos de Ultralytics. Cada configuración será replicada cinco veces para evaluar su estabilidad.
Para fortalecer la capacidad del modelo frente a la variabilidad morfológica y de fondo, se aplicarán técnicas de aumento de datos tales como rotación, recorte, modificación de brillo y contraste, entre otros. Este proceso permitirá mejorar la generalización del modelo y su desempeño frente a imágenes con diferentes condiciones de captura.
1.4.3. Evaluación de desempeño del modelo
Los modelos entrenados serán ejecutados con múltiples configuraciones de hiperparámetros, considerando al menos cinco 5 réplicas por configuración, con el objetivo de evaluar la consistencia de los resultados y detectar diferencias en el desempeño. Para determinar si existen diferencias estadísticamente significativas entre las configuraciones evaluadas, se aplicará un modelo lineal mixto.
El procesamiento y análisis de los datos se realizará en el software estadístico R. Las variables de rendimiento, como la precisión, el mAP y el IoU, serán sometidas a un análisis de varianza (ANOVA) con un nivel de significancia del 5 %. En caso de identificarse diferencias significativas, se aplicará la prueba de comparación de medias de Tukey para determinar qué configuraciones presentan un desempeño superior.
1.5. Cronograma
El presente proyecto se desarrollará en un periodo de 9 meses, desde la preparación de datos hasta el análisis estadístico y la redacción del informe. Las actividades se organizan por etapas, según los objetivos específicos planteados.
| Actividades | Mes 1 | Mes 2 | Mes 3 | Mes 4 | Mes 5 | Mes 6 | Mes 7 | Mes 8 | Mes 9 |
|---|---|---|---|---|---|---|---|---|---|
| Revisión de literatura y planificación técnica | X | X | |||||||
| Organización y preprocesamiento de imágenes | X | X | |||||||
| Anotación manual de imágenes en Label Studio | X | X | |||||||
| Conversión de datos anotados al formato COCO y validación | X | ||||||||
| Diseño de base de datos experimental | X | ||||||||
| Entrenamiento de modelos YOLOv5 y YOLOv11 | X | X | X | ||||||
| Evaluación de desempeño de modelos | X | X | X | ||||||
| Análisis estadístico | X | X | |||||||
| Interpretación de resultados y revisión de errores | X | X | |||||||
| Redacción del informe y conclusiones finales | X | X | |||||||
| Correcciones, presentación y cierre del proyecto | X | ||||||||
1.6. Análisis de datos
El análisis estadístico se realizará con el objetivo de evaluar el desempeño de los modelos YOLOv5 y YOLOv11 en función de tres factores: número de épocas de entrenamiento (50, 100, 150), uso de aumentación de datos (sí/no) y cinco réplicas por combinación. Para ello, se utilizará un modelo lineal mixto, donde los factores épocas y aumentación se considerarán como efectos fijos, y las réplicas como efecto aleatorio.
Este modelo permitirá identificar diferencias significativas en métricas como mAP@0.5, precisión, IoU y tiempo de inferencia, controlando la variabilidad entre repeticiones. El análisis se ejecutará en R con los paquetes lme4 y emmeans, aplicando ANOVA y la prueba de Tukey para comparaciones múltiples (α = 0.05).
Adicionalmente, se calculará la desviación estándar del mAP como indicador de estabilidad, y se evaluará la correlación entre mediciones manuales y automáticas para validar el sistema. También se realizará una revisión visual de los resultados de segmentación para detectar errores frecuentes y valorar la calidad del modelo.