Comparación de diferentes enfoques de procesamiento mediante SVM y RF en datos de HS-MS eNose y espectrometría NIR para la discriminación de muestras de gasolina
Autores: Marta Barea-Sepúlvedaa, Marta Ferreiro-Gonzáleza, José Luis P.Callea, Gerardo F.Barberoa, Jesús Ayusob, Miguel Palmaa
a Departamento de Química Analítica, Facultad de Ciencias, Universidad de Cádiz, Campus Agroalimentario de Excelencia Internacional (ceiA3), IVAGRO, Puerto Real, Cádiz 11510, España
b Departamento de Química-Física, Facultad de Ciencias, Universidad de Cádiz, INBIO, Puerto Real, Cádiz 11510, España
DOI: https://doi.org/10.1016/j.microc.2021.106893
Resumen
En el control de calidad de los líquidos inflamables y combustibles, como la gasolina, tanto el análisis rápido como el procesamiento automatizado de datos son de gran importancia desde un punto de vista económico para la industria petrolera. El presente trabajo tiene como objetivo evaluar las herramientas quimiométricas a aplicar sobre los resultados de la nariz electrónica (HS-MS eNose) y de la espectroscopia de infrarrojo cercano (NIRS) para discriminar la gasolina según su octanaje (RON). Para ello, se estudiaron los datos de un total de 50 muestras de gasolina de dos tipos de RON, 95 y 98, analizadas por las dos técnicas mencionadas. Los datos de HS-MS eNose y NIRS se combinaron con técnicas exploratorias no supervisadas, como el análisis jerárquico de conglomerados (HCA), así como con otras técnicas de clasificación supervisada, como la máquina de vectores de apoyo (SVM) y el bosque aleatorio (RF).
Para la clasificación supervisada, se aplicó además la fusión de datos de bajo nivel para evaluar si el uso combinado de los datos aumentaba el alcance de la información relevante. Los resultados del HCA mostraron una clara tendencia a la agrupación de las muestras de gasolina según su RON con los datos de HS-MS eNose. El modelo de SVM en combinación con la validación cruzada de 5 bloques clasificó con éxito el 100% de las muestras con el conjunto de datos HS-MS eNose. El algoritmo RF en combinación con la validación cruzada de 5 bloques logró la mejor tasa de precisión para el conjunto de pruebas con el sistema de fusión de datos de bajo nivel. Además, permitió identificar las características más importantes que podían definir las diferencias entre la gasolina RON 95 y RON 98.
Por otra parte, al utilizar la fusión de datos de bajo nivel HS-MS eNose y NIRS se obtuvieron mejores resultados que los obtenidos utilizando los datos NIRS individualmente, con tasas de precisión del 100% tanto en el rendimiento de SVM como de RF con el conjunto de prueba. En general, el rendimiento de los algoritmos SVM y RF resultó ser similar.
Enlaces de publicación en prensa