
EXTRACCIÓN Y CLASIFICACIÓN DE DATOS PARA INTERFACES CEREBRO COMPUTADORA (BCI) MEDIANTE SEÑALES P300 Y EEG.
Díaz Avila Adriana, Instituto Politécnico Nacional. Lugo Acedo Luz Marey, Universidad Autónoma de Baja California. Xicale Deaquino Rodrigo, Benemérita Universidad Autónoma de Puebla. Asesor: Dr. Javier Mauricio Antelis Ortiz, Instituto Tecnológico y de Estudios Superiores de Monterrey
PLANTEAMIENTO DEL PROBLEMA
Existen distintos potenciales relacionados con eventos, que son respuestas electrofisiológicas estereotipadas a un estímulo internas o externas. En el artículo Comparison of Classification Methods for P300 Brain-Computer Interface on Disabled Subjects (2011) se habla de una onda en específico denominada P300, la cual consiste en un componente de señal positiva mejorada con una latencia de unos 300 ms después del inicio del estímulo que permite una comunicación.
Estos eventos P300 vinculan la posibilidad de controlar una interfaz cerebro-computadora, que proporciona canales musculares de comunicación, particularmente para individuos con severos problemas neuromusculares (Krusienski et al., 2010; Manyakov et al., 2011). El objetivo principal de estas interfaces es de crear dispositivos que mejoren la calidad de vida de pacientes con deficiencias neurológicas (Krucoff et al., 2016).
Estudios han demostrado que un BCI basado en eventos P300,que se entrena con una cantidad limitada de datos, puede funcionar como un dispositivo efectivo de comunicación, gracias a la posibilidad de controlar un BCI con un electro encefalograma. Para entrenar un algoritmo, hay que alimentarlo con datos registrados con un EEG al ser expuesto el sujeto a estímulos externos para registrar la onda P300 extrayendo y clasificándolos para que eventualmente la máquina lo realice autonomamente, con el objetivo de ayudar en la rehabilitación o la asistencia de una persona con lesiones neurológicas (Krusienski et al., 2010; Manyakov et al., 2011; Krucoff et al., 2016). De esta manera, nos enfocamos en encontrar los métodos de extracción y clasificación de los datos registrados en un EEG que sean más efectivos y precisos con el fin de crear BCI con mejor funcionamiento.
METODOLOGÍA
La EEG es detectada mientras a un paciente se le muestran dos tipos de eventos visuales con uno ocurriendo con menor frecuencia que el otro. Estos dos tipos de estímulos son: flecha y carita feliz. La onda P300 aparece cuando el sujeto hace el conteo del estímulo solicitado.
Después estos datos serán los que alimenten al BCI; la primera fase es ingresar el EEG al BCI siendo esto una matriz de datos. Después se definirá su condición a la cual pertenece (Target o non-Target).
Estudio 1. Se proporcionó un archivo de datos de una sesión de un paciente con el tipo de estímulo happy face. El modelo de entrenamiento de Machine learning se divide en una secuencia de pasos:
Preprocesamiento. Se modifican los datos para ser utilizables para el resto del programa. Se le realiza un filtrado pasa-banda de 4-44 hz, se recorta el tiempo que dura cada training de 0-0.8s, se realizan los vectores que separan los impulsos target de los no target, y se hace una selección aleatoria del 80% de los datos para el entrenamiento del algoritmo, y el resto se usará para la prueba. Esta prueba no balancea los datos target y no target, para pruebas posteriores sí se balancearon.
Extracción de características. Para laextracción de los datos se probaron 3 maneras distintas: promediación, decimación (factores 3 y 10) y correlación canónica.
Modelos de clasificación. En este corresponde entrenar el algoritmo con los datos generados por el EEG, haciendo la clasificación de los mismos con los siguientes modelos: LDA 1, LDA 2, SWLDA, SVML, SVMG, SVMR y KNN.
Se repite 100 veces el algoritmo desde la selección del conjunto de entrenamiento de prueba, con un método de extracción de características y otro de clasificación seleccionado con el conjunto de prueba y se arrojan métricas de precisión de porcentajes mínimos, máximos, media de porcentajes y la desviación estándar de: exactitud, verdadero positivo, verdadero negativo y falso positivo para medir el rendimiento de la combinación del modelo de extracción y el modelo de clasificación.
Estudio 2. Se escogieron la mejor combinación de métodos de extracción de características y modelo de clasificación del estudio 1. Combinaciones a implementar: SVML con DEC3 y LDA2 con DEC10 usando los datos de la primera sesión del participante 8 la cual contiene los entrenamientos 4,5,6,7,8 y 9. Se graficó el comportamiento de cada entrenamiento con su respectiva combinación de método de extracción y modelo para determinar cuál entrenamiento clasifica mejor el target y el no target.
CONCLUSIONES
Para el Estudio 1, la mejor combinación fue SVML-DEC3 3 ya que para un sistema sin balanceo, se ajusta a una aproximación más pronta en la clasificación, sin embargo, para fines de procesamiento rápido no se recomienda aunque no descartamos la utilización de la combinación LDA2-DEC10 ya que de igual manera para las métricas referentes a TPR y TNR fueron altas con respecto a la clasificación y en comparación a la rapidez del procesamiento es eficaz para sistemas críticos.
De acuerdo a los resultados del Estudio 1 el sistema 2 fue entrenado con las combinaciones: SVML-DEC3 y LDA2-DEC10, obteniendo lo siguiente: Al entrenar el sistema con LDA2- DEC10 en balanceo, el entrenamiento 2 favoreció con mayor eficacia la clasificación de target y no-target, teniendo las siguientes métricas: ACC: 78.5 % TPR:72% TNR:72% FPR: 28%. Lo cual significa que el sistema con el entrenamiento 2, clasificó de una manera equilibrada las dos clases de nuestro interés.
De igual manera para el sistema sin balanceo usando la misma combinación favorece el entrenamiento 2 de la sesión 1 del participante 8, teniendo en cuenta un total de 6 entrenamientos en la sesión. Se observa una caída paulatina del 4% en la tasa de TPR por cada sesión que se realiza a partir del entrenamiento 2 y un incremento del 1.5% en la métrica TNR.
Entrenando el sistema con el método de extracción de características DEC3 en combinación con SVML, se obtuvo como resultado el entrenamiento 2 capaz de dar mejor clasificación entre target y no target, teniendo como diferencia principal con respecto a los demás entrenamientos una tasa alta de TPR y TNR con un porcentaje de 71% con diferencias mínimas en las dos métricas.