Page 6 - Revista - NIVEL 15

Page 6 - Revista - NIVEL 15 - Rood

P. 6

ANÁLISIS DE DATOS DE ACCIDENTES
CON BERT EN CIUDAD JUÁREZ,
CHIHUAHUA, MÉXICO

C. Cynthia Estefania Álvarez2, M.I. Saima Zaheen1, Dr. Ruey Long Cheu1
1The University of Texas at El Paso (UTEP), 2Universidad Autónoma de Ciudad Juárez (UACJ)

E n Ciudad Juárez, las colisiones de tránsito representan una preocupación importante para la seguridad pública y la movilidad
urbana. El análisis de datos de reportes de accidentes puede ayudar a identificar patrones, causas y zonas de alto riesgo, lo que
fundamenta las estrategias para reducir los accidentes y mejorar la seguridad vial. A lo largo de los años, los ingenieros de tránsito
han interpretado manualmente los reportes de accidentes, una tarea que consume mucho tiempo debido a la necesidad de crear
diagramas de colisión detallados.
Esta investigación explora la aplicación del Bidirectional Encoder Representations from Transformers (BERT) para codificar narrativas de
accidentes en español y automatizar la generación de diagramas de colisión en intersecciones. El estudio también examina los desafíos del
procesamiento de datos textuales no estructurados, el rendimiento del modelo en un contexto lingüístico diferente y el potencial para integrar
estos métodos en los flujos de trabajo de análisis de seguridad vial.
Metodología
Tras la recolección de narrativas de accidentes como muestra, se extrajeron los datos fundamentales para la ejecución del modelo, identificando
datos del incidente, direcciones de las unidades, movimientos, unidad en culpa y el tipo de colisión.
La adaptación de BERT al español implica la carga e inspección del conjunto de datos estructurados anteriormente mencionados para
identificar características relevantes y términos específicos del dominio. El modelo “dccuchile/bert-base-spanish-wwm-cased”, optimizado
para español se utilizó junto con el “AutoTokenizer” para preprocesar el texto. El ajuste se realizó mediante ejemplos anotados para guiar el
aprendizaje supervisado. Posteriormente, el rendimiento del modelo se evaluó mediante métricas como matrices de confusión, según la tarea.
Resultados
La introducción de numerosas narrativas introducidas es indispensable para que los resultados arrojen puntuaciones altas de compatibilidad y
razonamiento. Al introducir únicamente 30 narrativas al modelo, los resultados presentaron algunas confusiones. Sin embargo, se demuestra
que, el entrenamiento basto del modelo puede lograr resultados positivos, para de manera posterior, programar el modelo para transformar las
palabras clave en representaciones visuales, añadiendo los caracteres que se utilizarán.

Etiqueta Precisión Puntuación F1 Macro F1
F1 ponderado

Unit_1 0.1111 0.0888 0.1 0.09
_dir

Unit_1 0.6666 0.5715 0.29 0.57
_move

Unit_2 0.1111 0.0370 0.08 0.04
_dir

Unit_2 1 1 1 1
_move

PLANEACIÓN Unit_at 0.6667 0.6407 0.65 0.64
_fault

Crash 0.5555 0.4793 0.37 0.48
_type

Resultado de vectorización de croquis de colisión.

1 2 3 4 5 6 7 8 9 10 11