Page 6 - Revista - NIVEL 15 - Rood
P. 6

ANÁLISIS DE DATOS DE ACCIDENTES
            CON BERT EN CIUDAD JUÁREZ,
            CHIHUAHUA, MÉXICO

              C. Cynthia Estefania Álvarez2, M.I. Saima Zaheen1, Dr. Ruey Long Cheu1
              1The University of Texas at El Paso (UTEP), 2Universidad Autónoma de Ciudad Juárez (UACJ)

            E n Ciudad Juárez, las colisiones de tránsito representan una preocupación importante para la seguridad pública y la movilidad
                            urbana. El análisis de datos de reportes de accidentes puede ayudar a identificar patrones, causas y zonas de alto riesgo, lo que
                            fundamenta las estrategias para reducir los accidentes y mejorar la seguridad vial. A lo largo de los años, los ingenieros de tránsito
                            han interpretado manualmente los reportes de accidentes, una tarea que consume mucho tiempo debido a la necesidad de crear
                            diagramas de colisión detallados.
              Esta investigación explora la aplicación del Bidirectional Encoder Representations from Transformers (BERT) para codificar narrativas de
              accidentes en español y automatizar la generación de diagramas de colisión en intersecciones. El estudio también examina los desafíos del
              procesamiento de datos textuales no estructurados, el rendimiento del modelo en un contexto lingüístico diferente y el potencial para integrar
              estos métodos en los flujos de trabajo de análisis de seguridad vial.
             Metodología
              Tras la recolección de narrativas de accidentes como muestra, se extrajeron los datos fundamentales para la ejecución del modelo, identificando
              datos del incidente, direcciones de las unidades, movimientos, unidad en culpa y el tipo de colisión.
              La adaptación de BERT al español implica la carga e inspección del conjunto de datos estructurados anteriormente mencionados para
              identificar características relevantes y términos específicos del dominio. El modelo “dccuchile/bert-base-spanish-wwm-cased”, optimizado
              para español se utilizó junto con el “AutoTokenizer” para preprocesar el texto. El ajuste se realizó mediante ejemplos anotados para guiar el
              aprendizaje supervisado. Posteriormente, el rendimiento del modelo se evaluó mediante métricas como matrices de confusión, según la tarea.
             Resultados
              La introducción de numerosas narrativas introducidas es indispensable para que los resultados arrojen puntuaciones altas de compatibilidad y
              razonamiento. Al introducir únicamente 30 narrativas al modelo, los resultados presentaron algunas confusiones. Sin embargo, se demuestra
              que, el entrenamiento basto del modelo puede lograr resultados positivos, para de manera posterior, programar el modelo para transformar las
              palabras clave en representaciones visuales, añadiendo los caracteres que se utilizarán.

            Etiqueta Precisión Puntuación F1 Macro  F1
                             F1 ponderado

            Unit_1   0.1111  0.0888  0.1            0.09
             _dir

            Unit_1   0.6666  0.5715  0.29           0.57
            _move

            Unit_2   0.1111  0.0370  0.08           0.04
             _dir

            Unit_2   1       1       1              1
            _move

PLANEACIÓN  Unit_at  0.6667  0.6407  0.65           0.64
             _fault

            Crash    0.5555  0.4793  0.37           0.48
            _type

                                                          Resultado de vectorización de croquis de colisión.

6
   1   2   3   4   5   6   7   8   9   10   11