Rematch: A novel regex engine for finding all matches
dc.catalogador | gjm | |
dc.contributor.advisor | Riveros Jaeger, Cristian | |
dc.contributor.author | Van Sint Jan Campos, Nicolás Andre | |
dc.contributor.other | Pontificia Universidad Católica de Chile. Escuela de Ingeniería | |
dc.date.accessioned | 2024-06-03T13:58:51Z | |
dc.date.available | 2024-06-03T13:58:51Z | |
dc.date.issued | 2024 | |
dc.description | Tesis (Master of Science in Engineering)--Pontificia Universidad Católica de Chile, 2024. | |
dc.description.abstract | En esta tesis presentamos el sistema REmatch para la extraccion de información. REmatch esta basado en un algoritmo de enumeración recientemente propuesto para evaluar expresiones regulares con variables de captura que soportan la semantica de encontrar todos los resultados. Se expone lo necesario para hacer que un algoritmo teóricamente óptimo funcione en la práctica. Como mostraremos, una implementación ingenua del algoritmo original tendría dificultades para lidiar con cargas de trabajo realistas. Dado lo anterior, desarrollamos un nuevo algoritmo y una serie de optimizaciones que hacen que REmatch sea tan o mas rápido que muchos motores RegEx populares, al mismo tiempo que puede devolver todos los resultados, una tarea con la que la mayoría de los otros motores suele tener problemas. | |
dc.fechaingreso.objetodigital | 2024-06-03 | |
dc.format.extent | x, 57 páginas | |
dc.fuente.origen | SRIA | |
dc.identifier.doi | 10.7764/tesisUC/ING/86373 | |
dc.identifier.uri | https://do.org/10.7764/tesisUC/ING/86373 | |
dc.identifier.uri | https://repositorio.uc.cl/handle/11534/86373 | |
dc.information.autoruc | Escuela de Ingeniería; Riveros Jaeger, Cristian; 0000-0003-0832-116X; 131276 | |
dc.information.autoruc | Escuela de Ingeniería; Van Sint Jan Campos, Nicolás Andre; S/I; 245289 | |
dc.language.iso | en | |
dc.nota.acceso | contenido completo | |
dc.rights | acceso abierto | |
dc.subject | Expresiones regulares | |
dc.subject | Document spanners | |
dc.subject | Extracción de información | |
dc.subject | Algoritmos de enumeración | |
dc.subject | Semántica de coincidencia completa | |
dc.subject.ddc | 620 | |
dc.subject.dewey | Ingeniería | es_ES |
dc.title | Rematch: A novel regex engine for finding all matches | |
dc.type | tesis de maestría | |
sipa.codpersvinculados | 131276 | |
sipa.codpersvinculados | 245289 |