25 de abril de 2024
25 de abril de 2024 | Las Noticias del Ministerio Público Fiscal
Menu
Apoyo al trabajo sobre fondos documentales masivos
La Dirección General de Desarrollo Organizacional y Nuevas Tecnologías presentó Indexar 2.0
El sistema permite ordenar una serie de datos o informaciones en formato digital bajo criterios comunes para facilitar su consulta y análisis. Fue desarrollado como herramienta de apoyo al trabajo de la UFI AMIA y sirve como alternativa a otros softwares para consulta de expedientes digitalizados. Después de más de un año desde el inicio de la programación, la Dirección presentó la segunda versión.

La Dirección General de Desarrollo Organizacional y Nuevas Tecnologías presentó Indexar 2.0, la segunda versión del conjunto de herramientas digitales para administrar, buscar y visualizar grandes cantidades de información. El sistema extrae texto de imágenes de los expedientes mediante el proceso de reconocimiento óptico de caracteres (OCR, optical character recognition), permitiendo trabajar con documentos de tipo Word, PDF, HTML PowerPoint, archivos de texto plano y, potencialmente, sobre cualquier tipo de soporte del cual se pueda extraer texto. Según explicaron los desarrolladores, este tipo de sistema soluciona de manera eficiente las búsquedas de texto completo (full-text search). El motor busca coincidencias entre la palabra o frase buscada con todas las palabras de todos los documentos de la base de datos. Las consultas de esta clase pueden demorar en motores convencionales, pero con un motor de indexación optimizado —como Indexar 2.0— se consiguen resultados en milisegundos, con una amplia cantidad de características y opciones de refinamiento.

Indexar 2.0 permite organizar, visualizar y buscar información con una interfaz amigable para cualquier usuario. Los usuarios pueden cargar la información que más tarde será indexada y accesible a través de un buscador al estilo de los conocidos para la navegación en internet. Indexar también permite búsquedas mediante una estructura de carpetas y archivos. Al seleccionar un documento puede verse el archivo original junto a los documentos adyacentes y al texto indexado. Se pueden seleccionar uno o más documentos para imprimir o descargar para su posterior uso. Indexar 2.0 permite, además, reemplazar al antiguo sistema Excalibur, hoy discontinuado y sin soporte técnico ni actualizaciones. Al ser un desarrollo propio, Indexar admite la atención de problemas y el agregado de nuevas funcionalidades.

Indexar 2.0 permite organizar, visualizar y buscar información con una interfaz amigable para cualquier usuario.

La versión actual ha mejorado la interfaz del usuario, facilitando su usabilidad, y ha incorporado una serie de ajustes que reducen el tiempo de búsqueda respecto de la primera versión. No obstante, los especialistas ya trabajan para futuras versiones en la compatibilidad con motores de indexación más potentes (Solr, Elasticsearch), la indexación de audios o videos, la edición y autocorrección de OCR y la detección de datos (tales como idioma, teléfonos, nombres, direcciones, o fojas). El sistema no genera al MPF el cargo de ninguna licencia comercial y su realización fue posible gracias a las capacidades de los desarrolladores de la Dirección de Aplicaciones, sobre la base de tecnologías libres y de código abierto, como GNU/Linux, Python, Django, Whoosh, o Haystack.

En el caso de la UFI AMIA, el sistema lleva cargados 10 millones de registros, 8 corresponden a ingresos y egresos de migraciones y el resto a documentos de la causa. De ellos, 700 mil han sido generados durante los dos últimos años por el Grupo Especial de Relevamiento y Análisis Documental (GERAD) y otros 300 mil documentos ya están listos para el respectivo proceso de carga. Entre muchas otras funciones, el GERAD cataloga los materiales con el mayor grado de desagregación posible en función de normas internacionales archivísticas como ISAD-G (General Internacional Standard Archival Description) y ISAAR CPF (Internacional Standard Archival Authority Record for Corporate Bodies, Persons and Families) y digitaliza el acervo para su conservación y accesibilidad.  Indexar 2.0 se inscribe en este esquema de trabajo y aporta una herramienta de apoyo adicional al trabajo de la UFI AMIA sobre la documentación. Los desarrolladores han destacado además que Indexar podría ser implementado en otras dependencias y, de hecho, se ha provisto al Tribunal Oral en lo Criminal Federal 2 de un acceso remoto respecto de los materiales incorporados al juicio oral y público por el desvío de la investigación del atentado.