Durante la primera jornada de OR2010 el investigador Siddharth Kumar Singh de Purdue University presentó los primeros resultados de un análisis de los cuatro paquetes de software representados en la 4ta Conferencia Internacional sobre Repositorios Abiertos: EPrints , DSpace , Fedora y Zentity .
El objetivo del estudio es generar una evaluación general que permita describir a estos paquetes de software de manera comparativa, al estilo Consumer Reports . Se definieron 21 criterios tanto cualitativos como cuantitativos que se aplican para evaluar las instalaciones estándares de los cuatro paquetes de software utilizando la misma computadora de referencia y una colección de base. Para establecer la colección de base se utilizó el Directorio de Repositorios de Acceso Abierto , se realizó una cosecha de 100 registros de metadatos en inglés y a partir de los mismos se hicieron las pruebas.
Los criterios de evaluación definidos fueron los siguientes:
• Adopción: Grado de adopción de cada paquete de software. El paquete más adoptado es DSpace. El detalle de los resultados están disponibles en el blog del proyecto .
• Lanzamiento de nuevas versiones: Madurez del paquete de software.
• Soporte: Grado de soporte que tiene el software, ya sea entrenamientos, documentación, wikis, listas de discusión, soporte comercial, etc.
• Instalación: Se realizó un registro de los pasos de instalación. Luego se hizo una descripción de la experiencia de instalación comparándola con su documentación, con reporte de problemas o discrepancias.
• Requerimientos del Sistema: Requerimientos de sistemas operativos necesarios para que el repositorio funcione, los resultados están disponibles.
• Globalización: Grado de soporte del software para la internacionalización del mismo, cantidad de idiomas soportados tanto en la interfase de usuarios como en la búsqueda e indización.
• Escalabilidad: Capacidad del software para soportar un gran número de objetos.
• Autenticación: Mecanismos de autentificación y autorización que permite cada paquete de software.
• Control de Acceso: Madurez de políticas de control de acceso disponibles.
• Estándares de Metadatos: Cantidad y tipos de estándares de metadatos soportados. EPrints es el que más estándares de metadatos soporta.
• Plugins y Scripts disponibles para extender las prestaciones del software.
• Soporte de Base de Datos: Bases de datos soportadas.
• Sostenibilidad: Solidez de la comunidad de desarrollo del software y compromiso de continuidad del proyecto.
• Interoperabilidad: Número de estándares soportados que se pueden usar en conjunto con otros estándares.
• Ecosistema de Desarrolladores
• Optimización de Motores de Búsqueda para mejorar la visibilidad del repositorio en los buscadores web.
• Actualización: Proceso de actualización, nivel de complejidad del mismo, precisión de la documentación y errores. Ya está disponible el reporte.
• Búsqueda: Evaluación de la funcionalidad de búsqueda en cuanto al tiempo, la precisión y el poder del lenguaje de búsqueda.
• Almacenamiento: Modo de almacenamiento de los datos.
• Desempeño: En esta medida se tiene en cuenta la cantidad de usuarios concurrentes, tiempo de respuesta para realizar determinadas tareas (subidad de nuevos objetos, actualización, recuperación, eliminación) utilización de CPU, memoria y disco durante la realización de tareas. DSpace fue el que tuvo mejor desempeño.
• Migración: Funcionalidades de importación y exportación. Facilidad de migrar contenidos a otro repositorio.
El análisis también se centra en los flujos de trabajo más comunes de los repositorios:
Consumo: Se centra en analizar la calidad de la navegación y búsqueda, la facilidad de encontrar y bajar los contenidos, la existencia de datos sobre uso, notificaciones sobre nuevos depósitos vía correo electrónico y/o RSS, existencia de funcionalidades Web 2.0.
Depósito: Facilidad de registrarse en el sistema. Usabilidad de las plantillas de depósito y disponibilidad de campos completados automáticamente, flexibilidad para agregar, quitar o cambiar campos en los formularios. Facilidad de corregir errores durante o luego del depósito.
Aceptación: Pasos de control de calidad disponibles y para quiénes. Posibilidad de realizar cambios luego del depósito y quiénes pueden hacerlo. Si se rechaza un depósito, ver la posibilidad que brinda el software a quien deposita de hacer correcciones y enviar su trabajo sin tener que empezar nuevamente todo el proceso.
Importación por lotes: Facilidad/dificultad de importar gran cantidad de ítems similares.
En el sitio del proyecto se encuentra la evaluación cualitativa de los cuatro flujos realizada.
Sin duda este tipo de estudios es sumamente útil para los gestores de repositorios y quienes están evaluando qué paquete de software utilizar en su repositorio, aunque habrá que esperar ya que todavía no están disponibles los resultados para muchos de los criterios usados en la evaluación y las conclusiones generales del análisis.
Filed under: Estudios, Infraestructura, Proyectos, Recursos | Tagged: DSpace, EPrints, Fedora, Repositories, repositorios, repository software comparison, software, Zentity |
Estoy interesado en conocer la evaluación cualitativa realizada ya que en la organización estamos en el proceso de seleccionar el softare para nuestro reporsitorio institucional pero el link no funciona.
Estimado Fernando:
Aparentemente el sitio del proyecto ya no está funcionando. De todos modos le dejo el enlace al artículo presentado en la Conferencia http://www.or2010.net/Resources/documentos/GSabstracts/AComparativeAnalysisInstitutionalRepositorySoftware.pdf
Saludos cordiales,
Paola