Resumen
Muchas aplicaciones de software modernas se basan en el procesamiento paralelo de trabajos para explotar grandes reservas de recursos disponibles en infraestructuras de nube y grid. El tiempo de respuesta de un trabajo paralelo, formado por muchas subtareas, viene determinado por la última subtarea que finalice. Por lo tanto, una única subtarea o un fallo que requiera reprocesamiento puede aumentar sustancialmente el tiempo de respuesta. Para superar estos problemas, exploramos la replicación concurrente con la cancelación. Este mecanismo ejecuta dos réplicas de trabajos simultáneamente, y recupera el resultado de la primera réplica que se completa, cancelando inmediatamente la otra. Para analizar este mecanismo proponemos un modelo estocástico que considera la replicación tanto a nivel de trabajo como de tarea. Encontramos que la replicación a nivel de tarea logra una fiabilidad mucho mayor y tiempos de respuesta más cortos que la replicación a nivel de trabajo. También observamos que el impacto de la replicación depende de la utilización del sistema, la fiabilidad de las subtareas y la correlación entre los fallos de las réplicas. Basado en el modelo, proponemos una estrategia de aprovisionamiento de recursos que determina el número mínimo de nodos de cálculo necesarios para alcanzar un objetivo de nivel de servicio (SLO) definido como un percentil de tiempo de respuesta. Esta estrategia se evalúa considerando patrones de tráfico realistas de un cluster paralelo, donde la replicación a nivel de tarea muestra el potencial para reducir los requerimientos de recursos para SLOs con tiempos de respuesta ajustados.
Título traducido de la contribución | Evaluación de la reproducción para jobs paralelos: Un enfoque eficiente |
---|---|
Idioma original | Inglés estadounidense |
Número de artículo | 7313012 |
Páginas (desde-hasta) | 2288-2302 |
Número de páginas | 15 |
Publicación | IEEE Transactions on Parallel and Distributed Systems |
Volumen | 27 |
N.º | 8 |
DOI | |
Estado | Publicada - ago. 1 2016 |
Publicado de forma externa | Sí |
Áreas temáticas de ASJC Scopus
- Procesamiento de senales
- Hardware y arquitectura
- Teoría computacional y matemáticas