Evaluating the effectiveness of replication for tail-tolerance

Título traducido de la contribución: Evaluación de la eficacia de la réplica para la tolerancia de la cola

Zhan Qiu, Juan F. Perez

Resultado de la investigación: Capítulo en Libro/Reporte/ConferenciaContribución a la conferencia

11 Citas (Scopus)

Resumen

Los clústeres informáticos (CC) son una plataforma rentable y de alto rendimiento para aplicaciones científicas y de ingeniería intensivas en computación. Un desafío clave en la gestión de los CCs es lograr consistentemente tiempos de respuesta bajos. En particular, los métodos tolerantes a la cola tienen como objetivo mantener la cola de la distribución del tiempo de respuesta corta. En este trabajo exploramos la replicación concurrente con la cancelación, un enfoque tolerante a la cola que implica procesar las solicitudes y sus réplicas simultáneamente, recuperar el resultado de la primera réplica que se completa y cancelar todas las demás réplicas. Proponemos un modelo estocástico que considera cualquier número de réplicas, tiempos generales de procesamiento y entre llegadas, y calcula la distribución del tiempo de respuesta. Demostramos que la replicación puede ser muy efectiva para mantener el tiempo de respuesta corto, pero estos beneficios dependen en gran medida de la distribución del tiempo de procesamiento, así como de la utilización del CC y de las características estadísticas del proceso de llegada. También explotamos el modelo para apoyar la selección del número óptimo de réplicas, y una estrategia de aprovisionamiento de recursos que cumpla con los objetivos de nivel de servicio en los percentiles de tiempo de respuesta.
Idioma originalInglés estadounidense
Título de la publicación alojadaProceedings - 2015 IEEE/ACM 15th International Symposium on Cluster, Cloud, and Grid Computing, CCGrid 2015
EditorialInstitute of Electrical and Electronics Engineers Inc.
Páginas443-452
Número de páginas10
ISBN (versión digital)9781479980062
DOI
EstadoPublicada - ene 1 2015
Publicado de forma externa
Evento15th IEEE/ACM International Symposium on Cluster, Cloud, and Grid Computing, CCGrid 2015 - Shenzhen, China
Duración: may 4 2015may 7 2015

Conferencia

Conferencia15th IEEE/ACM International Symposium on Cluster, Cloud, and Grid Computing, CCGrid 2015
PaísChina
CiudadShenzhen
Período5/4/155/7/15

    Huella digital

All Science Journal Classification (ASJC) codes

  • Informática (miscelánea)
  • Redes de ordenadores y comunicaciones
  • Software

Citar esto

Qiu, Z., & Perez, J. F. (2015). Evaluating the effectiveness of replication for tail-tolerance. En Proceedings - 2015 IEEE/ACM 15th International Symposium on Cluster, Cloud, and Grid Computing, CCGrid 2015 (pp. 443-452). [7152510] Institute of Electrical and Electronics Engineers Inc.. https://doi.org/10.1109/CCGrid.2015.22