Enhancing reliability and response times via replication in computing clusters

Título traducido de la contribución: Mejora de la fiabilidad y los tiempos de respuesta mediante la replicación en clústeres informáticos

Zhan Qiu, Juan F. Perez

Producción científica: Capítulo en Libro/ReporteContribución a la conferencia

18 Citas (Scopus)

Resumen

Los clústeres de computación se han desplegado ampliamente para aplicaciones científicas y de ingeniería con el fin de soportar computación intensiva y operaciones de datos masivas. Dado que las aplicaciones y los recursos de un clúster están sujetos a fallos, se suelen adoptar estrategias de tolerancia a fallos, a veces a expensas de retrasos adicionales en los tiempos de respuesta de los trabajos, o de un aumento innecesario del uso de los recursos. En este trabajo, exploramos la replicación concurrente con la cancelación, un enfoque de tolerancia a fallos en el que los trabajos y sus réplicas se procesan de forma concurrente, y la finalización exitosa de cualquiera de ellos desencadena la eliminación de su réplica. Proponemos un modelo estocástico para estudiar cómo este enfoque afecta a los objetivos de nivel de servicio del clúster (SLOs), particularmente los percentiles de tiempo de respuesta ofrecidos. Además de las ganancias esperadas en fiabilidad, el modelo propuesto nos permite determinar las regiones de la utilización en las que introducir la replicación con cancelación reduce eficazmente los tiempos de respuesta. Además, mostramos cómo este modelo puede apoyar las decisiones de aprovisionamiento de recursos con garantías de fiabilidad y tiempo de respuesta.
Título traducido de la contribuciónMejora de la fiabilidad y los tiempos de respuesta mediante la replicación en clústeres informáticos
Idioma originalInglés estadounidense
Título de la publicación alojada2015 IEEE Conference on Computer Communications, IEEE INFOCOM 2015
EditorialInstitute of Electrical and Electronics Engineers Inc.
Páginas1355-1363
Número de páginas9
Volumen26
ISBN (versión digital)9781479983810
DOI
EstadoPublicada - ago. 21 2015
Publicado de forma externa
Evento34th IEEE Annual Conference on Computer Communications and Networks, IEEE INFOCOM 2015 - Hong Kong, Hong Kong
Duración: abr. 26 2015may. 1 2015

Conferencia

Conferencia34th IEEE Annual Conference on Computer Communications and Networks, IEEE INFOCOM 2015
País/TerritorioHong Kong
CiudadHong Kong
Período4/26/155/1/15

Áreas temáticas de ASJC Scopus

  • Ciencia de la Computación General
  • Ingeniería eléctrica y electrónica

Huella

Profundice en los temas de investigación de 'Mejora de la fiabilidad y los tiempos de respuesta mediante la replicación en clústeres informáticos'. En conjunto forman una huella única.

Citar esto