Dual Scaling VMs and Queries: Cost-Effective Latency Curtailment

Título traducido de la contribución: VMs y consultas de doble escala: Reducción de la latencia rentable

Juan F. Perez, Robert Birke, Mathias Bjorkqvist, Lydia Y. Chen

Resultado de la investigación: Capítulo en Libro/Reporte/ConferenciaContribución a la conferencia

3 Citas (Scopus)

Resumen

Las instancias virtuales wimpy equipadas con un pequeño número de núcleos y RAM son ofertas de cloud públicas y privadas populares debido a su bajo coste para aplicaciones de hosting. El desafío es cómo ejecutar aplicaciones sensibles a la latencia utilizando estas instancias, que compensan el rendimiento por el coste. En este estudio, demostramos analítica y experimentalmente que el escalado simultáneo de recursos a granularidad gruesa y cargas de trabajo, es decir, el envío de múltiples clones de consultas a diferentes servidores, a granularidad fina, puede superar las desventajas de rendimiento de las instancias de VM débiles y lograr objetivos de latencia estrictos que son incluso inferiores a los tiempos de ejecución medios de los servidores wimpy. Para tal fin, primero derivamos un análisis de forma cerrada para la latencia bajo cualquier nivel dado de aprovisionamiento de VM y replicación de consultas, considerando políticas de clonación que pueden (no) terminar clones pendientes con (sin) una sobrecarga. Validado en simulaciones basadas en trazas, nuestro análisis es capaz de predecir con precisión la latencia y buscar eficientemente el número óptimo de VMs y clones. En segundo lugar, desarrollamos un escarificador elástico doble, DuoScale, que escala dinámicamente las máquinas virtuales y los clones en función de la dinámica de la carga de trabajo para conseguir la latencia objetivo de una manera rentable. La eficacia de DuoScale radica en la observación de que el rendimiento de la aplicación sólo se escala sublinealmente con el aumento del aprovisionamiento de recursos vertical u horizontal, es decir, recursos por VM o número de VMs. Evaluamos DuoScale contra estrategias de escalado sólo VM a través de extensas simulaciones basadas en trazas, así como resultados experimentales en un banco de pruebas de nubes. Nuestros resultados muestran que DuoScale es capaz de alcanzar la rigurosa latencia objetivo mediante el uso de clones en VMs wimpy con un ahorro de costes de hasta el 50%, en comparación con las VMs más robustas que tienen un mejor rendimiento a un coste unitario más alto.
Idioma originalInglés estadounidense
Título de la publicación alojadaProceedings - IEEE 37th International Conference on Distributed Computing Systems, ICDCS 2017
EditorialInstitute of Electrical and Electronics Engineers Inc.
Páginas988-998
Número de páginas11
ISBN (versión digital)9781538617915
DOI
EstadoPublicada - jul 13 2017
Evento37th IEEE International Conference on Distributed Computing Systems, ICDCS 2017 - Atlanta, Estados Unidos
Duración: jun 5 2017jun 8 2017

Conferencia

Conferencia37th IEEE International Conference on Distributed Computing Systems, ICDCS 2017
PaísEstados Unidos
CiudadAtlanta
Período6/5/176/8/17

    Huella digital

All Science Journal Classification (ASJC) codes

  • Software
  • Hardware y arquitectura
  • Redes de ordenadores y comunicaciones

Citar esto

Perez, J. F., Birke, R., Bjorkqvist, M., & Chen, L. Y. (2017). Dual Scaling VMs and Queries: Cost-Effective Latency Curtailment. En Proceedings - IEEE 37th International Conference on Distributed Computing Systems, ICDCS 2017 (pp. 988-998). [7980040] Institute of Electrical and Electronics Engineers Inc.. https://doi.org/10.1109/ICDCS.2017.231