On the latency-accuracy tradeoff in approximate MapReduce jobs

Título traducido de la contribución: Sobre la compensación de latencia y precisión en los trabajos aproximados de MapReduce

Juan F. Perez, Robert Birke, Lydia Y. Chen

Resultado de la investigación: Capítulo en Libro/Reporte/ConferenciaContribución a la conferencia

4 Citas (Scopus)

Resumen

Para asegurar la escalabilidad de los grandes análisis de datos, las plataformas MapReduce aproximadas emergen para intercambiar explícitamente la precisión por la latencia. Un paso clave para determinar los niveles óptimos de aproximación es capturar la latencia de los grandes trabajos de datos, que durante mucho tiempo se ha considerado un reto debido a la compleja dependencia entre las entradas de datos y las tareas de mapeo/reducción. En este trabajo, utilizamos métodos analíticos matriciales para derivar modelos estocásticos que pueden predecir un amplio espectro de métricas de latencia, por ejemplo, promedio, colas y distribuciones, para trabajos aproximados de MapReduce que están sujetos a estrategias de muestreo de entrada y reducción de tareas. Además de capturar la dependencia entre las oleadas de tareas de mapas/reducir, nuestros modelos incorporan dos políticas de programación de trabajos, a saber, exclusivas y superpuestas, y dos estrategias de eliminación de tareas, a saber, temprana y rezagada, lo que nos permite evaluar de manera realista las ganancias potenciales de rendimiento de la computación aproximada. Nuestro análisis numérico muestra que los modelos propuestos pueden guiar a las grandes plataformas de datos para determinar las estrategias de aproximación óptimas y los grados de aproximación.
Título traducido de la contribuciónSobre la compensación de latencia y precisión en los trabajos aproximados de MapReduce
Idioma originalInglés estadounidense
Título de la publicación alojadaINFOCOM 2017 - IEEE Conference on Computer Communications
EditorialInstitute of Electrical and Electronics Engineers Inc.
ISBN (versión digital)9781509053360
DOI
EstadoPublicada - oct 2 2017
Evento2017 IEEE Conference on Computer Communications, INFOCOM 2017 - Atlanta, Estados Unidos
Duración: may 1 2017may 4 2017

Conferencia

Conferencia2017 IEEE Conference on Computer Communications, INFOCOM 2017
PaísEstados Unidos
CiudadAtlanta
Período5/1/175/4/17

All Science Journal Classification (ASJC) codes

  • Informática (todo)
  • Ingeniería eléctrica y electrónica

Huella Profundice en los temas de investigación de 'Sobre la compensación de latencia y precisión en los trabajos aproximados de MapReduce'. En conjunto forman una huella única.

Citar esto