Activities per year
Abstract
Una dificultad común en el análisis de datos es cómo manejar predictores categóricos con una gran cantidad de niveles o categorías. Se han desarrollado pocas propuestas para abordar este importante y frecuente problema. Introducimos un modelo generativo que realiza simultáneamente el ajuste del modelo y la agregación de los niveles categóricos en grupos más grandes. Representamos el predictor categórico por un gráfico donde los nodos son las categorías y establecemos una distribución de probabilidad sobre particiones significativas de este gráfico. Condicionalmente a los datos observados, obtenemos una distribución posterior para la agregación de niveles, lo que permite inferir sobre el agrupamiento más probable para las categorías. Simultáneamente, extraemos inferencias sobre todos los demás parámetros del modelo de regresión. Comparamos nuestros métodos con los de última generación y demostramos que tiene un rendimiento predictivo igualmente bueno y resultados más interpretables. Nuestro enfoque equilibra la precisión frente a la interpretabilidad, una preocupación importante actual en estadísticas y aprendizaje automático.
Translated title of the contribution | Manejo de características categóricas con muchos niveles utilizando un modelo de partición de productos |
---|---|
Original language | English (US) |
Article number | 1 |
Pages (from-to) | 786 |
Number of pages | 814 |
Journal | Annals of Applied Statistics |
Volume | 17 |
Issue number | 1 |
DOIs | |
State | Published - Jan 25 2023 |
Activities
- 3 Oral presentation
-
Inducing high spatial correlation with randomly edge-weighted neighborhood graphs.
Danna Lesley Cruz Reyes (Organizer)
Jun 26 2022Activity: Talk types › Oral presentation
-
Inducing high spatial correlation with randomly edge-weighted neighborhood graphs.
Danna Lesley Cruz Reyes (Organizer)
Jul 31 2022Activity: Talk types › Oral presentation
-
Inducing high spatial correlation with randomly edge-weighted neighborhood graphs.
Danna Lesley Cruz Reyes (Speaker)
Mar 18 2022Activity: Talk types › Oral presentation