Diseño e implementación de algoritmo para la operación join estrella sobre un data warehouse en postgresql
Tipo de material:![Texto](/opac-tmpl/lib/famfamfam/BK.png)
Tipo de ítem | Biblioteca actual | Colección | número de clasificación | Copia número | Estado | Fecha de vencimiento | Código de barras |
---|---|---|---|---|---|---|---|
![]() |
Biblioteca Central | Memorias | M 006.3 C831 (Navegar estantería(Abre debajo)) | 1 | Disponible | 3560900205239 |
CD Rom incluye tesis en formato PDF
Tesis (Ing. civil Informática) -- Prof. guía: Cecilia Reyes Covarrubias -- Prof. Corref.: José Luis Marti Lara
h. 87
[Resumen del autor]
El Data Warehouse ha alcanzado volúmenes de datos del orden de los Exabytes (EB). Con tales volúmenes de datos, la operación Join Estrella debe procesar cientos de millones de registros, por lo cual el desempeño de los algoritmos que procesan esta operación es crucial para el campo de la Inteligencia de Negocios. Entre los algoritmos implementados actualmente para procesar la operación Join en PostgreSQL, el algoritmo Hybrid Hash Join presenta el mejor desempeño para consultas de tipo Join Estrella. Sin embargo, al procesar grandes volúmenes de datos requiere un uso excesivo del input/output sobre memoria secundaria, lo cual afecta el desempeño global de la operación. Durante el desarrollo de esta memoria, se presentan los distintos algoritmos implementados actualmente para procesar la operación Join en diferentes sistemas de bases de datos relaciónales. Luego, se propone el diseño e implementación de un nuevo algoritmo en PostgreSQL, que utiliza Bits Füter para filtrar las tupias de la tabla de hechos que no formarán parte del resultado antes de ser enviadas a memoria secundaria, para así disminuir el tiempo global de ejecución de la operación Join Estrella. Finalmente, se realiza una evaluación del desempeño de la implementación propuesta con respecto a la actual implementación que provee PostgreSQL y SQL Server utilizando el Data Warehouse Star Schema Benchmark. Los resultados indican que la implementación propuesta presenta un desempeño supeƠrior respecto a la implementación actual de PostgreSQL. Mientras que se obtuvo resultados similares a SQL Server en consultas de baja selectividad, debido a la introducción de los bits fílters que producen una disminución en la tasa de lectura y escritura en memoria secundaria.
2