Diseño e implementación de algoritmo para la operación join estrella sobre un data warehouse en postgresql

Por: Cortés Cortés, Rudyar FabiánColaborador(es): Reyes Covarrubias, Cecilia (Comisión de tesis) [, prof. guía] | Marti Lara, José Luis (Comisión de tesis) [, prof. corref.] | UTFSM. Departamento de Informática (1994-) Departamento de Informática (1994 -)Tipo de material: TextoTextoDetalles de publicación: Valparaíso: UTFSM, 2011Descripción: xii, 88 h.: ilTema(s): DATOS DE ALMACENAJE | MINERIA DE DATOS | BC / MEM (memorias UTFSM con resúmenes) | ADMINISTRACION DE BASES DE DATOSClasificación CDD: M 006.3 Nota de disertación: Tesis (Ing. civil Informática) -- Prof. guía: Cecilia Reyes Covarrubias -- Prof. Corref.: José Luis Marti Lara Resumen: [Resumen del autor]Resumen: El Data Warehouse ha alcanzado volúmenes de datos del orden de los Exabytes (EB). Con tales volúmenes de datos, la operación Join Estrella debe procesar cientos de millones de registros, por lo cual el desempeño de los algoritmos que procesan esta operación es crucial para el campo de la Inteligencia de Negocios. Entre los algoritmos implementados actualmente para procesar la operación Join en PostgreSQL, el algoritmo Hybrid Hash Join presenta el mejor desempeño para consultas de tipo Join Estrella. Sin embargo, al procesar grandes volúmenes de datos requiere un uso excesivo del input/output sobre memoria secundaria, lo cual afecta el desempeño global de la operación. Durante el desarrollo de esta memoria, se presentan los distintos algoritmos implementados actualmente para procesar la operación Join en diferentes sistemas de bases de datos relaciónales. Luego, se propone el diseño e implementación de un nuevo algoritmo en PostgreSQL, que utiliza Bits Füter para filtrar las tupias de la tabla de hechos que no formarán parte del resultado antes de ser enviadas a memoria secundaria, para así disminuir el tiempo global de ejecución de la operación Join Estrella. Finalmente, se realiza una evaluación del desempeño de la implementación propuesta con respecto a la actual implementación que provee PostgreSQL y SQL Server utilizando el Data Warehouse Star Schema Benchmark. Los resultados indican que la implementación propuesta presenta un desempeño supeƠrior respecto a la implementación actual de PostgreSQL. Mientras que se obtuvo resultados similares a SQL Server en consultas de baja selectividad, debido a la introducción de los bits fílters que producen una disminución en la tasa de lectura y escritura en memoria secundaria.
Etiquetas de esta biblioteca: No hay etiquetas de esta biblioteca para este título. Ingresar para agregar etiquetas.
Valoración
    Valoración media: 0.0 (0 votos)
Existencias
Tipo de ítem Biblioteca actual Colección número de clasificación Copia número Estado Fecha de vencimiento Código de barras
Memorias Memorias Biblioteca Central
Memorias M 006.3 C831 (Navegar estantería(Abre debajo)) 1 Disponible 3560900205239

CD Rom incluye tesis en formato PDF

Tesis (Ing. civil Informática) -- Prof. guía: Cecilia Reyes Covarrubias -- Prof. Corref.: José Luis Marti Lara

h. 87

[Resumen del autor]

El Data Warehouse ha alcanzado volúmenes de datos del orden de los Exabytes (EB). Con tales volúmenes de datos, la operación Join Estrella debe procesar cientos de millones de registros, por lo cual el desempeño de los algoritmos que procesan esta operación es crucial para el campo de la Inteligencia de Negocios. Entre los algoritmos implementados actualmente para procesar la operación Join en PostgreSQL, el algoritmo Hybrid Hash Join presenta el mejor desempeño para consultas de tipo Join Estrella. Sin embargo, al procesar grandes volúmenes de datos requiere un uso excesivo del input/output sobre memoria secundaria, lo cual afecta el desempeño global de la operación. Durante el desarrollo de esta memoria, se presentan los distintos algoritmos implementados actualmente para procesar la operación Join en diferentes sistemas de bases de datos relaciónales. Luego, se propone el diseño e implementación de un nuevo algoritmo en PostgreSQL, que utiliza Bits Füter para filtrar las tupias de la tabla de hechos que no formarán parte del resultado antes de ser enviadas a memoria secundaria, para así disminuir el tiempo global de ejecución de la operación Join Estrella. Finalmente, se realiza una evaluación del desempeño de la implementación propuesta con respecto a la actual implementación que provee PostgreSQL y SQL Server utilizando el Data Warehouse Star Schema Benchmark. Los resultados indican que la implementación propuesta presenta un desempeño supeƠrior respecto a la implementación actual de PostgreSQL. Mientras que se obtuvo resultados similares a SQL Server en consultas de baja selectividad, debido a la introducción de los bits fílters que producen una disminución en la tasa de lectura y escritura en memoria secundaria.

2