???jsp.display-item.social.title??? |
![]() ![]() |
Please use this identifier to cite or link to this item:
https://tede.ufam.edu.br/handle/tede/10468
???metadata.dc.type???: | Tese |
Title: | Bayesian and neural ranking approaches for supporting schema references in keyword queries over relational databases |
Other Titles: | Abordagens de ranqueamento bayesianas e neurais para suporte a referências de esquemas em consultas por palavra-chave sobre bancos de dados relacionais |
???metadata.dc.creator???: | Martins, Paulo Rodrigo Oliveira ![]() |
???metadata.dc.contributor.advisor1???: | Silva, Altigran Soares da |
???metadata.dc.contributor.referee1???: | Almeida, Eduardo Cunha de |
???metadata.dc.contributor.referee2???: | Moura, Edleno Silva |
???metadata.dc.contributor.referee3???: | Cavalcanti, João Marcos Bastos |
???metadata.dc.contributor.referee4???: | Silva, Johny Moreira da |
???metadata.dc.description.resumo???: | Sistemas de Busca por Palavra-Chave em Banco de Dados Relacional (R-KwS) permitem que usuários leigos ou informais explorem e recuperem informações de bancos de dados relacionais sem precisar conhecer detalhes do esquema ou linguagens de consulta. Esses sistemas utilizam as palavras-chave da consulta de entrada, localizam os elementos do banco de dados que correspondem a essas palavras-chave e buscam maneiras de “conectar” esses elementos usando informações sobre restrições de integridade referencial, isto é, o par chave/chave estrangeira. Embora vários desses sistemas tenham sido propostos na literatura, a maioria deles suporta apenas consultas cujas palavras-chave se referem ao conteúdo do banco de dados. Poucos sistemas oferecem suporte a consultas em que as palavras-chave se referem a elementos do esquema do banco de dados. Neste trabalho, propomos o Lathe, um novo R-KwS projetado para suportar esse tipo de consulta. Para isso, primeiro generalizamos os conceitos conhecidos de Query Matches (QMs) e Candidate Joining Networks (CJNs) para lidar com palavras-chave que se referem a elementos do esquema e propomos novos algoritmos para gerá-los. Em seguida, introduzimos uma abordagem para selecionar automaticamente as CJNs que têm maior probabilidade de representar a intenção do usuário ao fazer uma consulta por palavras-chave. Nossas principais contribuições incluem um novo algoritmo de ranqueamento de QMs bayesiano, que prioriza QMs relevantes, evitando o processamento de respostas menos prováveis; um algoritmo de ranqueamento de CJNs também bayesiano que utiliza o ranqueamento de QMs para priorizar e avaliar CJNs relevantes; uma estratégia de eager evaluation que descarta CJNs espúrias logo que são criadas; e uma nova abordagem neural baseada em transformers para ranqueamento de QMs e CJNs, resultando em melhorias em métricas como recall e R@k. Apresentamos um conjunto abrangente de experimentos realizados com conjuntos de consultas e dados previamente utilizados em experimentos com sistemas e métodos de R-KwS de última geração. Nossos resultados indicam que o Lathe é capaz de lidar com uma variedade maior de consultas por palavras-chave, mantendo-se altamente eficaz, mesmo para grandes bancos de dados com esquemas complexos. Além disso, desenvolvemos o PyLatheDB, uma biblioteca Python para Busca por Palavra-Chave em Banco de Dados Relacional que implementa o Lathe. |
Abstract: | Relational Keyword Search (R-KwS) systems enable naive/informal users to explore and retrieve information from relational databases without knowing schema details or query languages. These systems take the keywords from the input query, locate the elements of the target database that correspond to these keywords, and look for ways to “connect” these elements using information on referential integrity constraints, i.e., key/foreign key pairs. Although several such systems have been proposed in the literature, most of them only support queries whose keywords refer to the contents of the target database. Very few support queries in which keywords refer to elements of the database schema. In this work, we propose Lathe, a novel R-KwS designed to support such queries. To this end, we first generalize the well-known concepts of Query Matches (QMs) and Candidate Joining Networks (CJNs) to handle keywords referring to schema elements and propose new algorithms to generate them. Then, we introduce an approach to automatically select the CJNs that are more likely to represent the user intent when issuing a keyword query. Our key contributions are a novel Bayesian-based QM ranking algorithm that prioritizes relevant QMs, avoiding the processing of less likely answers, an effective Bayesian CJN ranking algorithm leveraging QM rankings to prioritize and evaluate relevant CJNs, an eager CJN evaluation strategy that discards spurious CJNs early, and a novel transformer-based neural approach for QM ranking and CJN ranking, leading to improved results on metrics such as recall and R@k. We present a comprehensive set of experiments performed with query sets and datasets previously used in experiments with state-of-the-art R-KwS systems and methods. Our results indicate that Lathe can handle a wider variety of keyword queries while remaining highly effective, even for large databases with intricate schemas. Additionally, we developed PyLatheDB, a Python library for Relational Keyword Search that implements Lathe. |
Keywords: | Informática - Banco de dados Banco de dados relacionais Recuperação da informação |
???metadata.dc.subject.cnpq???: | CIENCIAS EXATAS E DA TERRA: CIENCIA DA COMPUTACAO: METODOLOGIA E TECNICAS DA COMPUTACAO: BANCO DE DADOS |
???metadata.dc.subject.user???: | Keyword search Database systems Schema mapping Keyword search over relation databases Schema graph |
Language: | eng |
???metadata.dc.publisher.country???: | Brasil |
Publisher: | Universidade Federal do Amazonas |
???metadata.dc.publisher.initials???: | UFAM |
???metadata.dc.publisher.department???: | Instituto de Computação |
???metadata.dc.publisher.program???: | Programa de Pós-graduação em Informática |
Citation: | MARTINS, Paulo Rodrigo Oliveira. Bayesian and neural ranking approaches for supporting schema references in keyword queries over relational databases. 2024. 112 f. Tese (Doutorado em Informática) - Universidade Federal do Amazonas, Manaus, 2024. |
???metadata.dc.rights???: | Acesso Aberto |
???metadata.dc.rights.uri???: | https://creativecommons.org/licenses/by-nc-nd/4.0/ |
URI: | https://tede.ufam.edu.br/handle/tede/10468 |
Issue Date: | 16-Aug-2024 |
Appears in Collections: | Doutorado em Informática |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Tese_PauloMartins_PPGI.pdf | 2.65 MB | Adobe PDF | ![]() Download/Open Preview |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.