@PHDTHESIS{ 2025:83645543, title = {Exploring Efficient Gene Set Alternatives for Improved Breast Cancer Subtype Classification}, year = {2025}, url = "https://tede.ufam.edu.br/handle/tede/11320", abstract = "Nos últimos anos, os avanços na pesquisa sobre o câncer de mama destacaram a necessidade de métodos mais eficientes para lidar com a vasta quantidade de dados genômicos associados aos seus diversos subtipos. A assinatura gênica PAM50, embora bem-sucedida como uma ferramenta prognóstica, apresenta desafios devido à sua dependência de um grande número de genes, impactando tanto o custo quanto a complexidade. Esta tese tem como objetivo explorar conjuntos de genes alternativos para a classificação dos subtipos de câncer de mama que mantenham ou melhorem a precisão da assinatura PAM50. Nossa pesquisa começa com o método "Few-Shot Genes Selection", que foi especificamente desenvolvido para confrontar a assinatura gênica PAM50. Ao identificar e avaliar subconjuntos menores dentro da própria seleção de genes do PAM50, demonstramos que, mesmo com um número reduzido dos mesmos genes, é possível alcançar um desempenho de classificação igual ou superior. Essa descoberta desafia a noção de que um conjunto maior de genes é inerentemente melhor, mostrando que subconjuntos mais enxutos podem ser igualmente eficazes. Com base nisso, exploramos uma nova abordagem com o segundo foco de pesquisa, ``Using Multi-layer Classification to Improve Worst Prognosis Breast Cancer Subtypes Outcomes''. Esse método busca identificar conjuntos de genes alternativos, distintos dos presentes no PAM50, mas com ênfase específica em melhorar a precisão da classificação para os subtipos de pior prognóstico, como Basal e Her2. Através de uma estrutura de classificação hierárquica, buscamos aprimorar os resultados para esses subtipos selecionando genes que sejam mais preditivos de casos de pior prognóstico. Em conclusão, esta tese demonstra que, refinando assinaturas gênicas existentes ou descobrindo novos conjuntos de genes, podemos desenvolver ferramentas mais eficientes para a classificação do câncer de mama. Esta pesquisa contribui para o esforço contínuo de melhorar a precisão diagnóstica e os resultados do tratamento em ambientes clínicos, particularmente para aqueles subtipos com os prognósticos mais desafiadores.", publisher = {Universidade Federal do Amazonas}, scholl = {Programa de Pós-graduação em Informática}, note = {Instituto de Computação} }