ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS
Apresentação de Monografia |
A Escola Nacional de Ciências Estatísticas convida para a defesa de Monografia da Graduação intitulada: “CLUSTERIZAÇÃO ESPECTRAL APLICADA A REDES DE ESTRUTURA PROTEICA”
Aluno: Jean Jaime Dutra de Andrade Maria
Orientadora: Carla Silva Oliveira (ENCE/IBGE)
Coorientador: José André de Moura Brito (ENCE/IBGE)
Data: 03 de julho de 2026 – Sexta-feira
Horário: 13h30m
Local: Rua André Cavalcanti, 106, sala 306 (auditório) – ENCE
Resumo: A análise da arquitetura e da dinâmica de proteínas constitui um desafio da bioinformática estrutural, no qual a representação de estruturas biológicas como Redes de Estrutura Proteica (PSN) tem se consolidado como abordagem eficaz. Tais redes, contudo, são densas e marcadas pela presença de vértices de grau elevado (hubs), que distorcem o espaço de projeção dos métodos tradicionais de clusterização espectral, produzindo agrupamentos, ou partições, incoerentes. Este trabalho propõe a aplicação de um método de clusterização espectral hierárquico, fundamentado na matriz Laplaciana sem sinal normalizada (Qn), à identificação de comunidades estruturais e domínios dinâmicos em PSN construídas com o pacote Bio3D. O procedimento consiste em extrair a matriz de correlação cruzada dinâmica (DCCM) de proteínas globulares por Análise de Modos Normais (NMA), construir a rede mediante filtragem estatística das correlações, derivar os operadores Laplacianos e particionar o grafo por bipartições sucessivas, com base no diâmetro dos grupos gerados. O desempenho de Qn é comparado ao de métodos consolidados, como as matrizes L, Ln e Q, o k-means espectral, o Walktrap e a função cna() do Bio3D, adotando-se a modularidade de Newman e o coeficiente médio de silhueta como alguns dos critérios quantitativos de validação, além da verificação da coerência biológica das partições. Em prova de conceito conduzida sobre a HIV-1 protease (PDB: 1HVP), o método Qn recuperou de forma praticamente exata a fronteira entre as duas subunidades da proteína, com desempenho estatisticamente equivalente ao das formulações L e Ln e marcadamente superior ao da matriz Q não normalizada. Espera-se que a aplicação do procedimento a um conjunto ampliado de proteínas globulares, com fronteiras de domínio menos evidentes, evidencie as vantagens específicas de Qn e consolide essa formulação como alternativa estatisticamente robusta para a análise de redes de estrutura proteica.
Palavras-chave: clusterização espectral; redes de estrutura proteica; matriz Laplaciana sem sinal normalizada; teoria espectral de grafos; Bio3D.
Banca examinadora:
Carla Silva Oliveira (ENCE/IBGE) – Orientadora
José André de Moura Brito (ENCE/IBGE) – Coorientador
Gustavo da Silva Ferreira (ENCE/IBGE)
Coordenação de Graduação
Renata Pacheco Nogueira Duarte