
A inteligência artificial pode resolver problemas a uma velocidade notável, mas são as pessoas que desenvolvem os algoritmos que estão realmente impulsionando a descoberta. Na Universidade do Texas em Arlington, os cientistas de dados estão criando fórmulas sofisticadas que permitem que a IA interprete conjuntos de dados biológicos maciços para descobrir como as doenças começam, como o sistema imunológico responde e quais tratamentos podem funcionar melhor.
Xinlei (Sherry) Wang, Jenkins Garrett Professor de Estatística e Ciência de Dados no Departamento de Matemática de Ut Arlington, recebeu uma concessão federal de quatro anos e US $ 1,28 milhão para avançar seu estudo, “Modelagem Gerativa Estatística e Profunda para a melhor interpretação e descoberta de dados da CYTOF aprimorada”.
O Dr. Wang, que também atua como diretor fundador de pesquisa na divisão de ciência de dados, está liderando os esforços para criar modelos de IA que podem analisar dados biomédicos complexos. Em termos simples, o Cytof é uma tecnologia de laboratório de ponta que verifica milhares de células individuais de uma só vez e mede dezenas de proteínas dentro delas.
O desafio, disse Wang, está apresentando que os dados de uma maneira que outros cientistas podem usar facilmente. É aí que entram sua equipe de estatísticos bayesianos e cientistas de dados. Eles desenvolvem ferramentas bioinformáticas e estatísticas que servem como um “balcão único” para analisar dados do CYTOF.
Usando uma estrutura bayesiana, os pesquisadores estão construindo um único modelo estatístico que produz resultados claros e interpretáveis. Este modelo foi projetado para mostrar como as informações detalhadas de dados da CYTOF da análise de célula única-são geradas, revelando os padrões subjacentes com mais precisão. A IA pode descobrir relacionamentos ocultos nos dados que as pessoas podem perder e fornece resultados muito mais rapidamente.
Sem a IA integrada à nossa estrutura bayesiana, você não poderia escalar e levaria vários dias ou mais para obter resultados. Com a IA, você obtém resultados confiáveis e rigorosos em segundos, mesmo para milhões de células. Modelamos o que sabemos sobre os dados usando modelos bayesianos transparentes para que os parâmetros sejam interpretáveis. Por exemplo, um parâmetro pode indicar aumento da expressão de proteínas no grupo de doenças em comparação com o grupo controle “.
Xinlei (Sherry) Wang, Jenkins Garrett Professor de Estatística e Ciência de Dados, Departamento de Matemática de Ut Arlington
Os algoritmos combinam dados de transcriptômica de célula única sequenciamento de genes de geração-geração-geração com cytof, uma análise detalhada de proteínas de célula única. Juntos, eles fornecem uma imagem mais completa do que está acontecendo dentro das células. Cada célula carrega pistas sobre saúde e doenças que podem levar a melhores tratamentos para doenças como o câncer. O sistema pode analisar milhões de células ao mesmo tempo, cada uma com 40 a 100 expressões de proteínas ou dezenas de milhares de expressões genéticas, identificando diferentes tipos de células e comparando células saudáveis e doentes.
Wang e o trabalho de sua equipe já estão ganhando atenção. Kevin Wang, um recém-formado de doutorado que agora atua como professor assistente de posse da Universidade Davidson, ganhou o prêmio de melhor doutorado na primavera passada por apresentar os resultados preliminares do grupo na Conferência de 2025 dos Estatísticos do Texas.
Além disso, um estudo publicado recentemente em Comunicações da natureza-co-autor de Wang, o pesquisador de pós-doutorado Zeyu Lu e o colega Lin Xu introduziram uma ferramenta chamada identificação bayesiana de reguladores transcricionais de conjuntos de regiões de consulta baseadas na epigenômica, ou bit, para melhorar a precisão da pesquisa de genes de impulso.
Outros membros da equipe de Wang incluem membros da Divisão de Ciência de Dados da UTA; Li Wang, professor associado de matemática; Yike Shen, professor assistente de terra e ciências ambientais; e os pesquisadores do sudoeste da UT Yuqiu Yang e Andy Xiao.
“A IA é poderosa, mas geralmente é uma caixa preta”, disse Wang. “Estamos projetando software de código aberto e fácil de usar para que os usuários finais possam executá-lo em seus laptops. Os algoritmos existentes não podem lidar com o Big Data com eficiência. Combinamos rigor estatístico, quantificação de incerteza e escalabilidade-tudo em uma estrutura”.
Fonte:
Referência do diário:
Lu, Z., et al. (2025). BIT: Identificação bayesiana de reguladores transcricionais de conjuntos de regiões de consulta baseados em epigenômica. Comunicações da natureza. doi.org/10.1038/s41467-025-60269-4