A aprendizagem colaborativa surgiu como um meio de treinamento colaborativo entre instituições médicas, mantendo a privacidade dos dados. No entanto, a natureza dos dados não IID, que decorre da diversidade de conhecimentos institucionais e dos censos regionais, coloca desafios significativos. Essa diversidade leva ao desempenho e à eficiência do modelo global. Os métodos de aprendizagem integrados existentes abordam principalmente este problema através da utilização de abordagens orientadas para modelos, tais como a mudança de práticas de formação locais ou de estratégias globais. No entanto, estas soluções muitas vezes oferecem poucas melhorias e requerem comunicação constante, o que aumenta os custos e levanta preocupações com a privacidade. Como resultado, há uma necessidade crescente de métodos de comunicação robustos e eficientes que possam lidar eficazmente com situações complexas não relacionadas com o IID.
Recentemente, métodos de aprendizagem integrados centrados em dados têm recebido atenção para reduzir a fragmentação no nível dos dados, combinando e compartilhando dados virtuais. Esses métodos, incluindo FedGen, FedMix e FedGAN, tentam medir dados reais, gerar representações visuais ou compartilhar dados treinados por GANs. No entanto, enfrentam desafios como dados agregados de baixa qualidade e informações redundantes. Por exemplo, os métodos de agregação podem distorcer os dados, e a selecção aleatória da agregação de dados conduz frequentemente a actualizações redundantes e sem sentido no modelo global. Além disso, outros métodos introduzem riscos de privacidade e permanecem ineficazes num ambiente com restrições de comunicação. A resolução destas questões requer técnicas de integração melhoradas que garantam dados de alta qualidade, reduzam a redundância e melhorem a extracção de informações, permitindo um melhor desempenho em condições não IID.
Pesquisadores da Universidade de Pequim propõem o FedVCK (Aprendizagem Federada com Informações de Valor Reduzido), um método de aprendizagem integrado orientado a dados projetado para análise colaborativa de imagens médicas. O FedVCK aborda os desafios não relacionados ao IID e reduz os custos de comunicação ao resumir os dados de cada cliente em um conjunto de dados pequeno e de alta qualidade usando restrições de distribuição implícitas. Uma abordagem baseada em modelos garante que apenas informações relevantes e inequívocas sejam selecionadas. No lado do servidor, o aprendizado supervisionado de variáveis melhora as atualizações do modelo global, identificando classes robustas incorretas. Experimentos mostram que o FedVCK supera os métodos de última geração em precisão de previsão, eficiência de comunicação e preservação de privacidade, mesmo sob orçamentos de comunicação limitados e condições severas de não IID.
FedVCK é uma estrutura de aprendizagem integrada que consiste em dois componentes principais: abstração de informações do lado do cliente e aprendizagem supervisionada do lado do servidor. Do lado do cliente, utiliza técnicas de estimativa de distribuição para condensar informações valiosas de dados espaciais em um pequeno conjunto de dados legível, guiado por restrições sutis de distribuição e amostragem crítica de amostras difíceis de prever. Isto garante que o conjunto de dados resumido aborda lacunas no modelo global. O modelo internacional é atualizado no lado do servidor usando perda de entropia cruzada e aprendizado variável baseado em protótipo. Ele melhora a separação de classes sincronizando recursos com seus protótipos e removendo-os de classes negativas e rígidas. Este processo iterativo melhora o desempenho.
O método FedVCK proposto é um método de aprendizagem de agrupamento de dados projetado para enfrentar os desafios da distribuição de dados não-IID na análise colaborativa de imagens médicas. Ele foi testado em vários conjuntos de dados, incluindo patologia do cólon, varreduras de retina OCT, tomografias computadorizadas abdominais, radiografias de tórax e conjuntos de dados comuns, como CIFAR10 e ImageNette, combinando várias resoluções e métodos. O teste mostrou a precisão superior do FedVCK em todos os conjuntos de dados em comparação com os nove métodos de aprendizagem combinados. Ao contrário dos métodos centrados em modelos, que mostraram desempenho medíocre, ou dos métodos centrados em dados, que lutavam com a qualidade da integração e do escalonamento, o FedVCK resumiu com sucesso informações de alta qualidade para melhorar o desempenho dos modelos globais, mantendo ao mesmo tempo baixo custo de comunicação e robustez sob condições severas. condições não-IID. .
O método também mostrou preservação significativa da privacidade, conforme evidenciado pelo teste de ataques hipotéticos de adesão, onde superou métodos convencionais como o FedAvg. Com menos rodadas de comunicação, o FedVCK reduziu o risco de ataques temporários, proporcionando melhores níveis de proteção. Além disso, estudos de desconto confirmaram a eficácia dos seus componentes principais, como a seleção guiada por modelo, que melhorou a sumarização da informação de vários conjuntos de dados. A extensão dos seus testes a conjuntos de dados naturais confirmou ainda mais a sua generalidade e robustez. O trabalho futuro visa aumentar o desempenho do FedVCK em métodos de dados adicionais, incluindo tomografias computadorizadas 3D, e melhorar as técnicas de resumo para maior eficiência e eficácia.
Confira eu Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Não se esqueça de participar do nosso SubReddit de 60k + ML.
🚨 Tendências: LG AI Research Release EXAONE 3.5: Modelos de três níveis de IA bilíngue de código aberto oferecem seguimento de comando incomparável e insights profundos de conteúdo Liderança global em excelência em IA generativa….
Sana Hassan, estagiária de consultoria na Marktechpost e estudante de pós-graduação dupla no IIT Madras, é apaixonada pelo uso de tecnologia e IA para enfrentar desafios do mundo real. Com um profundo interesse em resolver problemas do mundo real, ele traz uma nova perspectiva para a intersecção entre IA e soluções da vida real.
🧵🧵 [Download] Avaliação do relatório de trauma do modelo de linguagem principal (estendido)