Aplicações sensíveis ao ser humano, como reconhecimento de atividades, detecção de quedas e monitoramento de saúde, foram revolucionadas pelos avanços na inteligência artificial (IA) e nas tecnologias de aprendizado de máquina. Estas aplicações podem afetar significativamente a gestão da saúde, monitorizando o comportamento humano e fornecendo dados valiosos para avaliações de saúde. No entanto, devido à variabilidade do comportamento individual, aos fatores ambientais e à localização física dos dispositivos, o desempenho dos modelos convencionais de IA é frequentemente prejudicado. Isto é especialmente problemático quando tais modelos experimentam uma mudança na distribuição dos dados do sensor, pois a variação causa uma incompatibilidade entre as condições de treinamento e as condições de teste. A personalização é, portanto, necessária para adaptar estes modelos a padrões específicos do utilizador, tornando-os mais eficazes e fiáveis na utilização no mundo real.
O principal problema que os investigadores pretendem abordar é o desafio de ajustar os modelos de IA aos utilizadores individuais quando há dados limitados disponíveis ou quando os dados recolhidos mostram variabilidade devido a mudanças nas condições externas. Embora sejam capazes de generalizar para a maioria das pessoas, os modelos gerais tendem a falhar quando lidam com diferenças específicas do utilizador, tais como mudanças nos padrões de movimento, características da fala ou indicadores de saúde. Este problema é particularmente grave em ambientes de cuidados de saúde onde a falta de dados é comum e as características únicas dos pacientes são frequentemente sub-representadas nos dados de formação. Além disso, a variabilidade interna do utilizador em todas as diferentes condições leva a uma falta de generalização, o que é importante para aplicações como a monitorização da saúde, onde as condições físicas podem mudar significativamente ao longo do tempo devido à progressão da doença ou à intervenção médica.
Vários métodos foram propostos para personalizar modelos, incluindo técnicas de personalização contínua e estática. A personalização contínua envolve a atualização do modelo com base nos dados recém-adquiridos. No entanto, obter a verdade desses dados em aplicações de saúde pode ser difícil e requer monitoramento clínico constante, tornando esta abordagem impraticável para implantações em tempo real ou em grande escala. Por outro lado, a personalização estática ocorre durante o registo do utilizador utilizando um conjunto de dados inicial limitado. Embora isso reduza a sobrecarga computacional e reduza o envolvimento do usuário, muitas vezes resulta em modelos que não se ajustam bem às condições que não foram observadas durante a fase inicial de registro.
Pesquisadores da Syracuse University e da Arizona State University introduziram um novo método chamado CRoP (Personalização Inteligente de Contexto da Audição Humana). Essa abordagem usa modelos prontos para uso pré-treinados e os adapta usando técnicas de poda para enfrentar o desafio da variabilidade interna do usuário. A abordagem CRoP é única no uso de poda de modelo, que envolve a remoção de parâmetros insuficientes de um modelo personalizado e sua substituição por um modelo padrão. Essa técnica ajuda a preservar a capacidade do modelo customizado de generalizar para diferentes contextos não observados, ao mesmo tempo que garante alto desempenho no contexto em que foi treinado. Usando este método, os pesquisadores podem criar modelos estáticos feitos pelo homem que funcionam dinamicamente mesmo quando as condições externas do usuário mudam drasticamente.
A abordagem CRoP começa pela preparação de um modelo geral utilizando dados limitados recolhidos durante o registo inicial do utilizador. Este modelo personalizado é então podado para identificar e remover parâmetros redundantes que não contribuem significativamente para a compreensão do modelo do contexto determinado. Em seguida, os parâmetros truncados são substituídos pelos parâmetros correspondentes do modelo padrão, o que efetivamente restaura a integridade do modelo. A etapa final envolve o ajuste fino do modelo híbrido aos dados disponíveis do usuário para melhorar o desempenho. Este processo de três etapas garante que o modelo personalizado retém a capacidade de generalizar para todas as situações abstratas sem comprometer o seu desempenho no contexto em que foi treinado.
Os pesquisadores testaram o método em quatro conjuntos de dados de sensores humanos: o conjunto de dados de terapia da fala clínica PERCERT-R, o conjunto de dados de reconhecimento de tarefas baseado em WiFi WIDAR, o conjunto de dados de sensores móveis ExtraSensory e o conjunto de dados de detecção de estresse coletados por meio de sensores vestíveis. Os resultados mostram que o CRoP alcançou uma precisão de personalização de 35,23% em comparação com os modelos convencionais e uma melhoria de 7,78% na generalização em comparação com os métodos de correção convencionais. Especificamente, para o conjunto de dados WIDAR, o CRoP melhorou a precisão de 63,90% para 87,06% no caso principal, mantendo baixa degradação de desempenho nos casos invisíveis, o que mostra sua robustez na adaptação às diversas situações do usuário. Da mesma forma, para o conjunto de dados PERCEPT-R, o CRoP produziu uma precisão de 67,81% no contexto original e manteve uma estabilidade de desempenho de 13,81% nas condições invisíveis.
A pesquisa mostra que os modelos CRoP são mais eficazes do que os métodos convencionais como SHOT, PackNet, Piggyback e CoTTA na personalização e generalização. Por exemplo, enquanto o PackNet alcançou apenas uma melhoria de 26,05% na personalização e uma diminuição de -1,39% na generalização, o CRoP proporcionou uma melhoria de 35,23% na personalização e um ganho positivo de 7,78% na generalização. Isto mostra que o método CRoP de combinar técnicas de poda e restauração é muito eficaz no tratamento das mudanças de propagação comuns nos sistemas auditivos humanos.
Principais conclusões do estudo:
- O CRoP aumenta a precisão da personalização em 35,23% em comparação aos modelos convencionais.
- Uma melhoria na normalização de 7,78% é alcançada usando CRoP em relação à correção convencional.
- Para a maioria dos conjuntos de dados, o CRoP supera outros métodos de última geração, como SHOT e CoTTA, em 9-20%.
- O método mantém alto desempenho em todos os diferentes casos com pouca sobrecarga computacional adicional.
- Esta abordagem é mais eficaz em aplicações relacionadas com a saúde, onde as mudanças nas condições do utilizador são frequentes e difíceis de prever.
Concluindo, o CRoP oferece uma solução inovadora para resolver as limitações da personalização estática. Usar modelos prontos para uso e combinar técnicas de poda equilibra efetivamente o compromisso entre personalização e generalização do usuário interno. Esta abordagem aborda a necessidade de modelos personalizados que funcionem bem em todas as diferentes situações, tornando-a particularmente adequada para aplicações críticas como a saúde, onde a robustez e a adaptabilidade são importantes.
Confira Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal..
Não se esqueça de participar do nosso SubReddit de 52k + ML.
Convidamos startups, empresas e institutos de pesquisa que trabalham em modelos de microlinguagem para participar deste próximo projeto Revista/Relatório 'Modelos de Linguagem Pequena' Marketchpost.com. Esta revista/relatório será lançada no final de outubro/início de novembro de 2024. Clique aqui para agendar uma chamada!
Sana Hassan, estagiária de consultoria na Marktechpost e estudante de pós-graduação dupla no IIT Madras, é apaixonada pelo uso de tecnologia e IA para enfrentar desafios do mundo real. Com um profundo interesse em resolver problemas do mundo real, ele traz uma nova perspectiva para a intersecção entre IA e soluções da vida real.