Nova técnica de Jailbreak de IA 'mau juiz Likert' aumenta a taxa de sucesso de ataque em mais de 60%
Cibersegurança

Nova técnica de Jailbreak de IA 'mau juiz Likert' aumenta a taxa de sucesso de ataque em mais de 60%

Pesquisadores de segurança cibernética revelaram uma nova técnica de jailbreak que pode ser usada para contornar os rastros de segurança de um modelo de linguagem em larga escala (LLM) e gerar respostas potencialmente maliciosas ou maliciosas. A estratégia de ataque multi-shot (também conhecida como many-shot) recebeu o codinome Bad Likert Judge pelos pesquisadores da Unidade 42 da Palo Alto Networks, Yongzhe Huang, Yang Ji, Wenjun Hu, Jay Chen, Akshata Rao, uma vez



Source link

Você também pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *