Pesquisadores de segurança cibernética revelaram uma nova técnica de jailbreak que pode ser usada para contornar os rastros de segurança de um modelo de linguagem em larga escala (LLM) e gerar respostas potencialmente maliciosas ou maliciosas. A estratégia de ataque multi-shot (também conhecida como many-shot) recebeu o codinome Bad Likert Judge pelos pesquisadores da Unidade 42 da Palo Alto Networks, Yongzhe Huang, Yang Ji, Wenjun Hu, Jay Chen, Akshata Rao, uma vez
Source link