Aprenda avaliar a qualidade do seu agente de AI, RAG e LLM
Dev.to AI
•
Generative AI
Introdução Exatamente hoje 19/04/2025 eu venho acompanhando ou pelo menos tentando acompanhar as novidades dos Harness, protocolos, novas versões de LLM e frameworks. Porém trabalhando e conversando com a comunidade eu percebi uma certa despreocupação e desconhecimento sobre os "evals" que nada mais são que testes onde você coloca métricas em qual quer etapa de qualquer projeto relacionado a AI e toma decisões de ajustes e mudanças...