#evaluation
5 éléments
snippet
xgboost: métrique personnalisée (feval)
Définir une métrique d'évaluation custom pour xgb.train.
ouvrir
article
Faire évaluer un LLM par un autre LLM, la nouvelle frontière du testing
Quand un modèle puissant devient juge de la qualité des autres. Retours sur l'approche 'LLM-as-a-judge' et ses limites.
ouvrir
article
Evaluation d'impact IA RMF et mesures
Structurer vos evaluations de risques et vos tests de securite et d'equite.
ouvrir
article
Évaluer les LLM métriques et protocoles
Du offline au online: exactitude, utilité, sécurité et coûts de réponse.
ouvrir
article
Guide pratique de prompt engineering
Structurer, contraindre et tester vos prompts pour des réponses utiles et stables.
ouvrir
page 1 sur 1