
IA
BioMysteryBench: Claude iguala a expertos en bioinformática
Anthropic publicó un benchmark con 99 preguntas escritas por especialistas y respuestas verificables sobre datasets reales. Claude Mythos Preview alcanza 82.6% en problemas resolubles por humanos.
The Decoder