Anthropic presenta Autoencoders de Lenguaje Natural que convierten las activaciones internas de Claude directamente en explicaciones de texto legibles por humanos.
<meta name=description content=Anthropic traduce las activaciones internas de Claude a explicaciones legibles. Descubre el funcionamiento interno de la IA de forma comprensible.>