Claude Mythos und die Frage, wer entscheidet

Anthropic hat ein neues Modell veröffentlicht, das auf den Namen Claude Mythos Preview hört und nach eigener Aussage ihr bislang fähigstes ist. Du bekommst keinen Zugang dazu, egal ob du Entwickler, Forscher oder ein kleineres Cybersicherheitsunternehmen bist, und das ist keine Kleinigkeit. Was Mythos kann Laut dem System Card, das Anthropic am 7. April 2026 veröffentlicht hat, stellt Claude Mythos Preview einen erheblichen Sprung gegenüber dem Vorgängermodell Claude Opus 4.6 dar. Das Modell zeigt Fähigkeiten in Software Engineering, Reasoning und Wissensarbeit, die substanziell über alle bisherigen Modelle hinausgehen, und Anthropic beschreibt den Leistungsunterschied als “striking leap”, einen auffälligen Sprung, auf vielen Benchmark-Kategorien. ...

April 10, 2026 · blodrevobog

Windeln wechseln oder die Welt verändern?

Franz Kafka hat vor gut 100 Jahren einen Theaterdirektor beschrieben, der so besessen von Kontrolle war, dass er am Ende nur noch Windeln wechselte. Anselm Küster vom Centrum für Europäische Politik hat dieses Bild diese Woche auf netzpolitik.org ausgegraben, um Sam Altmans Fantasie vom Ein-Personen-Unicorn zu widerlegen. Die Kritik ist berechtigt. Die Begründungen nicht. Was die Quellen wirklich sagen Die Apple-Studie “Illusion of Thinking” soll zeigen, dass Reasoning-Modelle keine strukturelle Zuverlässigkeit bieten. Sie zeigt das nicht. Sie zeigt, dass diese Modelle bei abstrakt-kompositorischen Puzzle-Aufgaben mit sehr hoher Komplexität kollabieren. Vertragsanalysen, Support-Klassifizierungen, Code-Templates sind das nicht. Die Schlussfolgerung ist zu breit für das, was die Studie tatsächlich misst. ...

April 8, 2026 · blodrevobog