SWE-bench (Coding-Tasks): Claude Sonnet 4 führt mit 72,5%, gefolgt von GPT-5 und Gemini 2.5 Pro. Für Entwickelnde ist Claude ...