Nous Research lässt Hermes 4 AI -Modelle fallen, die Chatgpt ohne Inhaltsbeschränkungen übertreffen

August 29, 2025

279

Nous Forschungein geheimes Startup für künstliche Intelligenz, das sich als führende Stimme in der Open-Source-KI-Bewegung herausgestellt hat, die leise veröffentlicht wurde Hermes 4 Am Montag kann eine Familie großer Sprachmodelle, von denen das Unternehmen behauptet, mit der Leistung führender proprietärer Systeme übereinstimmen und gleichzeitig eine beispiellose Benutzerkontrolle und minimale Inhaltsbeschränkungen anbieten.

Die Veröffentlichung stellt eine erhebliche Eskalation im Kampf zwischen Open-Source-KI-Befürwortern und großen Technologieunternehmen dar, die den Zugang zu fortgeschrittenen Funktionen für künstliche Intelligenz kontrollieren sollten. Im Gegensatz zu Modellen von OpenaiAnwesend Googleoder AnthropischHermes 4 wurde entwickelt, um auf nahezu jede Anfrage zu reagieren, ohne die Sicherheitsleitungen, die in kommerziellen KI -Systemen Standard geworden sind.

Nous Research präsentiert Hermes 4, unsere neueste Linie von Hybrid -Argumentationsmodellen.https://t.co/e5ew9hburb

Hermes 4 baut auf unserem Vermächtnis von benutzergeräten Modellen mit erweiterten Berechnungsprüfungsfunktionen auf.

Besonderes Augenmerk wurde darauf, dass die Models kreativ und interessant auf… pic.twitter.com/52vjnvrdwm

– Nous Research (@nousresearch) 26. August 2025

“Hermes 4 baut auf unserem Erbe von benutzergerildeten Modellen mit erweiterten Berechnungsprüfungsfunktionen auf”, teilte Nous Research auf X (ehemals Twitter) mit. “Besonderes Augenmerk wurde, dass die Modelle kreativ und interessant wurden, um mit Zensur nicht belastet und neutral ausgerichtet zu sein und gleichzeitig die mathematische Mathematik-, Codierung und die Überlegungsleistung für die Kunstebene für offene Gewichtsmodelle aufrechtzuerhalten.”

Wie Hermes 4s “Hybrid -Argumenting” -Modus Chatgpt und Claude in Mathematik -Benchmarks übertrifft

Hermes 4 Führen Sie ein, wie NOUS-Forschung als „Hybrid-Argumentation“ bezeichnet wird, damit Benutzer zwischen schnellen Antworten und tieferen, Schritt-für-Schritt-Denkprozessen umschalten können. Bei der Aktivierung erzeugen die Modelle ihre interne Argumentation innerhalb von Spezial Tags, bevor sie eine endgültige Antwort liefern – ähnlich wie die O1 -Argumentationsmodelle von OpenAI, jedoch mit vollem Transparenz in den Denkprozess der KI.

Die technische Leistung ist erheblich. Bei der Prüfung erzielte das größte Parametermodell von Hermes 4 von 405 Billionen 96,3% auf dem Math-500 Benchmark im Argumentationsmodus und 81,9% bei der Herausforderung Aime'24 Mathematikwettbewerb – Leistung, die viele proprietäre Systeme konkurrieren oder übertrifft, die Millionen mehr entwickeln, um sich zu entwickeln.

“Die Herausforderung besteht darin Rohan Paul auf xHervorhebung eines der technischen Durchbrüche in der Veröffentlichung.

Vielleicht vor allem, vor allem, Hermes 4 Erreichte die höchste Punktzahl unter allen getesteten Modellen zu „RefuSalbench“, einer neuen Benchmark -Nous -Forschung, um zu messen, wie oft KI -Systeme sich weigern, Fragen zu beantworten. Das Modell bewertete 57,1%im Argumentationsmodus und übertraf GPT-4O (17,67%) und Claude Sonnet 4 (17%) signifikant.

Hermes 4 Modelle aus Nous Research beantworteten deutlich mehr Fragen als konkurrierende KI -Systeme auf Ablehnung, ein Test, in dem gemessen wird, wie oft Modelle sich weigern, auf Benutzeranfragen zu reagieren. (Kredit: Nous Research)

Inside Dataforge und Atropos: Die bahnbrechenden Trainingssysteme hinter den Fähigkeiten von Hermes 4

Hinter den Fähigkeiten von Hermes 4 liegt eine hoch entwickelte Trainingsinfrastruktur, die Nous Forschung hat sich über mehrere Jahre entwickelt. Die Modelle wurden mit zwei neuartigen Systemen trainiert: Dataforgeein graphbasierter synthetischer Datengenerator und Atropsein Open-Source-Verstärkungs-Lernrahmen.

Dataforge Erstellt Schulungsdaten durch das, was das Unternehmen als „zufällige Spaziergänge“ durch gerichtete Diagramme beschreibt und einfache Voraussetzungsdaten in komplexe Anweisungsbeispiele verwandelt. Das System kann beispielsweise einen Wikipedia -Artikel aufnehmen und ihn in einen Rap -Song verwandeln und dann Fragen und Antworten basierend auf dieser Transformation erstellen.

AtropsIn der Zwischenzeit arbeitet Hunderte von speziellen Trainingsumgebungen, in denen KI -Modelle spezifische Fähigkeiten üben – Mathematik, Codierung, Werkzeuggebrauch und kreatives Schreiben -, nur dann, wenn sie korrekte Lösungen erstellen. Dieser Ansatz „Ablehnungsabstichproben“ stellt sicher, dass nur verifizierte, hochwertige Antworten es in die Trainingsdaten schaffen.

Atropos ist Nous 'Verstärkungslernrahmen

Atropos ist eine Open -Source -Verstärkungslernumgebung von Nous, die Hunderte von „Fitnessstudios“ (wie Mathematik, Codierung, Spiele, Tool -Use, Vision) hat, um LLM -Trajektorien über skalierbare, asynchronisierte RL -Loops zu trainieren und zu bewerten.

Mit anderen Worten … pic.twitter.com/fjxaqkclez

– Tommy (@Shaughnessy119) 26. August 2025

“Nous hat diese Umgebungen verwendet, um den Datensatz für Hermes 4 zu generieren!” erklärt Tommy Shaughnessyein Risikokapitalgeber bei Delphi Ventures wer hat in Nous Research investiert. “Alles im Datensatz enthält 3,5 Millionen Argumentationsmuster und 1,6 Millionen Nicht-Bevölkerungsproben! Hermes wurde auf RL-Daten geschult, nicht nur statische Datensätze der Frage und Antwort!”

Der Schulungsprozess erforderte 192 Nvidia B200 GPUS und 71.616 GPU -Stunden für das größte Modell – eine bedeutende, aber nicht beispiellose Recheninvestition, die zeigt, wie spezialisierte Techniken mit dem massiven Ausmaß der Tech -Riesen konkurrieren können.

Warum Nous Research der Ansicht ist

Nous Forschung hat seinen Ruf auf eine Philosophie aufgebaut, die die Benutzerkontrolle über die Richtlinien für Unternehmensinhalte stellt. Die Modelle des Unternehmens sind so konzipiert, dass sie „lenkbar“ sind, was bedeutet, dass sie fein abgestimmt oder aufgefordert werden können, sich auf bestimmte Weise zu verhalten, ohne die starre Sicherheitsbeschränkungen, die kommerzielle KI-Systeme charakterisieren.

“Hermes 4 wird nicht durch Haftungsausschlüsse, Regeln und übermäßig vorsichtig gefesselt, was die Hölle ärgerlich ist und Innovation und Benutzerfreundlichkeit verletzt”, schrieb Shaughnessy in einem detaillierten Thread, der die Veröffentlichung analysiert. “Wenn seine Open Source, aber alle ihre sinnlosen Anfragen abgelehnt. Kein Problem mit Hermes 4.”

Hermes 4 wird nicht durch Haftungsausschlüsse, Regeln und zu vorsichtig gefesselt, was die Hölle ärgerlich ist und Innovation und Benutzerfreundlichkeit verletzt.

Hermes 4 70b befindet sich im gesamten Open -Source -Modell von Spectrum vs OpenAI. Es ist auch ~ 4x mehr offen gegen Chatgpt 4o!

Wenn es offen ist … pic.twitter.com/q5rpx1oozo

– Tommy (@Shaughnessy119) 26. August 2025

Dieser Ansatz hat gemacht Nous Forschung Bei AI -Forschern und Entwicklern, die eine maximale Flexibilität wünschen, werden das Unternehmen aber auch in den Mittelpunkt der laufenden Debatten über die Sicherheits- und Inhalts Moderation von KI gesetzt. Während die Modelle theoretisch für schädliche Zwecke verwendet werden können, argumentiert Nous Research, dass Transparenz und Benutzerkontrolle der Gatekeeping der Unternehmens -Gatekeke vorzuziehen sind.

Das Unternehmen Technischer Berichtveröffentlicht neben den Modellen, enthält beispiellose Details über den Trainingsprozess, die Bewertungsergebnisse und sogar die tatsächlichen Textausgaben aus Benchmark -Tests. “Wir glauben, dass dieser Bericht einen neuen Standard für Transparenz beim Benchmarking festlegt”, erklärte das Unternehmen.

Wie ein kleines Startup mit 192 GPUs gegen Big Techs Milliarden-Dollar-KI-Budget gegen Big Tech antritt

Hermes 4Die Veröffentlichung kommt zu einem entscheidenden Moment in der KI -Branche. Während große Technologieunternehmen Milliarden in die Entwicklung immer leistungsstärkerer KI-Systeme gesteckt haben, argumentiert eine wachsende Open-Source-Bewegung, dass diese Fähigkeiten nicht von einer Handvoll Unternehmen kontrolliert werden sollten.

In den letzten Monaten wurden in der Open-Source-KI erhebliche Fortschritte erzielt, mit Modellen wie Meta's Lama 3.1Anwesend Deepseeks R1Und Alibabas Qwen Serie Erreichung von Leistung, die in proprietäre Systeme konkurriert. Hermes 4 stellt einen weiteren Schritt in diesem Fortschritt dar, insbesondere im Bereich der Argumentation – gelangt als Stärke geschlossener Systeme wie Openai's O1.

“Zuerst ist Nous ein Startup mit Dutzenden von extrem talentierten Menschen”, ” Bekannt Shaughnessy. “Sie haben weder die jährlichen Investitionen in Höhe von 100 Mio. USD eines Hyperscaler noch 1.000 Mitarbeiter und trotzdem weiter progressive Modelle und Forschungsergebnisse in wahnsinnigem Tempo.”

Das Startup, welches sammelte 65 Millionen US -Dollar an Finanzmitteln Anfang dieses Jahres angeführt von Paradigmahat sich ebenfalls entwickelt Psyche -Netzwerkein verteiltes Trainingssystem, das darauf abzielt, die KI-Schulungen über mit Internet verbundene Computer mithilfe der Blockchain-Technologie zu koordinieren.

Die technische Lösung, die Hermes 4 daran hinderte, in endlosen Schleifen zu denken

Einer von Hermes 4Die wichtigsten technischen Beiträge befassen sich mit einem Problem, in dem Argumentationsmodelle plagen: übermäßig lange Denkprozesse. Die Forscher fanden heraus, dass ihr kleineres Parametermodell von 14 Milliarden 60% der Zeit beim Argumentieren maximale Kontextlänge erreichen würde und im Wesentlichen in endlosen Denkschleifen stecken bleibt.

Ihre Lösung umfasste eine zweite Trainingsphase, in der Modelle unterrichtet werden, um die Argumentation mit genau 30.000 Token zu beenden, und die über die Generation über die Generation um 65-79% verringert und gleichzeitig den größten Teil der Begründung aufrechtzuerhalten. Diese „Längenkontroll“ -Technik könnte sich für die breitere AI -Forschungsgemeinschaft als wertvoll erweisen.

“Kleinere Modelle (<14b) neigen dazu, bei Destillieren zu überdenken, aber größere Modelle nicht", beobachtete der AI -Forscher Muyu er auf xErkenntnisse aus dem technischen Bericht hervorheben.

Jedoch, Hermes 4 Es wird immer noch Einschränkungen vorliegt, die für Open-Source-Modelle gemeinsam sind. Trotz der beeindruckenden Benchmark -Leistung erfordern die Modelle erhebliche Rechenressourcen für die Ausführung und entsprechen möglicherweise nicht mit der Benutzerfreundlichkeit oder Zuverlässigkeit von kommerziellen KI -Diensten für viele Anwendungen.

Wo man Hermes 4 probiert und was es im Vergleich zu Chatgpt und Claude kostet

Nous Forschung hat gemacht Hermes 4 Erhältlich über mehrere Kanäle, die die Open-Source-Philosophie widerspiegeln. Die Modellgewichte können auf dem Umarmungsgesicht frei heruntergeladen werden, während das Unternehmen API -Zugriff über seine überarbeitete Chat -Schnittstelle und Partnerschaften mit Inferenzanbietern wie Chutes, Nebius und Luminal bietet.

“Sie können Hermes 4 in der neuen, überarbeiteten Nous Chat -Benutzeroberfläche probieren”, kündigte das Unternehmen an und hob Funktionen wie parallele Interaktionen und ein Speichersystem hervor.

Für Unternehmensnutzer und Forscher stellen die Modelle eine potenziell attraktive Alternative zur Bezahlung des API -Zugriffs zu proprietären Systemen dar, insbesondere für Anwendungen, die ein hohes Maß an Anpassung oder Handhabung sensibler Inhalte erfordern.

Das Gesamtbild: Was Hermes 4 für die Zukunft der KI -Entwicklung bedeutet

Die Veröffentlichung von Hermes 4 repräsentiert mehr als nur einen weiteren KI -Modellstart – es ist eine Aussage darüber, wer die Zukunft der künstlichen Intelligenz kontrollieren soll. In einer Branche, die zunehmend von einer Handvoll Tech -Riesen mit praktisch unbegrenzten Ressourcen dominiert wird, hat NOUS -Forschung gezeigt, dass Innovationen immer noch von unerwarteten Orten stammen können.

Der Ansatz des Unternehmens wirft grundlegende Fragen zu den Kompromisse zwischen Sicherheit und Fähigkeit zwischen Unternehmenskontrolle und Benutzerfreiheit auf. Während große Technologieunternehmen argumentieren, dass sorgfältige Mäßigung und Sicherheitsberichte inhaltlich für die verantwortungsvolle KI-Bereitstellung von wesentlicher Bedeutung sind, behauptet NOUS-Forschung, dass Transparenz und Benutzeragentur wichtiger sind als von Unternehmen auferlegte Beschränkungen.

Ob diese Philosophie letztendlich vorteilhaft oder problematisch ist, bleibt abzuwarten. Eines ist jedoch sicher: Hermes 4 hat gezeigt, dass die Zukunft der KI nicht nur von den Unternehmen mit den tiefsten Taschen bestimmt wird.

In einem Gebiet, in dem die gestrigen Unmöglichkeiten von morgen die Rohstoffe werden, hat Nous Research nur bewiesen, dass das einzige, was gefährlicher ist als eine KI, die nein sagt, dass sie vielleicht eine bereit ist, Ja zu sagen.

Nous Research lässt Hermes 4 AI -Modelle fallen, die Chatgpt ohne Inhaltsbeschränkungen übertreffen

Wie Hermes 4s “Hybrid -Argumenting” -Modus Chatgpt und Claude in Mathematik -Benchmarks übertrifft

Inside Dataforge und Atropos: Die bahnbrechenden Trainingssysteme hinter den Fähigkeiten von Hermes 4

Warum Nous Research der Ansicht ist

Wie ein kleines Startup mit 192 GPUs gegen Big Techs Milliarden-Dollar-KI-Budget gegen Big Tech antritt

Die technische Lösung, die Hermes 4 daran hinderte, in endlosen Schleifen zu denken

Wo man Hermes 4 probiert und was es im Vergleich zu Chatgpt und Claude kostet

Das Gesamtbild: Was Hermes 4 für die Zukunft der KI -Entwicklung bedeutet

LEAVE A REPLY Cancel reply

Must Read

The United States’ latest military strategy is a case of “AI peacocking”

Why AI hasn't led to mass unemployment

What should education appear to be today? 6 necessary readings for learning together

YouTube will soon allow creators to create Shorts using their very own AI image

Despite its high environmental costs, AI could also help save the planet

Why it's essential to maneuver beyond overly aggregated machine learning metrics

The EU's latest AI framework may even impact UK businesses and consumers

Latest articles

The United States’ latest military strategy is a case of “AI peacocking”

Why AI hasn't led to mass unemployment

What should education appear to be today? 6 necessary readings for learning together

Our Newsletter

Nous Research lässt Hermes 4 AI -Modelle fallen, die Chatgpt ohne Inhaltsbeschränkungen übertreffen

Wie Hermes 4s “Hybrid -Argumenting” -Modus Chatgpt und Claude in Mathematik -Benchmarks übertrifft

Inside Dataforge und Atropos: Die bahnbrechenden Trainingssysteme hinter den Fähigkeiten von Hermes 4

Warum Nous Research der Ansicht ist

Wie ein kleines Startup mit 192 GPUs gegen Big Techs Milliarden-Dollar-KI-Budget gegen Big Tech antritt

Die technische Lösung, die Hermes 4 daran hinderte, in endlosen Schleifen zu denken

Wo man Hermes 4 probiert und was es im Vergleich zu Chatgpt und Claude kostet

Das Gesamtbild: Was Hermes 4 für die Zukunft der KI -Entwicklung bedeutet

RELATED ARTICLES

LEAVE A REPLY Cancel reply

Must Read

Latest articles

Our Newsletter