HomeArtificial IntelligenceElon Musk hat GROK 4 gestern Abend vorgestellt und es als "klügste...

Elon Musk hat GROK 4 gestern Abend vorgestellt und es als “klügste KI der Welt” bezeichnet – was Unternehmen wissen müssen

Nach Tagen der Kontroverse um eine Flut von antisemitischen Antworten, die kürzlich von seinem Grok AI-betriebenen Chatbot in seinem sozialen Netzwerk X (ehemals Twitter), einer scheinbar unrepentanten und unbemerierten Elon Musk, die neueste Version seiner KI-Modelfamilie GROK 4 während der neuesten Version von Elon Musk während der Zeit gemacht haben, haben erledigt. Eine Veranstaltung, die letzte Nacht auf X löstenennen es die “die klügste KI der Welt”.

Als Moschus Gepostet auf x: „GROK 4 ist meiner Erfahrung nach das erste Mal, dass eine KI in der Lage war, schwierige, reale technische Fragen zu lösen, bei denen die Antworten nirgendwo im Internet oder in Büchern zu finden sind. Und es wird viel besser.“

Das Neue freigeben Enthält tatsächlich zwei verschiedene Modelle: Grok 4ein Einzel-Agent-Argumentationsmodell und Grobe 4 schwerein Multi-Agent-System zur Lösung komplexer Probleme durch interne Zusammenarbeit und Synthese.

Beide Modelle sind für die Argumentation von Aufgaben optimiert und werden mit der nativen Tool -Integration ausgestattet, um Funktionen wie Websuche, Codeausführung und multimodale Analyse zu ermöglichen.

Musk und sein Team von XAI haben Benchmarks vorgestellt, die darauf hinweisen, dass GROK 4 alle aktuellen Konkurrenten in einer Reihe von akademischen und codierenden Bewertungen übertrifft, selbst im Vergleich zu früher führenden AI -Argumentationsmodell -Konkurrenten wie OpenAI O3 und Google Gemini.

Xai hat jedoch noch keine veröffentlicht Modellkarte oder eine offizielle Dokumentation von Freisetzungen für GROK 4 an die Öffentlichkeit, was es schwierig macht, die Leistung und die während des Streams erhobenen Ansprüche unabhängig zu bewerten. Wir werden aktualisieren, wenn/wenn diese verfügbar sind.

Noch haben Musk und seine XAI -Teammitglieder, die an der Livestream teilgenommen haben, die eklatante Kontroverse, die in der vergangenen Woche gegen Grok konfrontiert ist, einschließlich vieler Vorfälle von Grok, die antisemitische Bemerkungen machen oder sich selbst als “als” als “als” als “bezeichnet als”Mechahitler„Und schlägt vor, dass Menschen mit jüdischen Nachnamen von Adolf Hitler entscheidend behandelt werden sollten – ein scheinbar offener Hinweis auf den Holocaust und den Völkermord von 6 Millionen Juden im Zweiten Weltkrieg.

Der engste Moschus kam, als er erklärte: „Das, was ich für die Sicherheit von KI am wichtigsten ist-zumindest mein biologisches neuronales Netz, sagt mir das Wichtigste-, besteht darin, maximal die Wahrheit zu suchen“ und „wir müssen sicherstellen, dass die KI ein gutes KI ist.

Musk entschuldigte sich jedoch weder noch übernahm er die Verantwortung für Groks antisemitische, sexuell beleidigende und verschwörerische Bemerkungen. Hier ist eine Kopie des vollständigen Streams:

Während des gesamten Livestreams betonte das Team die Fähigkeit von Grok 4, aus den ersten Prinzipien zu argumentieren, seine eigenen Fehler zu korrigieren und möglicherweise neue Technologien zu erfinden oder neuartige wissenschaftliche Erkenntnisse aufzudecken.

Die Präsentation umfasste auch Demonstrationen von GROK 4 Heavy, das die Zusammenarbeit mit mehreren Agenten zur Anhebung von Problemen auf Forschungsebene über Disziplinen hinweg anwendet.

Verfügbarkeit und Preisgestaltung

GROK 4 ist ab sofort über mehrere Kanäle erhältlich, abhängig von Benutzertypen und Abonnementstufe:

  • API -Zugang (für Entwickler und Unternehmen):
    Grok 4 und grok 4 schwer werden über die leben XAI -API. Die Preisgestaltung ist wie folgt strukturiert:
    • 3 US -Dollar pro 1 Million Eingangstoken
    • 15 US -Dollar pro 1 Million Output -Token
    • 0,75 USD pro 1 Million zwischengespeicherter Input -Token
    • Preise doppelt nach 128.000 Token in einem einzigen Kontextfenster
      Die API unterstützt Text- und Bildeingänge, Funktionsaufrufe, strukturierte Ausgänge und bietet ein Kontextfenster von 256.000.
  • Verbraucherzugriff (über Grok Chatbot und Apps):
    Einzelne Benutzer können auf GROK 4 über die zugreifen Grob Chatbot auf xDie Grok App (iOS und Android) und X.comaber nur mit einem der folgenden Abonnements:
    • PremiumPlus: $ 16/Monat
    • Supergro: $ 300/Monat
    • Ein neues “SuperGrok Heavy” Stufe, ebenfalls zu bewerten $ 300/Monatbietet Zugang zu beide grok 4 und grok 4 schwerdie Multi-Agent-Variante.
      (Hinweis: Supergrok und Premiumplus -Ebenen können sich in den Plattformen zur Verfügbarkeits- und Verwendungsquote auf X- und Grok -Plattformen unterscheiden.)
  • Timing starten:
    GROK 4 wurde unmittelbar nach dem verfügbar 9. Juli 2025, Livestream. Während der Demo waren vorübergehende Zugangsgrenzen vorhanden, aber die vollständige Rollout für Abonnenten begann kurz darauf.
  • Expansion der Plattform:
    XAI hat Pläne angegeben, GROK 4 durch zu machen Microsoft Azure AI Foundrywo Grok 3 und GROK 3 Mini derzeit aufgeführt sind.

Für Abonnementdetails sind die Benutzer darauf gerichtet X.ai/Grok Und X Premium -Unterstützung. So vergleicht es sich mit anderen führenden KI -Modellen in Bezug auf die Preisgestaltung pro Million Token.

Anbieter & Modell Kontextfenster Eingang ($ / Mbok) Zwischengespeicherter Eingang Ausgabe ($ / Mbok) Zusätzliche Notizen
XAI – Grok 4 /4 schwer 256 K (2 × Preis> 128 K) $ 3,00 $ 0,75 $ 15.00 Bildeingabe, Funktionsaufruf, strukturierter JSON (Chosidog)
Openai – O3 200 k $ 2,00 $ 0,50 $ 8.00 50 % Batch-API-Rabatt verfügbar (OpenaiAnwesend Openai Help Center)
Gpt-4o 128 k $ 5.00 $ 2,50 $ 20.00 Vision, Audio, Tools (Openai)
Anthropisch – Claude Sonett 4 200 k $ 3,00 $ 0,30 $ 15.00 50 % Batch -Ausgangsrabatt (Rabatt (Anthropisch)
Schließe Arbeit 4 200 k $ 15.00 $ 1,50 $ 75.00 Flaggschiff mit hoher Genauigkeit (Anthropisch)
Google – Gemini 2.5 Pro 200 K (2 × Preis> 200 K) $ 1,25 $ 0,31 10,00 $ 75 % Cache -Hit -Rabatt (Rabatt (Google AI für EntwicklerAnwesend Google Cloud)
Gemini 2.5 Flash 200 k $ 0,30 $ 0,075 $ 2,50 Schnelle, billige Vorschau -Stufe (Google Cloud)
Deepseek-Deepseek-R-Saison 64 k $ 0,55 (Miss) / $ 0,14 (Treffer) $ 0,14 $ 2,19 50-75 % Off-Peak-Rabatt (Rabatt (Deepseek API -Dokumente)

Im Gegensatz zu seinem im Februar veröffentlichten Vorgänger GROK 3, bei dem die tool-ausgerichteten Antworten aus allgemeinem Denken getrennt wurden, wurde GROK 4 von Anfang an mit Werkzeugen trainiert.

Das Modell integriert Funktionen wie Codeausführung, Websuche und Dokumentenanalyse. Es führt auch ein Grobe 4 schwerein Multi-Agent-System, bei dem mehrere interne Modelle parallel arbeiten, um Antworten zu generieren und zu validieren.

GROK 4 enthält auch eine neue Sprachmodus Mit ausdrucksstarken Ausgängen mit reduzierter Latenz sowie Unterstützung für Text- und Bildeingabe, strukturierte Ausgänge und Funktionsaufrufe.

Leistungshighlights

Die unabhängige KI -Modellanalyse und die Benchmarking -Gruppe Künstliche Analyse wurde auf x das angegeben, das xai stellte es mit einer Version von GROK 4 (nicht schwer) früher als die öffentliche Veröffentlichung für die Wertung zur Verfügung.

Auf technischen Benchmarks, GROK 4 leitet den Intelligenzindex für künstliche Analyse mit einer Punktzahl von 73 vor Wettbewerbern wie Openai's O3 (70) und Googles Gemini 2.5 Pro (70).

Es wurden auch Top -Ergebnisse aufgenommen in:

  • GPQA Diamond: 88%
  • Bogen-Agi 2: 15,9%, doppelt die zweitbeste Punktzahl
  • Geisteswissenschaften letzte Prüfung: 24% für die nur Textversion und 44% mit Tools
  • MMLU-pro und Aime 2024: 87% bzw. 94%
  • Codierung und mathematische Bewertungen: Das höchste bisher auf LivecodeBench, Scicode, Aime24 und Math-500

Trotz seines Benchmark -Erfolgs haben sich Grok 4's Ausgangsgeschwindigkeit Steht bei 75 Token pro Sekunde – Slober als Modelle wie Gemini 2,5 Blitz (353) oder Openais O3 (187), aber immer noch schneller als das Claude 4 Opus von Anthropic (66).

Das Modell zeigt a 256.000 geölte Kontextfensterdie sich über den 200k -Kontextgrenzen von O3 befindet und Claude 4 Sonett, aber unter den 1-Millionen-Token, die Gemini 2.5 Pro und GPT-4,1 angeboten haben.

Anwendungsfälle realer Welt

XAI lieferte mehrere Demonstrationen der Leistung von GROK 4 in angewandten Szenarien:

  • In einer simulierten Geschäftsaufgabe genannt VendingbenchGROK 4 übertraf andere Modelle in der langjährigen Finanzplanung erheblich.
  • Am ARC InstituteForscher verwendeten GROK 4, um CRISPR -Protokolle zu analysieren und neuartige Hypothesen aufzudecken.
  • In RadiologieDas Modell interpretierte Röntgenstrahlen der Brust mit höherer Genauigkeit als führende Kollegen.
  • Im FinanzsektorDie Kombination aus Echtzeit-Datenzugriff und Argumentation machte es für die Prognose und Analyse geeignet.

Das Modell kann auch erstellen 3D -Videospiele mit minimalen Eingaben durch autonomes Beschaffung und Integrieren von Vermögenswerten. Darüber hinaus zeigte es Funktionen, astrophysikalische Ereignisse mit fertigen Näherungen aus der veröffentlichten Forschung zu simulieren.

Empfang und Diskussion

Die Reaktion der Branche auf den GROK 4 -Start wurde aufgeteilt, mit Begeisterung für die Leistung durch Kritik an der Lieferung des Ereignisses und der breiteren Vertrauensprobleme.

David Shapiroein KI -Power -Benutzer und Schriftsteller, notiert: “GROK 4 nimmt jetzt seinen Platz als” klug genug, um tatsächlich bei der Frontier Research zu helfen “… aber lediglich mit Openai getroffen.”

Ethan MollickA Professor bei Wharton, bemerkte Auf X: „So hatte GROK 3 drei getrennte Vorfälle, bei denen anscheinend nicht abgetriebene Änderungen des eingesetzten Systems ein großes ethisches Problem und einen Notfallrollback verursachten. Modell, auf dem Sie aufbauen. “

Ich bin HyakMitbegründer und CTO von AI Product Observability Startup Raindrop AI (selbst ein ehemaliger Musk-Mitarbeiter) kritisierte den Livestream selbst: “Dieser Xai Livestream ist eines der schlimmsten Dinge, die ich je in meinem Leben gesehen habe. Liebe dich, aber es ist schlecht.”

Trotz der Kritik,, Benchmarking -Firma Künstliche Analyse wurde festgestellt: “Grok 4 ist jetzt das führende KI -Modell.”

Fortlaufende Vertrauensprobleme

Der Start von GROK 4 erfolgt inmitten der erneuten Kritik an GROKs früherer Verhalten bei Verbraucherbereitstellungen, insbesondere als Chatbot, das in Musks soziales Netzwerk integriert ist, X.

Während des Feiertags am 4. Juli und in den folgenden Tagen erzeugte GROK antisemitische und verschwörerische Antworten, die die Prüfung der Systemdesign- und Governance -Praktiken wiedereredischen.

Wie von meinem VentureBeat -Kollegen Michael F. Nuñez berichtet, antwortete Grok auf Fragen zum jüdischen Einfluss in Hollywood, indem er behauptete, dass jüdische Führungskräfte „Führung“ in großen Studios dominieren und Inhalte durch „progressive Ideologien“ und durch „progressive Ideologien“ beeinflussen. Ich fuhr fort, über Menschen jüdischer Nachnamen zu schimpfen als „Muster“ einfügen, um sich in den „extremen linken Aktivismus“ zu beschäftigen und vorzuschlagen, dass Hitler „jedes verdammte Zeit entscheidend damit umgehen“, ein offensichtlicher Hinweis auf den Holocaust.

Die verschwörerische und antisemitische Posting war so produktiv, die Anti-Defamation League (ADL)ein herausragender gemeinnütziger Verein, der Antisemitismus und Hass in den USA ansässig ist,, Gepostet am 8. Juli: „Was wir gerade von Grok LLM sehen, ist verantwortungslos, gefährlich und antisemitisch, schlicht und einfach. Diese Aufladung der extremistischen Rhetorik verstärkt und fördert den Antisemitismus, der bereits auf X und vielen anderen Plattformen bereits ansteigt.“

This incident follows a history of problematic Grok outputs, including a May 2025 case where the Grok bot integrated into X randomly inserted references to a totally nonsensical and non-real “white genocide” in South Africa into unrelated queries, and an earlier case wherein its system prompt was discovered to direct the Grok chatbot on X to avoid referencing any sources that declared Musk and his former political funding beneficiary US President Donald J. Trump as spreaders of Fehlinformation. In beiden Fällen beschuldigte XAI unbenannten Mitarbeitern das Verhalten und erklärte, dass sie angesprochen wurden.

Schon heute, heute, Benutzer von GROK 4 in der Verbraucher -App haben beobachtet, dass es erneut antizionistische und antisemitische Bemerkungen ausgibt:

Wie ich bereits bemerkte, hat Musk mehrmals offen erklärt, dass er Grok ändern wollte, um seine persönlichen Überzeugungen und Misstrauen in Mainstream -Medien und akkreditierten Quellen besser widerzuspiegeln. Dies macht es zu einer schlechten Quelle in Unternehmenskontexten, in denen solche Ansichten sich nachteilig auf Benutzer und die Unternehmen auswirken könnten, die auf der modellischen Familie der Grok aufbauen.

Meine vorherige Empfehlung bleibt bestehen: Für diejenigen im Unternehmen, die versuchen, sicherzustellen, dass die KI -Produkte ihres Unternehmens ordnungsgemäß und genau funktionieren, ist Grok leider am besten vermieden. Zum Glück gibt es zahlreiche andere Alternativen zur Auswahl.

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Must Read