Qorinix Benchmark | KI-Speed-, Qualitäts- & Kosten-Leaderboard

Standard-Plot · Qualität vs. Speed

Die Pareto-Frontier

Oben rechts ist am besten: höhere Output-Geschwindigkeit und höhere Qualität. Qorinix-Lanes sitzen auf der Frontier mit Qualität bei einer Geschwindigkeit, die öffentliche Referenzen nicht erreichen.

Output speed (tok/s) →

↑ Quality index (0-100)

Frontier Leader

Qorinix 3.2

Top-Qualität unter produktionsschnellen Lanes: p50 TTFT 168 ms, 226 tok/s, US$1.95 / M Tokens.

Qualität92.4 / 100
Output Speed226 tok/s
TTFT p50168 ms
Cache Saving62%

Speed Leader

Qorinix 3.1

Niedrigste TTFT und Gesamtlatenz, gebaut für Live-Agenten, Voice, Gaming-NPCs und Trading-Alerts.

Qualität88.6 / 100
Output Speed238 tok/s
TTFT p50142 ms
Kosten / MUS$ 1.35

Beste öffentliche Referenz

Reference B

Starke Qualität, aber etwa 5x langsamere TTFT und rund 3.5x teurer pro Million Output-Tokens.

Qualität91.2 / 100
Output Speed108 tok/s
TTFT p50780 ms
Kosten / MUS$ 4.80

Standard-Plots · Per-Metric Ranking

Wo jedes Modell bei der wichtigsten Metrik landet

Sortierte Balkenplots machen Trade-offs klar. Qorinix dominiert Speed, Latenz und Kosten und bleibt bei Qualität konkurrenzfähig.

Output Speed tok/s · höher ist besser

TTFT p50 ms · niedriger ist besser

Total p95 ms · niedriger ist besser

Kosten pro 1M Output US$ · niedriger ist besser

Quality Index 0-100 · höher ist besser

JSON Reliability 0-100 · höher ist besser

Detailliertes Leaderboard

Sortierbares, filterbares Leaderboard

Nach Kategorie filtern und nach jeder Spalte sortieren. Qorinix-Zeilen sind orange markiert.

#	Lane / Modell	Qualität	TTFT p50	Total p95	Output Speed	JSON	Success	Kosten / M	Cache Saving	Value

Kategorie-Gewinner

Best-in-class pro Workload

Verschiedene Workloads bewerten Trade-offs unterschiedlich. Hier sind die Gewinner nach Absicht.

Echtzeit-Agenten

Qorinix 3.1

TTFT unter 150 ms und Durchsatz über 230 tok/s für Voice-Agenten, Gaming-NPCs und Trading-Alerts.

Warum: niedrigste TTFT und Gesamtlatenz mit adaptivem Routing.

High-volume Support Automation

Qorinix 3.2

62% Cache Saving bei wiederholten Anfragen mit Qualität nahe Frontier-Referenzmodellen zu weniger als halben Kosten.

Warum: semantischer Cache + Quality Lane hält Unit Economics gesund.

Long-form Reasoning

Reference B

Höchster Reasoning Index im öffentlichen Referenzset; mit Qorinix-Routing für speed-tiered Resilienz kombinierbar.

Hinweis: 4-5x langsamere TTFT und rund 3.5x höhere Kosten.

Cost-sensitive Batch

Reference A

Günstigste Non-Qorinix-Lane; nützlich für Offline-Batch, wo Latenz nicht zählt.

Hinweis: niedrige Cache-Savings und mittlere Qualität.

Methodik

Wie der Benchmark berechnet wird

Transparenz zu Prompt-Mix, Messung und was serverseitig gehalten wird.

1 · Prompt-Mix

14,200 Prompts pro Tag über Reasoning (35%), Code (25%), JSON / Tool-use (20%), Creative (15%) und Short-form Chat (5%). Prompts rotieren alle 72 Stunden.

2 · Latenzmessung

TTFT wird serverseitig vom Request-Eingang bis zum ersten Response-Byte gemessen. Total latency läuft bis zum letzten Token.

3 · Qualitäts-Scoring

Composite aus modellbewerteter Präferenz, task-deterministischen Checks und Kohärenz der Antwort.

4 · Kosten

Ausgewiesen als Listenpreis pro 1M Output-Tokens am Messtag. Cache Savings werden auf Qorinix-internem Traffic berechnet.

5 · Was serverseitig bleibt

Exakte Modell-IDs, API-Routen, Zugangsdaten, Resilienz-Reihenfolge und Routing-Gewichte werden im öffentlichen Leaderboard nie offengelegt.

6 · Updates

Zahlen aktualisieren kontinuierlich aus Arena-Produktionsverkehr. Sichtbar ist das rollende 72-Stunden-Aggregat.

Der Qorinix Benchmark

Die Pareto-Frontier

Wo jedes Modell bei der wichtigsten Metrik landet

Output Speed tok/s · höher ist besser

TTFT p50 ms · niedriger ist besser

Total p95 ms · niedriger ist besser

Kosten pro 1M Output US$ · niedriger ist besser

Quality Index 0-100 · höher ist besser

JSON Reliability 0-100 · höher ist besser

Sortierbares, filterbares Leaderboard

Best-in-class pro Workload

Qorinix 3.1

Qorinix 3.2

Reference B

Reference A

Wie der Benchmark berechnet wird

1 · Prompt-Mix

2 · Latenzmessung

3 · Qualitäts-Scoring

4 · Kosten

5 · Was serverseitig bleibt

6 · Updates

Teste diese Zahlen selbst.