DeepSeek-R1T-Chimera: Erstmals 1 Milliarde Tokens pro Tag

29. Mai 2025

Unser R1T Chimera 671B Open-Weights-Modell, zusammengesetzt aus DeepSeek R1 und V3-0324, ist nun seit einem Monat im Einsatz.

  • In der Spitze wurden auf OpenRouter bis zu 1,35 Milliarden Tokens pro Tag verarbeitet, hauptsächlich für Chat und die Coding-Apps Roo Code und Cline.

  • Auf der zugrunde liegenden Chutes KI-Plattform erreichte Chimera den dritten Platz unter den beliebtesten Modellen. Es wurde über 300.000 Mal pro Tag verwendet und verarbeitete dabei 4,87 Milliarden Tokens pro Tag. Insgesamt wurden seit Start etwa 100 Milliarden Tokens verwertet.

  • Typischerweise läuft es auf etwa 25 Chutes-Instanzen mit jeweils 8xH200, also insgesamt 200 x H200 GPUs.

Vielen Dank an die Community für 4.500 Downloads von Hugging Face, an DeepSeek für die Erstellung der Basismodelle und an OpenRouter und Chutes für das Hosting.

P.S.: TNG mit etwa 1.000 Personen verarbeitet 100 Millionen Tokens/Tag. Somit entsprechen 5 Milliarden Token pro Tag etwa 50.000 Personen mit einem Verhalten wie dem unserer TNG-Kolleginnen und -Kollegen.

P.P.S.: Ein weiteres Modell ist in der Entwicklung.