News-Archiv Alle Projekt-News Community-News Veröffentlichungen Künstliche Intelligenz Big Techday 12. Juni 2025 Artikel "How Long Prompts Block Other Requests - Optimizing LLM Performance" Bei TNG verarbeiten unsere LLMs täglich mehr als 100 Millionen Token, um über 10 Millionen Token für 50+ verschiedene Anwendungen zu generieren. Um dies effizient zu verarbeiten... Bei TNG verarbeiten unsere LLMs täglich mehr als 100 Millionen Token, um über 10 Millionen Token für 50+ verschiedene Anwendungen zu generieren. Um dies effizient zu verarbeiten... 11. Juni 2025 Artikel "KI-gestützte Java-Migration" Unser neuer Artikel zeigt, wie Sie veralteten Legacy-Code mit Künstlicher Intelligenz modernisieren und auf eine neue Java-Version migrieren können. Unser Artikel „KI-gestützte Java-Migration“ zeigt Ihnen, wie Sie veralteten Legacy-Code mit Künstlicher Intelligenz modernisieren und auf eine neue Java-Version migrieren können.I... 5. Juni 2025 24-Stunden Follow the Sun Hackathon Unser 24-Stunden Follow the Sun Hackathon brachte 19 Kolleginnen und Kollegen aus Australien, Deutschland, Ungarn und dem Vereinigten Königreich zusammen. Einen ganzen Tag lang... Unser 24-Stunden Follow the Sun Hackathon brachte 19 Kolleginnen und Kollegen aus Australien, Deutschland, Ungarn und dem Vereinigten Königreich zusammen. Einen ganzen Tag lang... 2. Juni 2025 Update von unserem Roboter G1PO Unser Roboter "G1PO" hat mit Hilfe von Reinforcement Learning erfolgreich das Laufen beigebracht bekommen. In den vergangenen Wochen hat unser Innovation Hacking Team unserem Unitree G1 Roboter "G1PO" mit Hilfe von Reinforcement Learning erfolgreich das Laufen beigebracht.... 29. Mai 2025 DeepSeek-R1T-Chimera: Erstmals 1 Milliarde Tokens pro Tag Seit bereits einem Monat ist unser R1T Chimera 671B Open-Weights-Modell, zusammengesetzt aus DeepSeek R1 und V3-0324, nun im Einsatz. Unser R1T Chimera 671B Open-Weights-Modell, zusammengesetzt aus DeepSeek R1 und V3-0324, ist nun seit einem Monat im Einsatz.In der Spitze wurden auf bis zu 1,35 Milliarden... 8. Mai 2025 Erweiterung unseres Rechenclusters Acht neue AMD MI325X GPUs haben unser bestehendes Rechencluster aus 24 H100 GPUs erweitert. Der neue Supermicro-Server ist ein hochleistungsfähiger KI-Server mit 2 Terabyte... Acht neue AMD MI325X GPUs haben unser bestehendes Rechencluster aus 24 H100 GPUs erweitert. Der neue Supermicro-Server ist ein hochleistungsfähiger KI-Server mit 2 Terabyte... 2. Mai 2025 Veröffentlichung von DeepSeek-R1T-Chimera Das DeepSeek-R1T-Chimera, ein Open-Weights-Modell, das die Reasoning-Fähigkeiten von R1 zu DeepSeek AI V3-0324 hinzufügt, wurde veröffentlicht. Am Wochenende haben wir DeepSeek-R1T-Chimera veröffentlicht. Dabei handelt es sich um ein Open-Weights-Modell, das die Reasoning-Fähigkeiten von R1 zu DeepSeek AI V3-0324... 23. April 2025 Artikel "Finetuning olmOCR to be a faithful OCR-Engine" Zur Automatisierung von internen Arbeitsabläufe haben wir kürzlich ein KI-gestütztes Fine-Tuning vorgenommen. Wir haben kürzlich ein Fine-Tuning eines auf olmOCR basierenden KI-Modells für optische Zeichenerkennung (OCR) vorgenommen, um unsere internen Arbeitsabläufe bei der Verarbeitung... 22. April 2025 Rückblick auf unser drittes AI & Prompt Engineering Meetup Im Rahmen unseres dritten AI & Prompt Engineering Meetups haben wir kürzlich 60 Gäste zu einem Abend voller Experimente mit Generativer KI in unserem Münchner Büro begrüßt. In... Im Rahmen unseres dritten AI & Prompt Engineering Meetups haben wir kürzlich 60 Gäste zu einem Abend voller Experimente mit Generativer KI in unserem Münchner Büro begrüßt. In... 17. April 2025 Artikel "Rapid Prototyping of Collaborative Applications with CRDTs" Für erfolgreiche Remote-Arbeit ist es unerlässlich, dass mehrere Personen gleichzeitig das selbe Dokument bearbeiten können. Doch beim Aufsetzen neuer Anwendungen kann es anfangs... Für erfolgreiche Remote-Arbeit ist es unerlässlich, dass mehrere Personen gleichzeitig das selbe Dokument bearbeiten können. Doch beim Aufsetzen neuer Anwendungen kann es anfangs... 16. April 2025 Artikel "Prefill and Decode for Concurrent Requests - Optimizing LLM Performance" Bei TNG hosten wir zahlreiche Large Language Modelle auf einem leistungsstarken Cluster von 24 H100-GPUs. Es unterstützt 50 verschiedene Anwendungen, bearbeitet über 5.000... Bei TNG hosten wir zahlreiche Large Language Modelle auf einem leistungsstarken Cluster von 24 H100-GPUs. Es unterstützt 50 verschiedene Anwendungen, bearbeitet über 5.000... 4. April 2025 Artikel "Efficient Request Queueing – Optimizing LLM Performance" Large Language Models für mehrere Anwendungen und Nutzerinnen und Nutzer parallel bereitzustellen ist anspruchsvoll, da diese um begrenzte GPU-Ressourcen konkurrieren. Im ersten... Large Language Models für mehrere Anwendungen und Nutzerinnen und Nutzer parallel bereitzustellen ist anspruchsvoll, da diese um begrenzte GPU-Ressourcen konkurrieren. Im ersten... 1 2 3 Nächste Aktuelle News findet man hier.