Home / Geschäft und Politik / DeepSeek verschiebt Veröffentlichung des neuen Modells für künstliche Intelligenz

DeepSeek verschiebt Veröffentlichung des neuen Modells für künstliche Intelligenz

Image by: foto Imago/vcg

Das chinesische Unternehmen für künstliche Intelligenz DeepSeek hat die Veröffentlichung seines neuen Modells für künstliche Intelligenz verschoben, nachdem es gescheitert ist, dieses mit Huawei-Chips zu trainieren, was die Einschränkungen verdeutlicht, mit denen China konfrontiert ist, um angemessene Ersatzprodukte für amerikanische Technologie zu finden. Laut drei mit der Angelegenheit vertrauten Quellen drängten die Behörden DeepSeek, nachdem das Unternehmen im Januar sein R1-Modell angekündigt hatte, den Ascend-Prozessor von Huawei anstelle der Nvidia-Systeme zu verwenden.

Allerdings stieß das chinesische Start-up während des Trainingsprozesses seines R2-Modells mit solchen Chips auf technische Probleme, was es dazu veranlasste, Nvidia-Chips für das Training des KI-Systems und Huawei-Chips für die Inferenz zu verwenden, so die Quellen. Das Training umfasst das Lehren des Modells anhand eines großen Datensatzes, während die Inferenz den Schritt bezeichnet, das trainierte Modell zu verwenden, um Vorhersagen zu treffen oder Antworten zu generieren, wie z. B. Anfragen von Chatbots.

Die Probleme waren der Hauptgrund, warum die Einführung des Modells im Mai verschoben wurde, was dazu führte, dass das Unternehmen seinen Vorsprung gegenüber den Wettbewerbern verlor, berichtete eine mit der Situation vertraute Quelle. Die Schwierigkeiten, mit denen DeepSeek konfrontiert ist, zeigen, wie chinesische Chips in wichtigen Aufgaben weiterhin hinter ihren amerikanischen Rivalen zurückbleiben, was die Herausforderungen verdeutlicht, mit denen China konfrontiert ist, um technologisch autark zu werden.

Die Financial Times berichtete diese Woche, dass Peking chinesische Technologieunternehmen aufgefordert hat, ihre Bestellungen von Nvidias H20 zu rechtfertigen, um sie zu ermutigen, Alternativen von Huawei und Cambricon zu fördern. Brancheninsider behaupten, dass chinesische Chips instabil sind, eine langsamere Konnektivität haben und im Vergleich zu Nvidias Produkten minderwertige Software bieten.

Huawei schickte ein Team von Ingenieuren ins Büro von DeepSeek, um dem Unternehmen bei der Nutzung des Ascend-Chips für die Entwicklung des R2-Modells zu helfen, sagten zwei Personen. Trotz der Anwesenheit des Expertenteams war DeepSeek nicht in der Lage, erfolgreiches Training auf dem Ascend-Chip durchzuführen, wird berichtet. DeepSeek arbeitet weiterhin mit Huawei zusammen, um die Ascend-Chip-Modelle auch für die Inferenz kompatibel zu machen.