Das chinesische Unternehmen für künstliche Intelligenz DeepSeek hat die Veröffentlichung seines neuen Modells für künstliche Intelligenz verschoben, nachdem es gescheitert ist, dieses mit Huawei-Chips zu trainieren, was die Einschränkungen verdeutlicht, mit denen China konfrontiert ist, um angemessene Ersatzprodukte für amerikanische Technologie zu finden. Laut drei mit der Angelegenheit vertrauten Quellen drängten die Behörden DeepSeek, nachdem das Unternehmen im Januar sein R1-Modell angekündigt hatte, den Ascend-Prozessor von Huawei anstelle der Nvidia-Systeme zu verwenden.
Allerdings stieß das chinesische Start-up während des Trainingsprozesses seines R2-Modells mit solchen Chips auf technische Probleme, was es dazu veranlasste, Nvidia-Chips für das Training des KI-Systems und Huawei-Chips für die Inferenz zu verwenden, so die Quellen. Das Training umfasst das Lehren des Modells anhand eines großen Datensatzes, während die Inferenz den Schritt bezeichnet, das trainierte Modell zu verwenden, um Vorhersagen zu treffen oder Antworten zu generieren, wie z. B. Anfragen von Chatbots.
Die Probleme waren der Hauptgrund, warum die Einführung des Modells im Mai verschoben wurde, was dazu führte, dass das Unternehmen seinen Vorsprung gegenüber den Wettbewerbern verlor, berichtete eine mit der Situation vertraute Quelle. Die Schwierigkeiten, mit denen DeepSeek konfrontiert ist, zeigen, wie chinesische Chips in wichtigen Aufgaben weiterhin hinter ihren amerikanischen Rivalen zurückbleiben, was die Herausforderungen verdeutlicht, mit denen China konfrontiert ist, um technologisch autark zu werden.
