DeepSeek das im chinesischen Hangzhou Unternehmen für künstliche Intelligenz (KI) ,hat am Mittwoch eine Version Prover-Modells veröffentlicht. Das Large Language Model (LLM) verwendet die Programmier sprache Lean 4, um zu überprüfen, ob die mathematischen Beweise konsistent sind, indem jeder Schritt analysiert wird Versionen .Des chinesischen Unternehmens ist Ähnlich DeepSeek-Prover-V2 ein Open-Source-Modell und kann von beliebten Repositories zum beispiel GitHub und Hugging Face herunter geladen werden.DeepSeek ist das neue mathematikorientierte KI-Modell.
Das KI-Unternehmen hat das neue Modell auf GitHub-Listing-Seite detailliert beschrieben. Es handelt sich um die Argumentation ausgerichtetes Modell mit einer sichtbaren Gedankenkette (CoT), das im Bereich der Mathematik funktioniert. Das kommt in Dezember 2024 veröffentlichten KI-Modell DeepSeek-V3 und ist daraus abgeleitet.
DeepSeek-Prover-V2 ist einsetzbar. Es kann mathematische Probleme auf High-School- und College-Niveau lösen und Fehler in mathematischen Theorembeweisen finden . Es kann auch als Lehrmittel verwendet werden und Schritt-für-Schritt-Erklärungen für Beweise generieren und es kann Mathematikern und Forschern dabei helfen neue Theoreme zu erforschen und ihre Gültigkeit zu beweisen.
Es ist in zwei Modell größen verfügbar . einer mit sieben Milliarden Parametern und einer größeren mit 671 Milliarden Parametern. . Was die Vor trainings prozesse betrifft, implementierten die Forscher ein Kaltstart-Trainingssystem, indem sie das Basismodell dazu auf forderten, komplexe Probleme zu zerlegen. Diese Probleme sieht als eine Reihe von Unterzielen. die Beweise wurden für die gelösten Teilziele zum CoT hinzugefügt und mit der Basismodells kombiniert, um einen ersten Kalt start für das Lernen zu erstellen.
das KI-Modell kann GitHub auch aus der Hugging Face-Liste von DeepSeek heruntergeladen werden. Das Prover-V2-Modell verdeutlicht, wie iterative Änderungen am Trainingsprozess von KI-Modellen Verbesserung ihrer Fach kompetenz führen können wie bei anderen Open-Source-Modellversionen sind Details nicht bekannt.