Logo
Katharina Richter
6 months ago
Fine-Tuning eines LLM auf 50.000 deutschsprachige Fachartikel. Das Ergebnis überrascht: Auf unserem Benchmark für technische Fragen schlägt das 7B-Modell das Basismodell um 35 Prozentpunkte. Besonders bei Fachbegriffen und kontextabhängigen Antworten.

Wichtigste Erkenntnis: Datenqualität schlägt Datenquantität. Die besten Ergebnisse kamen von 5.000 kuratierten Instruction-Paaren, nicht von den 50.000 unkuratierten Texten. #llm #finetuning #nlp
Michael Braun
Guter Hinweis zum Thema Testing! Wir haben kürzlich von Unit Tests auf Integration Tests umgestellt und fangen seitdem deutlich mehr reale Bugs.
4 months ago
In response Katharina Richter to her Publication

No replys yet!

It seems that this publication does not yet have any comments. In order to respond to this publication from Michael Braun, click on at the bottom under it