Logo
Katharina Richter
6 months ago
Fine-Tuning eines LLM auf 50.000 deutschsprachige Fachartikel. Das Ergebnis überrascht: Auf unserem Benchmark für technische Fragen schlägt das 7B-Modell das Basismodell um 35 Prozentpunkte. Besonders bei Fachbegriffen und kontextabhängigen Antworten.

Wichtigste Erkenntnis: Datenqualität schlägt Datenquantität. Die besten Ergebnisse kamen von 5.000 kuratierten Instruction-Paaren, nicht von den 50.000 unkuratierten Texten. #llm #finetuning #nlp
Markus Weber
Klasse Post! Teile mal bitte auch die Fehlschläge - aus Misserfolgen lernt man oft mehr als aus Erfolgsgeschichten.
4 months ago
In response Katharina Richter to her Publication

No replys yet!

It seems that this publication does not yet have any comments. In order to respond to this publication from Markus Weber, click on at the bottom under it