Relevance 10/10Training ParadigmsIntermediate8 min read

Supervised Fine-Tuning (SFT)

SFT trains models on high-quality human-curated instruction and response pairs.

Why it matters for annotators

Poor SFT examples directly reduce model quality and consistency.

Instruction-response pairs -> model learns target behavior.

Scenario: Real annotation scenario involving Supervised Fine-Tuning (SFT)

Bad: Labeling quickly without applying project rubric.

Good: Applying rubric criteria, documenting rationale, and escalating uncertainty.