Relevance 7/10Safety and PolicyAdvanced6 min read

Adversarial Example Awareness

Adversarial example awareness identifies inputs crafted to trigger model errors.

Why it matters for annotators

Awareness improves robustness testing and safety evaluation quality.

Adversarial input -> model failure mode -> defensive label.

Scenario: Real annotation scenario involving Adversarial Example Awareness

Bad: Labeling quickly without applying project rubric.

Good: Applying rubric criteria, documenting rationale, and escalating uncertainty.