Evaluation Scenario Writer - AI Agent Testing Specialist

Mindrift
Berlin

Please submit your CV in English and indicate your level of English proficiency.

Mindrift connects specialists with project-based AI opportunities for leading tech companies, focused on testing, evaluating, and improving AI systems. Participation isproject-based, not permanent employment.

What this opportunity involves

You’ll create challenging coding test cases that push AI coding systems to their limits:

  • Review and refine realistic coding tasks based on provided production codebases with realistic scope, requirements and information sources
  • Write comprehensive functional tests that validate actual end-to-end behavior and edge-cases, not just superficial checks
  • Craft “fair but hard” challenges where the AI has all the context it needs, but has to work for it (information scattered across files and external sources, complex reasoning required)
  • Analyze AI failures to understand what the model struggles with vs. what it masters
  • Iterate based on feedback from expert QA reviewers who score your work on 7 quality criteria

What we look for

This opportunity is a good fit for experienced developers, software engineers, and/or test automation specialists open to part-time, non-permanent projects. Ideally, contributors will have:

  • Degree in Computer Science, Software Engineering or related fields
  • 5+ years in software development, primarily Python (pytest, async/await, subprocess, file operations)
  • Background in Full-Stack development, with an equal focus on building React-based interfaces and robust Back-end systems
  • Experience writing tests (functional, integration – not just running them)
  • Docker containers (running evaluations locally in containers)
  • CI/CD understanding (GitHub Actions as a user: triggers, labels, reading results)
  • English proficiency - B2

How it works

Apply → Pass qualification(s) → Join a project → Complete tasks → Get paid

Effort estimate 

Tasks for this project are estimated to take 20 hours to complete, depending on complexity. This is an estimate and not a schedule requirement; you choose when and how to work. Tasks must be submitted by the deadline and meet the listed acceptance criteria to be accepted.

Payment

  • Paid contributions, with rates up to $50/hour*
  • Fixed project rate or individual rates, depending on the project
  • Some projects include incentive payments

*Note: Rates vary based on expertise, skills assessment, location, project needs, and other factors. Higher rates may be offered to highly specialized experts. Lower rates may apply during onboarding or non-core project phases. Payment details are shared per project.

Veröffentlicht am 2026-02-15

Empfohlene Jobs

Assistenzarzt Urologie im Großraum Berlin (m/w/d)

Berlin

Zum nächstmöglichen Zeitpunkt wird ein Assistenzarzt Urologie (m/w/d) zur Unterstützung der urologischen Klinik unseres Kunden, ein Klinikum der Schwerpunktversorgung im Großraum Berlin gesucht. Es …

Details Anzeigen
Veröffentlicht am 2025-09-10

Apotheke sucht Maschinen- und Anlagenführer m/w/d

PerZukunft Arbeitsvermittlung GmbH&Co.KG
Berlin

Für [unseren] Kunden sind wir derzeit auf der Suche nach mehreren Maschinen- und Anlagenführern (m/w/d). Das Unternehmen ist im medizinischen Bereich tätig. Es werden dort medizinische Geräte als auc…

Details Anzeigen
Veröffentlicht am 2025-11-20

Sales Development Representative (SaaS Start-up, German...

Synmatch AI
Berlin

Client of Synmatch AI is looking for (Senior) BDR / SDR – SaaS Start-up (m/w/d) Arbeitsort: Remote innerhalb ±1 Stunde CET Über die Rolle Ein SaaS-Start-up aus dem Umfeld von Synmatch AI such…

Details Anzeigen
Veröffentlicht am 2025-12-30

Office Managerin (m/w/d)

AVART Personal GmbH
Neukölln, Berlin

Office Managerin (m/w/d) Job-ID: 13505 Im Auftrag eines etablierten und spezialisierten mittelständischen Unternehmens aus dem Bereich Umwelttechnik suchen wir zum nächstmöglichen Zeitpunkt eine en…

Details Anzeigen
Veröffentlicht am 2025-12-18

Physiotherapeut bis zu 4680€ Gehalt in Wilmersdorf/Schöneberg (m/w/d)

Die Zwei Physiotherapie
Berlin

Wichtigste in Kürze: bis 4680 € Gehalt pro Monat in Vollzeit für jede*n Physiotherapeut * Physiotherapeutin Montag-Freitag - Wochenende und Feiertage frei kostenlose Fitness und Wellness Mit…

Details Anzeigen
Veröffentlicht am 2026-02-15

E-Mail Marketing Manager (w/m/d)

Every.
Berlin

E-mail Marketing Manager:in Wir suchen eine kreative und schreibstarke Persönlichkeit, die Lust hat, unser CRM-Team mit frischen Ideen und Tatkraft zu bereichern! Du fühlst Dich im Bereich Ernähru…

Details Anzeigen
Veröffentlicht am 2026-02-09

Head of Operations South Germany (w/m/d)

Buena GmbH
Berlin

Learning curve vs. doing curve Jan here, the COO. I don’t believe in preemptive learning. What you’ve learned so far doesn’t really matter. No one will ask you about it. How many amazing things di…

Details Anzeigen
Veröffentlicht am 2025-10-15

Software Engineer, macOS Core Product - Berlin, Germany

Speechify
Berlin

About Speechify At Speechify, our mission is to ensure reading is never a barrier to learning . Over 50 million people use Speechify's text-to-speech products—including apps on iOS, Android, ma…

Details Anzeigen
Veröffentlicht am 2026-01-09

Physiotherapeut für Praxis Österreich

CareToMatch
Berlin

Stellenangebot: Physiotherapeut/in – Spannende Position in einem internationalen und aktiven Umfeld Für eine moderne Physiotherapiepraxis mit zwei Standorten in einer wunderschönen Gegend in Öster…

Details Anzeigen
Veröffentlicht am 2026-02-09

Lackierer (m/w/d) - Queereinsteiger

PerZukunft Arbeitsvermittlung GmbH&Co.KG
Berlin

Sie [[sind]] eine ausgebildete Fachkraft (m/w/d) und suchen seit längerem einen Job? dann sind Sie bei uns genau richtig! Wir suchen im Kundenauftrag nach einem Lackierer (m/w/d), der ab sofort in Vo…

Details Anzeigen
Veröffentlicht am 2025-12-03