Research Engineer (LLM Training and Performance)

JetBrains GmbH
Berlin

Jobbeschreibung

Research Engineer (LLM Training and Performance)

Amsterdam, Netherlands; Belgrade, Serbia; Berlin, Germany; Limassol, Cyprus; London, United Kingdom; Madrid, Spain; Munich, Germany; Paphos, Cyprus; Prague, Czech Republic; Warsaw, Poland; Yerevan, Armenia

At JetBrains, code is our passion. Ever since we started back in 2000, we have been striving to make the strongest, most effective developer tools on earth. By automating routine checks and corrections, our tools speed up production, freeing developers to grow, discover, and create.

We’re looking for a Research Engineer who will own the training stack and model architecture for our Mellum LLM family. Your job is easier said than done: make training faster, cheaper, and more stable at a large scale. You’ll profile, design, and implement changes to the training pipeline – from architecture to custom GPU kernels, as needed.

As part of our team, you will:

  • Be responsible for improving end-to-end performance for multi-node LLM pre-training and post-training pipelines.
  • Profile hotspots (Nsight Systems/Compute, NVTX) and fix them using compute/comm overlap, kernel fusion, scheduling, etc.
  • Design and evaluate architecture choices (depth/width, attention variants including GQA/MQA/MLA/Flash-style, RoPE scaling/NTK, and MoE routing and load-balancing).
  • Implement custom ops (Triton and/or CUDA C++), integrate via PyTorch extensions, and upstream when possible.
  • Push memory/perf levers: FSDP/ZeRO, activation checkpointing, FP8/TE, tensor/pipeline/sequence/expert parallelism, NCCL tuning.
  • Harden large runs by building elastic and fault-tolerant training setups, ensuring robust checkpointing, strengthening reproducibility, and improving resilience to preemption.
  • Keep the data path fast using streaming and sharded data loaders and tokenizer pipelines, as well as improve overall throughput and cache efficiency.
  • Define the right metrics, build dashboards, and deliver steady improvements.
  • Run both pre-training and post-training (including SFT, RLHF, and GRPO-style methods) efficiently across sizable clusters.

Voraussetzungen

We’ll be happy to bring you on board if you have:

  • Strong PyTorch and PyTorch Distributed experience, having run multi-node jobs with tens to hundreds of GPUs.
  • Hands-on experience with Megatron-LM/Megatron-Core/NeMo, DeepSpeed, or serious FSDP/ZeRO expertise.
  • Real profiling expertise (Nsight Systems/Compute, nvprof) and experience with NVTX-instrumented workflows.
  • GPU programming skills with Triton and/or CUDA, and the ability to write, test, and debug kernels.
  • A solid understanding of NCCL collectives, as well as topology and fabric effects (IB/RoCE), and how they show up in traces.

Our ideal candidate would have experience with:

  • FlashAttention-2 and 3, CUTLASS and CuTe, TransformerEngine and FP8, Inductor, AOTAutograd, and torch.compile.
  • MoE at scale (expert parallel, router losses, capacity management) and long-context tricks (ALiBi/YaRN/NTK scaling).
  • Kubernetes or SLURM at scale, placement and affinity tuning, as well as AWS, GCP, and Azure GPU fleets.
  • Web-scale data plumbing (streaming datasets, Parquet and TFRecord, tokenizer perf), eval harnesses, and benchmarking.
  • Safety and post-training methods, such as DPO, ORPO, GRPO, and reward models.
  • Inference ecosystems such as vLLM and paged KV.

Wir bieten Ihnen

We are an equal opportunity employer

We know great ideas can come from anyone, anywhere. That’s why we do our best to create an open and inclusive workplace – one that welcomes everyone regardless of their background, identity, religion, age, accessibility needs, or orientation.

Veröffentlicht am 2026-05-15

Empfohlene Jobs

Qualitätsbeauftragte (m/w/d) - Hier gehörst Du hin!

Vitanas Pflege Centrum Neuendorfer Hof
Berlin

Über uns Herzlich willkommen im Vitanas Pflege Centrum Neuendorfer Hof!Im Vitanas Pflege Centrum Neuendorfer Hof arbeitest Du in einer neu entstehenden Pflegeeinrichtung in Berlin-Spandau. Das Haus …

Details Anzeigen
Veröffentlicht am 2026-04-30

Qualitätsbeauftragte*r

Vivantes Netzwerk für Gesundheit GmbH
Berlin

Vivantes ist Berlins größtes Gesundheitsnetzwerk – gemeinsam verbunden in der Arbeit mit und an den Menschen. In über 100 Fachkliniken, Instituten und Pflegeeinrichtungen stellen wir die erstklassig…

Details Anzeigen
Veröffentlicht am 2026-05-27

Altenpfleger (m/w/d) Dauernachtwache

Perso Plankontor
Berlin

Jobbeschreibung Ab sofort suchen wir examinierte Altenpfleger, Gesundheits- und Krankenpfleger oder Pflegefachkräfte für ein Seniorenheim oder auch eine klinische Einrichtung als Dauernac…

Details Anzeigen
Veröffentlicht am 2026-04-12

Project Manager - EP

Parexel
Berlin

When our values align, there's no limit to what we can achieve. At Parexel, we all share the same goal - to improve the world's health. From clinical trials to regulatory, consulting, and ma…

Details Anzeigen
Veröffentlicht am 2026-05-15

Sicherheitsmitarbeiter für Asyl- und Flüchtlingsunterkünfte (m/w/d) in Berlin-Neukölln

ZSBV – Zentralstelle für Sichere Bildungsvermittlung
Berlin

Hier ist Ihre Chance: Neuer Job als Sicherheitsmitarbeiter für Asyl- und Flüchtlingsunterkünfte (m/w/d) in Berlin-Neukölln. Das Arbeitsumfeld in Berlin-Neukölln bietet Ihnen feste Objekteinsätze mit…

Details Anzeigen
Veröffentlicht am 2026-05-06

Elektriker im Technischen Gebäudemanagement (m/w/d)

OPPM OFFICE Professional Personalmanagement GmbH
Berlin

Elektriker im Technischen Gebäudemanagement (m/w/d) Elektroniker/in - Betriebstechnik Handwerk, Bau, Industrie Berlin Jetzt bewerben Referenznummer: 80/65921 Anstellungs…

Details Anzeigen
Veröffentlicht am 2026-06-03

Monteur/in für Elektrobranche gesucht (m/w/d)

PerZukunft Arbeitsvermittlung GmbH&Co.KG
Berlin

Wir [suchen] für unseren Kunden motivierte Monteur/in (m/w/d). Bei uns können Sie die Produktion von Schrittmachern mit Ihrer Fähigkeiten mehr als verbessern. Da uns unsere Arbeit und Mitarbeiter seh…

Details Anzeigen
Veröffentlicht am 2026-05-15

Senior Finance Business Partner: Operations & Performance (m/w/d)

Berlin

Wir suchen … Dich als Senior Finance Business Partner: Controlling & Operational Excellence (m/w/d) um gemeinsam mit uns bei thermondo einen wichtigen Beitrag zur Klimaneutralität zu leisten…

Details Anzeigen
Veröffentlicht am 2026-05-06