התפקיד במילים פשוטות
מהנדס למידה עמוקה זה יהיה אחראי על תחזוקה ושיפור תשתית האימון, פיתוח, הרחבה ובדיקה של רעיונות חדשים, והתאמת קוד לניצול מיטבי של מאיצי חומרה מתקדמים. התפקיד כולל עבודה עם מודלי שפה גדולים (LLMs) ואימון מבוזר בקנה מידה גדול.
- B.Sc. in computer science, software engineering or equivalent
- Self learner, and proven record of ability to remove technical road-blocks
- 5+ years experience developing software for production systems and/or internal infrastructure/tools
- Prior experience working with cloud computing platforms (e.g. AWS, GCP, Docker, Kubernetes)
- Skilled at writing production-grade Python code
חולץ מתיאור המשרה · מתעדכן אוטומטית
למי זה מתאים
התפקיד מתאים למהנדסים בעלי תואר ראשון במדעי המחשב או הנדסת תוכנה, עם למעלה מ-5 שנות ניסיון בפיתוח תוכנה למערכות ייצור או תשתית פנימית. נדרש ניסיון בעבודה עם פלטפורמות ענן, קידוד Python ברמת ייצור וניסיון מעשי בלמידה עמוקה/מכונה.
תיאור המשרה המלא
המשרה המקורית · נשמר לעיוןOur team is looking for a Deep Learning Engineer. AI21 is one of the few companies to have trained multi-billion parameter Large Language Models (LLMs), a feat that involves the most advanced engineering (large scale distributed training on thousands of cores). Serving these LLMs efficiently requires cutting-edge technology as well. As a deep learning engineer on the team, you will be responsible for maintaining and improving our training infrastructure, developing/scaling/testing new ideas, and adapting our code to run on and best utilize the newest and most advanced hardware accelerators.
Requirements: B.Sc. in computer science, software engineering or equivalent Self learner, and proven record of ability to remove technical road-blocks 5+ years experience developing software for production systems and/or internal infrastructure/tools Prior experience working with cloud computing platforms (e.g. AWS, GCP, Docker, Kubernetes) Skilled at writing production-grade Python code Hands-on experience in deep learning and machine learning (TensorFlow/PyTorch..) Any one of the following: Optimization of deep learning model training (E.g. parallelization, megatron, deepspeed, FSDP) - or - Custom kernel experience (C++/CUDA and/or Triton) - or - Distributed Systems, in particular distributed deep learning training/serving
שאלות על המשרה
- המשרה לא ציינה שכר. אנחנו מציגים שכר רק כשהמעסיק מפרסם אותו.
- היברידי
- B.Sc. in computer science, software engineering or equivalent, Self learner, and proven record of ability to remove technical road-blocks, 5+ years experience developing software for production systems and/or internal infrastructure/tools, Prior experience working with cloud computing platforms (e.g. AWS, GCP, Docker, Kubernetes), Skilled at writing production-grade Python code