כדי לראות תפקידים מתאימים עליך להוסיף כישורים בפרופיל האישי במערכת COB.
ההרשמה והשימוש חינם!
מעולה, רוצה להירשם
בוגרי מדעי המחשב|הנדסה|מהנדס תוכנה|תוכנה
פורסם לפני יותר מחודשיים
פורסמה ברשת
We are looking for a talented Senior HPC and AI Networking Performance Research and Analysis Engineer to join our Performance group.

The ideal candidate will profile and analyze AI workloads on large GPUs and CPUs scale clusters for distributed Deep Learning LLM training focusing at the collectives communication and networking.

You will work and interact with many types of HW and platforms such as HCAs, Switches, CPUs, GPUs, and Systems.

You will experience with and develop performance analysis tools and methodologies to dive deeply into the details, understand performance expectation, limitations, and bottlenecks.

What you'll be doing:

Experience and research AI workloads and DL models specifically tailored for large-scale deep learning LLM training on NVIDIA supercomputers with a focus on High-performance networking.

Benchmarking, Profiling, and Analyzing the performance to find bottlenecks and identify areas of improvement and optimizations, with a strong emphasis on networking aspects.

Implement performance analysis tools.

Collaborating with many teams from HW to SW to provide performance analysis insights.

Define performance test planning , set performance expectations for new technologies and solutions, and work to reach the performance targets limits.

Requirements:
What we need to see:

B.Sc in Computer Science or Software Engineering.

5+ years of experience with high-performance Networking (RDMA, MPI).

Demonstrated Performance Analysis skills and methodologies.

Experience with our GPUs, CUDA library, deep learning frameworks like TensorFlow or PyTorch, combined with expertise in networking collective communication libraries (such as NCCL) and protocols (such as RoCE and RDMA).

Fast and self-learning capabilities with strong analytical and problem-solving skills.

Programming Languages: Python, Bash and C languages.

Experience with Linux OS distros.

Team player with good communication and interpersonal skills.

Ways to stand out from the crowd:

In-depth knowledge and experience with AI workloads and benchmarking for distributed LLM training.

Knowledge in CUDA, and NCCL libraries.

Knowledge in Congestion Control algorithms.

In-depth System knowledge and understanding (Intel / AMD / ARM CPUs, our GPUs, HCA, Memory, PCI).

Strong Performance Analysis skills and methodologies using modern tools.

This position is open to all candidates.
מידת ההתאמה שלי לתפקיד
התאמה למשרה
התאמתך לתפקיד מחושבת על פי כישורך (כפי שסיפרת לנו עליהם) מול דרישות המעסיק - אין בכך כדי להעיד על קבלתך לעבודה (זה יחליט המעסיק)
משרות חדשות במערכת שיכולות לעניין אותך
דוברי שפות
פורסם לפני יותר מחודשיים
About LiveU Join the leader in live IP-video solutions for the world's top broadcasters, sports, public safety and other organizations. ...
דוברי שפות
פורסם לפני יותר מחודשיים
Required Senior ML EngineerResponsibilities:As a Senior Machine Learning engineer, you will be working directly with our Head of R&D and ...
דוברי שפות
רעננה
פורסם לפני יותר מחודשיים
Our technology has no boundaries! We are building the worlds most groundbreaking and state-of-the-art accelerated computing platforms. Because of our ...
דוברי שפות
פורסם לפני יותר מחודשיים
As a Principal Engineer you will be instrumental in shaping the R&D Groups technical vision, working on high-impact projects crucial ...
דוברי שפות
פורסם לפני יותר מחודשיים
We have been defining computer graphics, PC gaming, and accelerated computing for more than 25 years. With an outstanding legacy ...
דוברי שפות
רעננה
פורסם לפני יותר מחודשיים
As a Senior Software Architect in the Accelerated Computing System and Software team, you will define Software Defined Networking (SDN) ...
פורסם לפני יותר מחודשיים
We are looking for an experienced software engineer with a strong background in optimizing parallel frameworks to hardware runtime, who ...
פורסם לפני יותר מחודשיים
We are seeking a top notch network software engineer to design and implement novel packet processing methods and contribute to ...
פורסם לפני יותר מחודשיים
Our technology has no boundaries! We are building the worlds most groundbreaking and innovative accelerated compute platforms for the world ...
היברידי
פורסם לפני יותר מחודשיים
We are looking for a Talented individual, LLM AI Engineer who will join the R&D team.In this role, you will ...
רעננה
פורסם לפני יותר מחודשיים
Our SOC Architecture team is looking for a Senior Data Scientists with SW development skills and HW-System architecture experience. Do ...
אזור מרכז - גוש דן
פורסם לפני יותר מחודשיים
abra R&D is seeking a skilled and experienced Linux BSP Specialistto join our team: We're seeking a skilled Linux BSP ...
רעננה
פורסם לפני יותר מחודשיים
Our technology has no boundaries! We are building the worlds most groundbreaking and state of the art accelerated compute platforms ...
באר שבערעננה
פורסם לפני יותר מחודשיים
We have continuously reinvented itself over two decades. Our invention of the GPU in 1999 sparked the growth of the ...
הצגת משרות נוספות
שימו לב: זה טווח השכר הממוצע לסוג תפקיד בשוק רק המעסיק יקבע את השכר בפועל.
בחירת כישורים
סמן את הכישורים שיש לכם
הצג את פרטי הכישורים שלך במהירות למעסיקים על ידי מילוי פרטים
הוספת כישורים נוספים שלהערכתם יכולים גם להתאים למשרה זאת