פורסם לפני יותר מחודש
פורסמה ברשת
We seek a versatile Senior Software Engineer who is passionate about performance optimization and generative AI. Our team builds software solutions that enable efficient inference on the latest and greatest generative AI models. We tackle problems on all levels of the stackfrom server-level request batching to GPU kernel fusionand collaborate with teams across diverse disciplines to push our hardware to its full potential.

What youll be doing:

Cooperate with research teams to onboard new LLMs and VLMs into our opensource AI runtimes.

Optimize inference workloads using sophisticated profiling and simulation tools.

Build SOLID, extendable inference software systems, and refine robust APIs.

Implement and debug low-level GPU code to harness the latest HW features.

Own end-to-end inference acceleration features and work with teams around the world to deliver production-grade products.

Requirements:
What we need to see:

B.Sc., M.Sc. or equivalent experience in Computer Science or Computer Engineering.

5+ years of relevant hands-on software engineering experience.

Profound knowledge of software design principles.

Strong proficiency in at least one system and one scripting language.

Strong grasp of machine learning concepts.

People person with excellent communication skills that enjoys collaboration and teamwork.

Ways to stand out from the crowd:

Familiarity with our DL software stack, e.g. Triton Inference Server, TensorRT-LLM, and Model Optimizer.

Proven track record of performance modeling, profiling, debugging, and development in a performance-critical setting with our accelerators.

Familiarity with LLM quantization, fine-tunning, and caching algorithms.

Proficiency in GPU kernel programming (CUDA or OpenCL).

Prior experience working on a large software project with 50+ contributors.

This position is open to all candidates.
מידת ההתאמה שלי לתפקיד
התאמה למשרה
התאמתך לתפקיד מחושבת על פי כישורך (כפי שסיפרת לנו עליהם) מול דרישות המעסיק - אין בכך כדי להעיד על קבלתך לעבודה (זה יחליט המעסיק)
כישורים חסרים
משרות חדשות במערכת שיכולות לעניין אותך
נתניה
פורסם לפני 2 שבועות
העולם עובר מהפכה, הבינה המלאכותית ובמיוחד generative ai תחסל עשרות מיליוני משרות אנושיות.רוצה להשאר רלוונטי בעולם התעסוקה העתידי? מעונין לעבוד ...
דוברי שפות
פורסם לפני 3 שבועות
We are seeking a talented and passionate individual to join our team as a Generative AI Technical Expert. As a ...
דוברי שפות
פורסם לפני 2 חודשים
We are looking for a talented Product Designer with a proven track record in designing complex systems to join our ...
Mobileye
פורסם לפני 2 חודשים
The positionMobileye is looking for a Embedded SW Engineer for Performance Modeling. You will be part of EyeQ SoC Performance ...
Mobileye
פורסם לפני 2 חודשים
The positionMobileye is looking for a CPU Performance Engineer. You will be part of EyeQ SoC Performance Modeling and Profiling ...
פורסם לפני יותר מחודש
We are seeking a motivated and experienced machine learning engineer to join our team. As a machine learning engineer you ...
אזור מרכז - גוש דן
פורסם לפני יותר מחודש
We are looking for a NLP TEAM LEADER.As an NLP team lead, you will solve hard business problems using SOTA ...
פריוריטי סופטוור בעמ
אזור השרוןהוד השרוןהרצליה / רמת השרוןמודיעיןפתח תקווהראש העיןראשון לציוןתל אביב
פורסם לפני יותר מחודש
At Priority ERP, we serve tens of thousands of customers with our robust SaaS and on-prem solutions. We prioritize performance, ...
פורסם לפני יותר מחודש
We are looking for an experienced Data Scientist who can leverage and develop innovative machine learning, NLP, and generative AI ...
פורסם לפני יותר מחודש
We are looking for an experienced Algorithm Engineer to join our R&D Group.As a fast-growing, leading e-commerce company with vast ...
פורסם לפני יותר מחודש
We are committed to staying at the forefront of AI and NLP, and we are excited about the opportunities that ...
אזור מרכז - גוש דן
פורסם לפני יותר מחודש
Passion and dedication to your job and there’s no telling what you could accomplish. Dynamic, intelligent people and inspiring, innovative ...
דוברי שפות
פורסם לפני יותר מחודש
we are looking for a Algorithms DeveloperWhat will you actually be doing?Develop and apply advanced algorithms to the exciting and ...
דוברי שפות
פורסם לפני יותר מחודש
We are seeking an LLM Engineer to join our innovative team and contribute to the advancement of our security copilot. ...
דוברי שפות
פורסם לפני יותר מחודש
We are dedicated to making voice-controlled devices usable in all environments. Our patented Spatial Hearing technology enhances speech signals in ...
הצגת משרות נוספות