פורסם לפני יותר מחודש
פורסמה ברשת
we are looking for an experienced Site Reliability Engineering (SRE) Engineer with a passion for cloud-native system observability and a track record in implementing state-of-the-art monitoring solutions that offer comprehensive insights.
As an SRE Engineer, you will be instrumental in driving the adoption of progressive delivery practices, ensuring the deployment of robust and reliable systems with minimal operational disruptions.
Responsibilities
Master the art of cloud-native system observability by identifying and deploying monitoring tools and solutions that provide deep operational insights, ensuring the reliability and performance of cloud infrastructure.
Champion progressive delivery methods, employing strategies and technologies that enable the smooth and reliable deployment of systems, minimizing downtime and operational friction.
Live and breathe system metrics, utilizing data to drive significant improvements across the platform. Your knack for interpreting complex data into actionable plans will be key to enhancing system reliability and performance.
Commit to maintaining high system uptime, rigorously meeting and exceeding Service Level Agreements (SLAs), Service Level Indicators (SLIs), and Service Level Objectives (SLOs), ensuring platform remains highly available and performant.
Adopt a proactive approach to system optimization, continuously seeking opportunities to improve infrastructure before issues arise, enhancing system efficiency and reducing the likelihood of unexpected downtime.
Work closely with Engineering, DevOps, and Product teams to integrate observability and reliability best practices into the architectural and infrastructure design, ensuring security and performance from the ground up.
Lead and contribute to the design and support of best-in-class integrations with third-party partners, vendors, and clients, alongside Architects, Developers, System, and Security Owners.
Train and educate the Technology team on SRE principles, tools, and best practices.
Respond to and manage incidents with a focus on rapid recovery and minimizing impact, utilizing insights gained to prevent future occurrences.

Requirements:
Implement Advanced Observability Frameworks: Design and deploy comprehensive observability systems to monitor health, performance, and reliability of cloud-native applications. Utilize advanced tools for logging, metrics collection, and event monitoring to ensure deep visibility into system operations.
Deep knowledge of cloud platforms (AWS, GCP, Azure) and experience with cloud-native technologies.
Deep understanding of Kubernetes infrastructure.
Proficiency in monitoring tools (datadog, Prometheus, Grafana) and experience in setting up comprehensive monitoring and alerting systems.
Excellent problem-solving skills and the ability to work under pressure to resolve incidents and ensure system reliability.
Progressive Delivery Expertise: Leverage progressive delivery techniques such as canary releases (argo rollouts) – BIG advantage.
Tracing and Debugging: manage distributed tracing systems (Datadog APM / Jaeger / OpenTelemetry) to diagnose and troubleshoot complex issues across microservices architectures. Employ effective logging and tracing strategies to pinpoint root causes of incidents and performance bottlenecks – BIG advantage.
Programming and Scripting Skills: Proficiency in programming languages such as Python and Go, and Bash – MUST.
Good presentation skills: Ability to articulate technically advanced issues to all audiences; Ability to mentor and train internal staff.
Strong organizational skills and excellent attention to details.
Ability to effectively prioritize and execute tasks.
Self-driven.
Excellent English.

This position is open to all candidates.
מידת ההתאמה שלי לתפקיד
התאמה למשרה
התאמתך לתפקיד מחושבת על פי כישורך (כפי שסיפרת לנו עליהם) מול דרישות המעסיק - אין בכך כדי להעיד על קבלתך לעבודה (זה יחליט המעסיק)
כישורים חסרים
משרות חדשות במערכת שיכולות לעניין אותך
CodeValue
דוברי שפות
חולון / בת יםיבנהלוד / רמלהמודיעיןפתח תקווהראש העיןראשון לציוןרחובות / נס ציונה/ גדרהתל אביב
פורסם לפני יותר מחודש
[email protected] CodeValue, founded in 2010, is a dynamic software development services company that delivers supreme architectural and technical expertise.Our mission ...
דוברי שפות
פתח תקווהרעננה
פורסם לפני יותר מחודש
Key Responsibilities Design, implement, and manage scalable and reliable cloud infrastructure using Kubernetes.Develop and maintain infrastructure as code with Terraform.Automate ...
דוברי שפות
פורסם לפני יותר מחודש
Required Senior DevOps EngineerAbout the Role:As a DevOps Engineer, your work will have a direct impact on development processes across ...
דוברי שפות
אזור מרכז - גוש דן
פורסם לפני יותר מחודש
חברה מגייסת מפתח/ת DevOps.במסגרת התפקיד פיתוח ומימוש תהליכי DevOps, בנייה ותחזוקת תהליכים תוך שימוש בטכנולוגיות וכלים מתקדמים.בנוסף, ליווי וייעול תהליכי ...
דוברי שפות
עבודה מהבית
פורסם לפני יותר מחודש
As a Senior Software Engineer, you will be working on improving our Navigator. You'll be collaborating with product managers, and ...
דוברי שפות
עבודה מהבית
פורסם לפני יותר מחודש
As a Full Stack Software Engineer with extensive Kubernetes experience, you will be working on improving our Navigator product and ...
דוברי שפות
פתח תקווה
פורסם לפני יותר מחודש
דרוש/ה DevOps Engineer לחברת הייטק גלובאלית בתחום הפיננסי. יושבים בפתח תקווה, עבודה היברידית. התפקיד כולל בנייה ותחזוקת צינורות CI/CD, מערכות ...
פורסם לפני יותר מחודש
We built a platform that builds businesses. From launching and managing to growing a business, the all-in-one solution that empowers ...
דוברי שפות
פורסם לפני יותר מחודש
We are seeking an experienced Senior Backend Engineer to join our Data Services team. The Data Services team manages, provides ...
דוברי שפות
פורסם לפני יותר מחודש
If you're passionate about both sports and technology and want to drive the sports-tech and data industries into the future, ...
דוברי שפות
רעננה
פורסם לפני יותר מחודש
we are looking for an Senior DevOps EngineerSummary of Essential Job Functions Thorough, clear, concise documentation of new and existing ...
היברידי
רעננה
פורסם לפני יותר מחודש
לחברת Start-Up מצליחה דרוש/ה Python /GO Tech Lead.מדובר בחברה לאחר גיוס סיד של 10.5 מליון דולר המפתחת צ'אט בוט חכם ...
פורסם לפני יותר מחודש
We are seeking an experienced sharp and dynamic analytical mind to join our Product Analytics team as a Senior Product ...
Wizedom
אזור השרוןהוד השרוןהרצליה / רמת השרוןחדרהחולון / בת יםיבנהלוד / רמלהמודיעיןמעלה אדומיםנתניהפתח תקווהראש העיןראשון לציוןרחובות / נס ציונה/ גדרהתל אביב
פורסם לפני יותר מחודש
A Software company in Petach Tikwa, is seeking a technically proficient and visionary project manager to lead an innovative and ...
חיפהכרמיאל
פורסם לפני יותר מחודש
איש DevOps עבור חברה גדולה ויציבה בתחום באזור הצפוןהתפקיד כולל: עבודה עם כלי CI/CD מתקדמים, בנייה ותחזוקת תהליכים, תפעול כלי ...
הצגת משרות נוספות