Back to jobs
New

Site Reliability Engineer II

Dallas, Texas, United States

About the Role

We are building a secure modern healthcare cloud infrastructure and a massive data stack. We are looking for engineering talent spanning IaaC, CICD, Observability, and DevSecOps to be part of this charter. We aim to write everything as code and are seeking an experienced engineering team member who brings cloud-native infrastructure experience and most importantly, a “can-do” attitude and a strong sense of ownership.            

A Day in the Life

  • In this role you will be responsible for building/automating secure cloud Infrastructure (Infrastructure As A Code - IaaC) with various pillars Cost, Reliability, Scalability, Performance, Cost, etc.
  • Build CICD stack collaborating across Dev and QA/Automation teams and drive an organization to a new level of (daily/hourly) continuous delivery and deployment.
  • Security is paramount to everything we do, you will work closely with CISO, and Dev team(s) and make security a first-class citizen. Develop S-CICD (Secure CICD), and enable various security toolchains and vulnerability reports to developers via automation.
  • Observability is very critical for the scale of our systems and the ability to find insights/behavior and detect problems/failures. Looking for leads to drive this charter spanning across logs, metrics, mesh, tracing, etc.
  • Collaborate closely with the Dev and QA team to bring the given initiative to a closer, and increase adoption of DevOps practices and tool chain.
  • Apply strong analytical skills to understand production system metrics, drive change, optimize system utilization, and drive cost efficiency.
  • Autos Scale/down the platform during peak season scenarios.
  • Ensure that the Platform is secured as per guidelines established by CISO. e,g, Secure against DDoS attacks by implementing WAF, Vulnerability and Patch management, installing required security agents, etc.
  • Lead least privilege-based RBAC for various production services and tool chains.
  • Build and execute Disaster Recovery plan.
  • Key stakeholders to participate in the case of IR (Incident Response).

 What You Need:

  • Technical Must Haves: Solid experience with at least one of the clouds with an automation focus - AWS, Azure, GCP. Certification has advantages.
  • Hands-on experience with Kubernetes along with Linux.
  • Programming experience with scripting languages e.g. Python.
  • Build and deployment experience building scalable CICD architectures and solutions is preferred.
  • Building an observability stack from logs, metrics, traces, service mesh, and data observability is preferred.
  • Good at documenting and structuring documents for consumption by various dev teams.
  • Cloud Security is a major advantage and a highly preferred skill.
  • Hands-on experience with a few of these - Kafka, Postgres, Snowflake, etc. is preferred.
  • Bachelor’s Degree or equivalent.
  • Personality Trait: Able to perform with a cool head under pressure situations without taking any shortcuts.
  • Collaboration with solid verbal and oral communication skills is very critical to this role. Possesses excellent verbal and written communication skills and the ability to interact professionally with a diverse group of developers, product owners, and subject matter experts.
  • Strong cross-functional collaboration skills, relationship-building skills, and ability to achieve results without direct reporting relationships
  • Ability to quickly identify and drive to the optimal solution when presented with a series of constraints.
  • Excellent judgment, analytical thinking, and problem-solving skills.
  • Self-motivated individual who possesses excellent time management and organizational skills.
  • Strong sense of personal responsibility and accountability for delivering high-quality work.

Tech Stack :

Multi-Cloud - AWS, Azure, GCP

Distributed Compute - Kubernetes (EKS/AKS), Containerization

Persistence stores - Postgres, MongoDB

Data Warehousing - Snowflake, Data Bricks

Messaging - Kafka

CICD - Jenkins, ArgoCD, GitOps

Observability - ElasticSearch, Prometheus, Jaeger, NewRelic etc.

We offer competitive benefits to set you up for success in and outside of work.

Here’s What We Offer

  • Generous PTO Benefits: Enjoy PTO benefit accrual of 22 days per year.
  • Parental Leave: Experience one of the industry's best parental leave policies to spend time with your new addition.
  • Rewards & Recognition: Unlock your potential and be rewarded generously with both monetary incentives and widespread recognition for your dedication and outstanding performance. Unlock your potential and be rewarded generously with both monetary incentives and widespread recognition for your dedication and outstanding performance.
  • Insurance Benefits: We offer medical, dental, and vision benefits along with 100% company-sponsored short and long-term disability and basic life insurance. Legal aid and pet insurance options are available at a discounted rate.

Innovaccer is an equal opportunity employer. We celebrate diversity, and we are committed to fostering an inclusive and diverse workplace where all employees, regardless of race, color, religion, gender, gender identity or expression, sexual orientation, national origin, genetics, disability, age, marital status, or veteran status, feel valued and empowered.

Disclaimer: Innovaccer does not charge fees or require payment from individuals or agencies for securing employment with us. We do not guarantee job spots or engage in any financial transactions related to employment. If you encounter any posts or requests asking for payment or personal information, we strongly advise you to report them immediately to our HR department at px@innovaccer.com. Additionally, please exercise caution and verify the authenticity of any requests before disclosing personal and confidential information, including bank account details.

 

Apply for this job

*

indicates a required field

Resume/CV

Accepted file types: pdf, doc, docx, txt, rtf

Cover Letter

Accepted file types: pdf, doc, docx, txt, rtf