Senior Site Reliability Engineer (m/f/d)

Permanent employee, Full-time · Remote within Germany

Read job description in:
Your mission
  • Design, build, and maintain our infrastructure and tools to allow for the highly reliable and scalable deployment of services and applications, incorporating both cloud-based and on-premise solutions
  • Implement comprehensive monitoring and observability frameworks to detect and resolve issues proactively, using tools like Prometheus, Grafana, and Zabbix for system health and performance metrics
  • Develop and manage incident response protocols, including on-call rotations, incident analysis, and conducting postmortems to ensure continuous improvement in system reliability and performance
  • Automate infrastructure and workflows using Infrastructure as Code (IaC) tools like Ansible
  • Optimize system performance through regular performance tuning, capacity planning, and conducting reliability experiments to identify and mitigate potential points of failure
  • Collaborate with development teams to advocate for reliability and scalable practices throughout the software development life cycle, and assist in the design and review of new systems and major changes
Your profile
  • 5+ years of experience in IT with a focus on system administration and automation
  • Expertise in Linux system administration and in using Infrastructure-as-Code tools like Ansible
  • Strong knowledge of scripting and programming in Bash and Python
  • Experience with containerization technologies (Docker) and orchestration tools (e.g., Docker Swarm or Kubernetes)
  • Experience of running demanding Java applications in production with an understanding of the JVM and Java memory management
  • Work experience in the data center, such as cabling, server racking, up to and including data center design
  • Strong analytical and problem-solving skills with experience in troubleshooting complex issues triggered and supported by monitoring tools
  • Effective communication and collaboration abilities, essential for working across teams and with stakeholders
  • Fluent in English and German
THE JOY OF WORKING WITH US
  • Scale-up company with a market-leading product
  • Open culture with diverse international teams
  • Flexible working hours 
  • State-of-the-art equipment
  • Personal development support, e.g. access to the learning platform Udemy
  • Regular feedback rounds  
Job Location
Remote within Germany
About us
FactFinder is the European leader in eCommerce product discovery and search. Using authentic intelligence, the unique combination of artificial and human intelligence, FactFinder understands every shopper’s intent from the first click – increasing conversions and boosting revenues by over 30%.

For over two decades, FactFinder has been trusted to support billions of search queries a year, for thousands of B2B and B2C brands including Intersport, White Stuff, OBI, Stihl, and MyTheresa. FactFinder is headquartered in Germany, with offices in Berlin, London and Stockholm. Visit www.fact-finder.com for more information.

Deine Aufgaben
  • Entwurf, Erstellung und Pflege unserer Infrastruktur und Tools, um eine zuverlässige und skalierbare Bereitstellung von Diensten und Anwendungen zu ermöglichen, die sowohl Cloud-basierte als auch lokale Lösungen umfassen
  • Implementierung umfassender Überwachungs- und Beobachtungs-Frameworks, um Probleme proaktiv zu erkennen und zu beheben, unter Verwendung von Tools wie Prometheus, Grafana und Zabbix für Systemzustands- und Leistungsmetriken
  • Entwicklung und Verwaltung von Protokollen für die Reaktion auf Vorfälle, einschließlich Bereitschaftsdienst, Analyse von Vorfällen und Durchführung von Postmortems, um eine kontinuierliche Verbesserung der Systemzuverlässigkeit und -leistung sicherzustellen
  • Automatisierung der Infrastruktur und der Arbeitsabläufe mithilfe von Infrastructure as Code (IaC)-Tools wie Ansible
  • Optimierung der Systemleistung durch regelmäßige Leistungsoptimierung, Kapazitätsplanung und Durchführung von Zuverlässigkeitsexperimenten, um potenzielle Fehlerquellen zu identifizieren und frühzeitig zu entschärfen
  • Zusammenarbeit mit Entwicklungsteams, um sich für Zuverlässigkeit und skalierbare Praktiken während des gesamten Lebenszyklus der Softwareentwicklung einzusetzen, und Unterstützung beim Entwurf und der Überprüfung neuer Systeme und größerer Änderungen
Dein Profil
  • Mehr als 5 Jahre Erfahrung im IT-Bereich mit Schwerpunkt auf Systemverwaltung und Automatisierung
  • Kenntnisse in der Linux-Systemverwaltung und in der Verwendung von Infrastructure-as-Code-Tools wie Ansible
  • Gute Kenntnisse in der Skripterstellung und Programmierung in Bash und Python
  • Erfahrung mit Containerisierungstechnologien (Docker) und Orchestrierungstools (z. B. Docker Swarm oder Kubernetes)
  • Erfahrung mit der Ausführung anspruchsvoller Java-Anwendungen in der Produktion mit Kenntnissen über die JVM und die Java-Speicherverwaltung
  • Berufserfahrung in Rechenzentren, z. B. Verkabelung, Server-Racking, bis hin zum Design von Rechenzentren
  • Ausgeprägte Analyse- und Problemlösungsfähigkeiten mit Erfahrung in der Behebung komplexer Probleme, die durch Überwachungstools ausgelöst und unterstützt werden
  • Effektive Kommunikations- und Kooperationsfähigkeiten, die für die Arbeit mit verschiedenen Teams und Stakeholdern unerlässlich sind
  • Fließende Kenntnisse in Englisch und Deutsch
THE JOY OF WORKING WITH US
  • Scale-up-Unternehmen mit marktführendem Produkt
  • Offene Kultur mit vielfältigen internationalen Teams
  • Flexible Arbeitszeiten und -orte
  • Modernste Ausstattung
  • Unterstützung bei der persönlichen Entwicklung, z. B. Zugang zur Lernplattform Udemy
  • Regelmäßige Feedbackrunden
Standort
Remote innerhalb Deutschlands
Über uns
FactFinder ist der europäische Marktführer für Product Discovery und Suche im eCommerce. Mit Authentic Intelligence, der Kombination aus künstlicher und menschlicher Intelligenz, versteht FactFinder die Absichten jedes Käufers vom ersten Klick an – und kann so die Conversion-Rate und den Umsatz um mehr als 30 Prozent steigern.  

Seit über zwei Jahrzehnten unterstützt FactFinder Milliarden von eCommerce-Suchen für tausende von B2B- und B2C-Marken wie Intersport, White Stuff, OBI, Stihl und MyTheresa. Jeden Tag finden Millionen von Käufern mit FactFinder, was sie suchen – schnell, personalisiert und mit Freude. FactFinder hat seinen Hauptsitz in Deutschland und unterhält Büros in Berlin, London und Stockholm.

Thank you for your interest in FactFinder. Please fill out the following short form. Should you have difficulties with the upload of your data, please send an email to: jobs@fact-finder.com

Please submit your application documents in English.   
Uploading document. Please wait.
Please add all mandatory information with a * to send your application.