Titre du poste : Ingénieur de Données \& d'IA
Êtes-vous un visionnaire de l'ingénierie des données qui s'épanouit en relevant des défis complexes à grande échelle ? Rêvez-vous de construire un écosystème de données mondial qui alimente non seulement les décisions commerciales, mais aussi les initiatives d'apprentissage automatique de pointe ? MTY, un leader mondial de l'industrie alimentaire, recherche un Ingénieur de Données avec une forte spécialisation en Ingénierie ML pour diriger la création de notre plateforme de données unifiée. C'est votre chance de concevoir, de construire et d'optimiser les pipelines qui alimenteront notre avenir axé sur les données et nous permettront de tirer parti de la puissance de l'IA et du ML.
Avantages :
- 3 semaines de vacances;
- 5 journées de congés mobiles;
- 2000$ de remboursement des frais d'ordre professionnel et de formation continue;
- Horaire de travail flexible
- Demi-journée le vendredi disponible à l'année;
- Plans de santé et dentaires d'entreprise, compte de dépenses santé/personnel de bien-être supplémentaire de 300$;
- Programme d'assistance aux employés avec accès à un large éventail de services allant de la santé mentale aux conseils juridiques et financiers;
- Régime de participation des employés aux bénéfices avec contribution de l'employeur;
- Prix mensuels de reconnaissance à l'échelle de l'entreprise avec des gagnants trimestriels et annuels;
- Événements sociaux d'entreprise, y compris, mais sans s'y limiter, des webinaires, des assemblées publiques trimestrielles et des activités amusantes pour tous;
- Tenue d'affaires décontractée;
- Stationnement gratuit au bureau.
Responsabilités:
- Concevoir et mettre en œuvre des pipelines de données évolutifs, fiables et efficaces qui ingèrent, transforment et fournissent des données provenant de sources diverses vers notre plateforme de données unifiée, en répondant à la fois aux cas d'utilisation d'analyse traditionnelle et d'apprentissage automatique.
- Utiliser des technologies de pointe telles que Databricks, Spark et d'autres outils de big data pour optimiser les workflows de traitement des données en termes de vitesse, de précision et de rentabilité, en mettant l'accent sur la préparation des données pour l'entraînement et l'inférence des modèles ML.
- Collaborer avec les data scientists pour concevoir et mettre en œuvre des pipelines d'ingénierie des fonctionnalités qui extraient des informations significatives à partir des données brutes, permettant le développement de modèles d'apprentissage automatique performants.
- Collaborer avec les ingénieurs ML pour opérationnaliser les modèles d'apprentissage automatique, en assurant une intégration transparente dans les environnements de production et les pipelines de données en temps réel.
- Se tenir au courant des technologies émergentes en matière d'ingénierie des données et d'ingénierie ML, en préconisant l'adoption d'outils et de plateformes qui soutiennent les initiatives d'IA/ML de MTY.
- Diriger et encadrer une équipe d'ingénieurs de données, en favorisant une culture de collaboration, d'innovation et d'apprentissage continu dans les disciplines de l'ingénierie des données et de l'ingénierie ML.
- Collaborer avec les data scientists, les analystes et les parties prenantes de l'entreprise pour comprendre les exigences en matière de données et de ML, et fournir des solutions qui génèrent de la valeur commerciale.
- Surveiller en permanence les performances des pipelines, identifier les goulots d'étranglement et mettre en œuvre des optimisations pour garantir un débit et une réactivité optimaux pour les charges de travail d'analyse et de ML.
Qualifications:
- Plus de 5 ans d'expérience pratique en ingénierie des données, avec une expérience démontrée dans la construction et la gestion de pipelines de données complexes dans des environnements cloud (Azure, GCP), y compris une expérience avec les pipelines de données ML.
- Connaissance approfondie des frameworks de traitement des données (Spark, Databricks), des processus ETL/ELT, des concepts d'entreposage de données, des meilleures pratiques de modélisation des données et des pipelines d'apprentissage automatique.
- Maîtrise de Python, Scala ou d'autres langages de programmation pertinents pour la manipulation des données, la transformation et le développement de modèles ML.
- Expérience avec les plateformes de données basées sur le cloud (Azure Data Lake Storage Gen2, Google Cloud Storage) et les services de traitement des données (Azure Databricks, GCP Dataproc), ainsi que les plateformes ML basées sur le cloud (Azure Machine Learning, Google AI Platform).
- Familiarité avec les frameworks ML (TensorFlow, PyTorch), les stratégies de déploiement de modèles et les pratiques MLOps.
- Solides compétences en leadership avec la capacité de motiver et d'encadrer une équipe, associées à d'excellentes compétences en communication pour collaborer efficacement avec diverses parties prenantes, y compris les data scientists et les ingénieurs ML.
- Une passion pour résoudre des défis complexes liés aux données et une approche proactive pour identifier et résoudre les problèmes, à la fois dans les contextes d'ingénierie des données et d'ingénierie ML.
- Expérience de travail dans des environnements Agile et adoption d'approches de développement itératif.
Veuillez noter que toute offre d'emploi sera conditionnelle à une vérification des antécédents, y compris du casier judiciaire.
*La majorité de notre clientèle et une grande partie de nos employés sont en dehors du Québec*
Job Title: Data \& AI Engineer
Are you a data engineering visionary who thrives on tackling complex data challenges at a massive scale? Do you dream of building a global data ecosystem that empowers not only business decisions but also fuels cutting-edge machine learning initiatives? MTY, a global leader in the food industry, is seeking a Data Engineer with a strong ML Engineering focus to spearhead the creation of our unified data platform. This is your chance to architect, build, and optimize the pipelines that will not only fuel our data-driven future but also enable us to leverage the power of AI and ML.
Benefits:
- 3 weeks of vacation;
- 5 days of flexible leave;
- $2000 reimbursement for professional order costs and continuing education requirements;
- Flexible working hours;
- Half-day available every Friday year-round;
- Company health and dental plans, with an additional $300 personal wellness expense account;
- Employee assistance program with access to a wide range of services from mental health to legal and financial counseling;
- Employee profit-sharing plan with employer contribution;
- Monthly company-wide recognition awards with quarterly and annual winners;
- Company social events, including but not limited to webinars, quarterly town halls, and fun activities for all;
- Casual dress code;
- Free parking at the office.
Responsibilities:
- Design and implement scalable, reliable, and efficient data pipelines that ingest, transform, and deliver data from diverse sources into our unified data platform, catering to both traditional analytics and machine learning use cases.
- Utilize cutting-edge technologies like Databricks, Spark, and other big data tools to optimize data processing workflows for speed, accuracy, and cost-effectiveness, with a focus on preparing data for ML model training and inference.
- Collaborate with data scientists to design and implement feature engineering pipelines that extract meaningful insights from raw data, enabling the development of high-performing machine learning models.
- Partner with ML engineers to operationalize machine learning models, ensuring seamless integration into production environments and real-time data pipelines.
- Stay abreast of emerging data engineering and ML engineering technologies, advocating for the adoption of tools and platforms that support MTY's AI/ML initiatives.
- Lead and mentor a team of data engineers, fostering a culture of collaboration, innovation, and continuous learning across both data engineering and ML engineering disciplines.
- Partner with data scientists, analysts, and business stakeholders to understand data and ML requirements and deliver solutions that drive business value.
- Continuously monitor pipeline performance, identify bottlenecks, and implement optimizations to ensure optimal throughput and responsiveness for both analytics and ML workloads.
Qualifications:
- 5 years of hands-on experience in data engineering, with a demonstrated track record of building and managing complex data pipelines in cloud environments (Azure, GCP), including experience with ML data pipelines.
- Deep understanding of data processing frameworks (Spark, Databricks), ETL/ELT processes, data warehousing concepts, data modeling best practices, and machine learning pipelines.
- Proficiency in Python, Scala, or other relevant programming languages for data manipulation, transformation, and ML model development.
- Experience with cloud-based data platforms (Azure Data Lake Storage Gen2, Google Cloud Storage) and data processing services (Azure Databricks, GCP Dataproc), as well as cloud-based ML platforms (Azure Machine Learning, Google AI Platform).
- Familiarity with ML frameworks (TensorFlow, PyTorch), model deployment strategies, and MLOps practices.
- Strong leadership skills with the ability to motivate and mentor a team, coupled with excellent communication skills to collaborate effectively with diverse stakeholders, including data scientists and ML engineers.
- A passion for solving complex data challenges and a proactive approach to identifying and resolving issues, both in data engineering and ML engineering contexts.
- Experience working in Agile environments and embracing iterative development approaches.
Please note that any offer of employment will be conditional upon a background check, including a criminal record check.