Data Engineering – Page 4 – The Data Domain Blog

HEMA’s Data Governance Transformation: Leveraging Amazon DataZone for Enterprise Success

Dec 28, 2024

—

by

in Amazon Web Services, Case Studies, Data Engineering

Discover how HEMA revolutionized their data management by implementing Amazon DataZone, transforming from siloed data systems to an efficient data mesh architecture that enables seamless data sharing and governance across their enterprise.

Amazon Q Data Integration: Enhanced DataFrame Support and Context-Aware ETL Development

Dec 27, 2024

—

by

Data Domain Blogger

in Amazon Web Services, Artificial Intelligence, Data Engineering

Discover how Amazon Q data integration has evolved with DataFrame support and context-aware development, revolutionizing ETL workflows. Learn about its enhanced capabilities, multiple data source support, and seamless integration with AWS services.

Jumia’s Data Platform Modernization: Building Metadata-Driven Frameworks on AWS

Dec 26, 2024

—

by

Data Domain Blogger

in Amazon Web Services, Case Studies, Data Analytics, Data Engineering

Discover how Jumia, Africa’s leading e-commerce platform, transformed its data infrastructure by migrating from Hadoop to AWS serverless solutions, achieving 50% cost reduction through innovative metadata-driven frameworks and standardized workflows.

Implementing End-to-End Data Lineage for Complex Analytics using AWS Services and dbt

Dec 17, 2024

—

by

Data Domain Blogger

in Amazon Web Services, Data Engineering

Discover how to build comprehensive data lineage for one-time and complex queries using Amazon Athena, Redshift, and Neptune. Learn about unified data modeling with dbt and automated lineage generation through AWS serverless architecture.

How Flo Health Scaled DynamoDB to Support 70M Users: A Cost Optimization Journey

Dec 15, 2024

—

by

Data Domain Blogger

in Amazon Web Services, Case Studies, Data Analytics, Data Engineering

Discover how Flo Health optimized Amazon DynamoDB to efficiently serve 70 million monthly active users while achieving 60% cost reduction. Learn about their implementation of AWS Well-Architected Framework and innovative data optimization strategies.

Implementing Write-Audit-Publish Pattern with Apache Iceberg and AWS Glue Data Quality

Dec 13, 2024

—

by

Data Domain Blogger

in Amazon Web Services, Data Engineering

Explore how to implement the Write-Audit-Publish pattern using Apache Iceberg and AWS Glue Data Quality for robust data validation. Learn about efficient data quality management strategies and their practical applications in modern data architectures.

Preventing PostgreSQL Transaction ID Wraparound: Monitoring Autovacuum with postgres_get_av_diag

Dec 12, 2024

—

by

Data Domain Blogger

in Amazon Web Services, Data Engineering

Learn how to prevent transaction ID wraparound in PostgreSQL by implementing effective autovacuum monitoring using postgres_get_av_diag function.

Unify Data Access with Amazon SageMaker Lakehouse

Dec 11, 2024

—

by

Data Domain Blogger

in Amazon Web Services, Data Analytics, Data Engineering

Discover how Amazon SageMaker Lakehouse revolutionizes enterprise data management by unifying data warehouse and lake access. Learn about implementation steps, security controls, and analysis capabilities in this comprehensive guide.

Understanding Concurrency Control in Distributed Databases: Aurora DSQL Implementation Guide

Dec 7, 2024

—

by

Data Domain Blogger

in Amazon Web Services, Data Analytics, Data Engineering

Explore the implementation of concurrency control in distributed databases, focusing on Aurora DSQL’s optimistic approach. Learn best practices for managing transactions, handling exceptions, and maintaining data consistency in distributed systems.

Category: Data Engineering