Cost-Effective Data Pipelines: Balancing Trade-Offs When Developing Pipelines in the Cloud
Autor Sev Leonarden Limba Engleză Paperback – iul 2023
Notăm cu interes faptul că această lucrare se adresează profesioniștilor de nivel intermediar — ingineri de date, dezvoltatori și arhitecți — care stăpânesc deja conceptele fundamentale de cloud, dar se confruntă cu realitatea costurilor operaționale ridicate. Suntem de părere că volumul Cost-Effective Data Pipelines umple un gol esențial în literatura tehnică, mutând atenția de la simpla funcționalitate a fluxurilor de date către sustenabilitatea lor financiară și tehnică pe termen lung. Abordarea autorului Sev Leonard este una holistică, tratând ciclul de viață al unui pipeline nu doar ca pe o succesiune de procese ETL, ci ca pe un produs ce necesită optimizare constantă. Găsim în paginile cărții soluții concrete pentru configurarea strategică a resurselor de calcul și stocare, punând accent pe conceptul de „rightsizing”. Dacă Data Pipelines with Apache Airflow v-a oferit cadrul teoretic și instrumentele pentru orchestrarea sarcinilor, această carte oferă instrumentele practice pentru a rafina acele procese astfel încât să nu devină o povară bugetară pentru organizație. Structura este riguroasă și orientată spre performanță, acoperind de la reducerea dependențelor de servicii cloud în mediile de test, până la implementarea unor sisteme de monitorizare care să permită depanarea rapidă. Spre deosebire de manualele care se axează strict pe unelte specifice, precum Mapping Data Flows in Azure Data Factory, Cost-Effective Data Pipelines analizează compromisurile arhitecturale universale în cloud. Stilul de scriere este tehnic și aplicat, oferind metodologii pentru validarea datelor și extinderea bazei de cod într-un mod testabil, facilitând astfel evoluția rapidă a produselor de date fără sacrificarea calității.
Preț: 298.69 lei
Preț vechi: 373.36 lei
-20%
Carte disponibilă
Livrare economică 06-20 mai
Livrare express 21-25 aprilie pentru 64.52 lei
Specificații
ISBN-10: 1492098647
Pagini: 286
Dimensiuni: 176 x 232 x 18 mm
Greutate: 0.52 kg
Editura: O'Reilly
De ce să citești această carte
Recomandăm această carte inginerilor de date care doresc să treacă dincolo de faza de prototip și să livreze soluții de producție eficiente. Cititorul câștigă o metodologie clară pentru reducerea risipei de resurse în cloud și învăță să echilibreze performanța cu bugetul disponibil. Este un ghid indispensabil pentru a transforma fluxurile de date din centre de cost în active tehnice optimizate și scalabile.
Despre autor
Sev Leonard este un specialist cu experiență în ingineria datelor, axat pe optimizarea arhitecturilor în cloud. Expertiza sa se concentrează pe intersecția dintre eficiența operațională și designul sistemelor distribuite. Prin publicația sa de la editura O'Reilly, el sintetizează bune practici din industrie menite să ajute echipele tehnice să navigheze complexitatea ofertelor furnizorilor de cloud, promovând o cultură a responsabilității financiare în dezvoltarea de software și infrastructură de date.
Descriere
The low cost of getting started with cloud services can easily evolve into a significant expense down the road.
That's challenging for teams developing data pipelines, particularly when rapid changes in technology and workload require a constant cycle of redesign. How do you deliver scalable, highly available products while keeping costs in check?
With this practical guide, author Sev Leonard provides a holistic approach to designing scalable data pipelines in the cloud. Intermediate data engineers, software developers, and architects will learn how to navigate cost/performance trade-offs and how to choose and configure compute and storage. You'll also pick up best practices for code development, testing, and monitoring.
By focusing on the entire design process, you'll be able to deliver cost-effective, high-quality products. This book helps you:
- Reduce cloud spend with lower cost cloud service offerings and smart design strategies
- Minimize waste without sacrificing performance by rightsizing compute resources
- Drive pipeline evolution, head off performance issues, and quickly debug with effective monitoring
- Set up development and test environments that minimize cloud service dependencies
- Create data pipeline code bases that are testable and extensible, fostering rapid development and evolution
- Improve data quality and pipeline operation through validation and testing
Notă biografică
With over 20 years of experience in the technology industry Sev brings a breadth of experience spanning circuit design for Intel microprocessors, user-driven application development, and data platform development at both small and large scale. Throughout his career Sev has been a writer, speaker, and teacher along with his technical contributions, seeking to pass on what he has learned and make technology education accessible to all.
Sev's experience developing cloud data pipelines across multiple cloud service providers in large-scale batch and real-time environments, alongside his established record of writing and teaching, make him uniquely qualified to write Cost-effective Data Pipelines. Sev's hands-on experience as a data-engineer coupled with his ability to synthesize ideas provide him both with the subject matter expertise to speak on the topics in Cost-effective Data Pipelines and to elucidate these advanced concepts to readers. Sev's focus on providing actionable, hands-on content in his classes, tutorials, and interactive sessions guarantees an approach that readers will be able to quickly put into practice.