Cantitate/Preț
Produs

Cost-Effective Data Pipelines: Balancing Trade-Offs When Developing Pipelines in the Cloud

Autor Sev Leonard
en Limba Engleză Paperback – iul 2023

Notăm cu interes faptul că această lucrare se adresează profesioniștilor de nivel intermediar — ingineri de date, dezvoltatori și arhitecți — care stăpânesc deja conceptele fundamentale de cloud, dar se confruntă cu realitatea costurilor operaționale ridicate. Suntem de părere că volumul Cost-Effective Data Pipelines umple un gol esențial în literatura tehnică, mutând atenția de la simpla funcționalitate a fluxurilor de date către sustenabilitatea lor financiară și tehnică pe termen lung. Abordarea autorului Sev Leonard este una holistică, tratând ciclul de viață al unui pipeline nu doar ca pe o succesiune de procese ETL, ci ca pe un produs ce necesită optimizare constantă. Găsim în paginile cărții soluții concrete pentru configurarea strategică a resurselor de calcul și stocare, punând accent pe conceptul de „rightsizing”. Dacă Data Pipelines with Apache Airflow v-a oferit cadrul teoretic și instrumentele pentru orchestrarea sarcinilor, această carte oferă instrumentele practice pentru a rafina acele procese astfel încât să nu devină o povară bugetară pentru organizație. Structura este riguroasă și orientată spre performanță, acoperind de la reducerea dependențelor de servicii cloud în mediile de test, până la implementarea unor sisteme de monitorizare care să permită depanarea rapidă. Spre deosebire de manualele care se axează strict pe unelte specifice, precum Mapping Data Flows in Azure Data Factory, Cost-Effective Data Pipelines analizează compromisurile arhitecturale universale în cloud. Stilul de scriere este tehnic și aplicat, oferind metodologii pentru validarea datelor și extinderea bazei de cod într-un mod testabil, facilitând astfel evoluția rapidă a produselor de date fără sacrificarea calității.

Citește tot Restrânge

Preț: 29869 lei

Preț vechi: 37336 lei
-20%

Puncte Express: 448

Carte disponibilă

Livrare economică 06-20 mai
Livrare express 21-25 aprilie pentru 6452 lei


Specificații

ISBN-13: 9781492098645
ISBN-10: 1492098647
Pagini: 286
Dimensiuni: 176 x 232 x 18 mm
Greutate: 0.52 kg
Editura: O'Reilly

De ce să citești această carte

Recomandăm această carte inginerilor de date care doresc să treacă dincolo de faza de prototip și să livreze soluții de producție eficiente. Cititorul câștigă o metodologie clară pentru reducerea risipei de resurse în cloud și învăță să echilibreze performanța cu bugetul disponibil. Este un ghid indispensabil pentru a transforma fluxurile de date din centre de cost în active tehnice optimizate și scalabile.


Despre autor

Sev Leonard este un specialist cu experiență în ingineria datelor, axat pe optimizarea arhitecturilor în cloud. Expertiza sa se concentrează pe intersecția dintre eficiența operațională și designul sistemelor distribuite. Prin publicația sa de la editura O'Reilly, el sintetizează bune practici din industrie menite să ajute echipele tehnice să navigheze complexitatea ofertelor furnizorilor de cloud, promovând o cultură a responsabilității financiare în dezvoltarea de software și infrastructură de date.


Descriere

The low cost of getting started with cloud services can easily evolve into a significant expense down the road.

That's challenging for teams developing data pipelines, particularly when rapid changes in technology and workload require a constant cycle of redesign. How do you deliver scalable, highly available products while keeping costs in check?

With this practical guide, author Sev Leonard provides a holistic approach to designing scalable data pipelines in the cloud. Intermediate data engineers, software developers, and architects will learn how to navigate cost/performance trade-offs and how to choose and configure compute and storage. You'll also pick up best practices for code development, testing, and monitoring.

By focusing on the entire design process, you'll be able to deliver cost-effective, high-quality products. This book helps you:

  • Reduce cloud spend with lower cost cloud service offerings and smart design strategies
  • Minimize waste without sacrificing performance by rightsizing compute resources
  • Drive pipeline evolution, head off performance issues, and quickly debug with effective monitoring
  • Set up development and test environments that minimize cloud service dependencies
  • Create data pipeline code bases that are testable and extensible, fostering rapid development and evolution
  • Improve data quality and pipeline operation through validation and testing

Notă biografică

With over 20 years of experience in the technology industry Sev brings a breadth of experience spanning circuit design for Intel microprocessors, user-driven application development, and data platform development at both small and large scale. Throughout his career Sev has been a writer, speaker, and teacher along with his technical contributions, seeking to pass on what he has learned and make technology education accessible to all.

Sev's experience developing cloud data pipelines across multiple cloud service providers in large-scale batch and real-time environments, alongside his established record of writing and teaching, make him uniquely qualified to write Cost-effective Data Pipelines. Sev's hands-on experience as a data-engineer coupled with his ability to synthesize ideas provide him both with the subject matter expertise to speak on the topics in Cost-effective Data Pipelines and to elucidate these advanced concepts to readers. Sev's focus on providing actionable, hands-on content in his classes, tutorials, and interactive sessions guarantees an approach that readers will be able to quickly put into practice.