Cantitate/Preț
Produs

Kubeflow for Machine Learning: From Lab to Production

Autor Trevor Grant, Holden Karau, Boris Lublinsky, Richard Liu, Ilan Filonenko
en Limba Engleză Paperback – 17 noi 2020

STRUCTURA progresivă: de la concept la implementare, ghidează cititorul prin complexitatea ecosistemului Kubeflow, transformând fluxurile de lucru experimentale în sisteme de producție robuste. Descoperim aici o abordare tehnică riguroasă a modului în care containerele și orchestrarea Kubernetes pot fi utilizate pentru a gestiona ciclul de viață al modelelor de învățare automată. Găsim în această carte explicații detaliate despre componentele de bază ale Kubeflow, punând accent pe rezolvarea problemelor de scalabilitate cu care se confruntă inginerii de date și cercetătorii în prezent.

Autorii demonstrează cum pot fi antrenate modelele folosind biblioteci consacrate precum Scikit-learn sau TensorFlow, integrându-le în același timp cu Apache Spark pentru procesarea seturilor mari de date. Ca și Josh Patterson în Kubeflow Operations Guide, echipa de autori distilează experiență reală în principii acționabile, oferind soluții pentru portabilitatea sarcinilor de lucru între diferite tipuri de clustere. Diferența majoră constă în focalizarea pe utilizatorul final care trebuie să mențină aceste modele prin Kubeflow Pipelines și să gestioneze metadatele de antrenament.

Textul analizează și aspecte critice precum reglarea hiperparametrilor și servirea modelelor în medii de producție, asigurând o înțelegere profundă a designului cloud-native. Într-o manieră similară cu abordarea prezentată de Yuan Tang în Distributed Machine Learning Patterns, volumul de față prioritizează tiparele de scalare, însă rămâne strâns ancorat în utilitățile specifice oferite de platforma Kubeflow pentru automatizarea fluxurilor MLOps.

Citește tot Restrânge

Preț: 23031 lei

Preț vechi: 28789 lei
-20%

Puncte Express: 345

Carte disponibilă

Livrare economică 01-15 mai
Livrare express 17-23 aprilie pentru 5258 lei


Specificații

ISBN-13: 9781492050124
ISBN-10: 1492050121
Pagini: 261
Dimensiuni: 179 x 233 x 21 mm
Greutate: 0.47 kg
Editura: O'Reilly

De ce să citești această carte

Recomandăm această carte cercetătorilor de date și inginerilor care doresc să depășească etapa de notebook și să livreze modele scalabile. Cititorul câștigă expertiză practică în utilizarea Kubeflow pe Kubernetes, învățând să automatizeze antrenarea și servirea modelelor. Este un ghid esențial pentru oricine dorește să construiască o infrastructură de Machine Learning fiabilă, utilizând instrumente open-source de top.


Despre autor

Trevor Grant, Holden Karau, Boris Lublinsky, Richard Liu și Ilan Filonenko formează o echipă de experți cu un istoric solid în sisteme distribuite și Machine Learning. Holden Karau este recunoscută la nivel mondial pentru contribuțiile sale la Apache Spark și pentru expertiza în procesarea datelor la scară largă. Boris Lublinsky are o experiență vastă în arhitecturi software și sisteme de streaming, în timp ce Trevor Grant este un membru activ al comunității Apache Software Foundation. Împreună, autorii aduc o perspectivă multidisciplinară asupra ecosistemului Kubeflow, combinând ingineria software cu știința datelor.


Descriere scurtă

If you're training a machine learning model but aren't sure how to put it into production, this book will get you there. Kubeflow provides a collection of cloud native tools for different stages of a model's lifecycle, from data exploration, feature preparation, and model training to model serving. This guide helps data scientists build production-grade machine learning implementations with Kubeflow and shows data engineers how to make models scalable and reliable.
Using examples throughout the book, authors Holden Karau, Trevor Grant, Ilan Filonenko, Richard Liu, and Boris Lublinsky explain how to use Kubeflow to train and serve your machine learning models on top of Kubernetes in the cloud or in a development environment on-premises.
  • Understand Kubeflow's design, core components, and the problems it solves
  • Understand the differences between Kubeflow on different cluster types
  • Train models using Kubeflow with popular tools including Scikit-learn, TensorFlow, and Apache Spark
  • Keep your model up to date with Kubeflow Pipelines
  • Understand how to capture model training metadata
  • Explore how to extend Kubeflow with additional open source tools
  • Use hyperparameter tuning for training
  • Learn how to serve your model in production

Notă biografică

Trevor Grant is a member of the Apache Software Foundation, and is heavily involved in the Apache Mahout, Apache Streams, and Community Development projects. He often tinkers and occasionally documents his (mis)adventures at www.rawkintrevo.org. In the before time, he was an international speaker on technology, but now he focuses mainly on writing. Trevor wishes to thank IBM for their continued patronage of his artistic endeavors. He lives in Chicago because it's the best city on the planet, with world class food, parks, and culture, and because the skies are never orange.
Holden Karau is a queer transgender Canadian, Apache Spark committer, Apache Software Foundation member, and an active open source contributor. She also extends her passion for building community with industry projects including Scaling for Python for ML and teaching distributed computing to children. As a software engineer, she's worked on a variety of distributed compute, search, and classification problems at Google, IBM, Alpine, Databricks, Foursquare, and Amazon. She graduated from the University of Waterloo with a bachelor of mathematics in computer science. Outside of software she enjoys playing with fire, welding, riding scooters, eating poutine, and dancing.
Boris Lublinsky is a Principal Architect at Lightbend. Boris has over 25 years experience in enterprise, technical architecture, and software engineering. He is an active member of OASIS SOA RM committee, co-author of Applied SOA: Service-Oriented Architecture and Design Strategies (Wiley) and author of numerous articles on Architecture, Programming, Big Data, SOA and BPM.
Richard Liu is a Senior Software Engineer at Waymo, where he focuses on building a machine learning platform for self-driving cars. Previously he has worked at Microsoft Azure and Google Cloud. He is one of the primary maintainers of the Kubeflow project and has given several talks at KubeCon. He holds a Master's degree in Computer Science from University of California, San Diego.
Ilan Filonenko is a member of the Data Science Infrastructure team at Bloomberg, where he has designed and implemented distributed systems at both the application and infrastructure level. Previously, Ilan was an engineering consultant and technical lead in various startups and research divisions across multiple industry verticals, including medicine, hospitality, finance, and music. He actively contributes to open source, primarily Apache Spark and Kubeflow's KFServing. He is one of the principal contributors to Spark on Kubernetes—primarily focusing on remote shuffle and HDFS security, and to multi-model serving in KFServing. Ilan's research has been in algorithmic, software, and hardware techniques for high-performance machine learning with a focus on optimizing stochastic algorithms and model management.