Databricks Data Intelligence Platform
Autor Jason Yip, Nikhil Guptaen Limba Engleză Paperback – 13 oct 2024
Ne-a atras atenția modul în care autorii propun un exercițiu tehnic de o importanță critică: configurarea unui pipeline complet de Retrieval-Augmented Generation (RAG) folosind arhitectura nativă a platformei. Databricks Data Intelligence Platform nu este doar o prezentare teoretică, ci un manual de inginerie care demonstrează cum poți trece de la ingestia datelor brute în Delta Lake la servirea unui model de limbaj (LLM) personalizat, protejat de regulile de guvernanță din Unity Catalog.
Merită menționat că structura celor 18 capitole este riguros organizată pentru a reflecta fluxul de lucru dintr-o organizație modernă. Putem afirma că progresia de la conceptele fundamentale de Lakehouse (capitolele 2-5) către analitica în timp real și inteligența artificială generativă (capitolele 8-11) oferă o acoperire exhaustivă a ecosistemului. Cititorul care a aplicat deja ideile din Business Intelligence with Databricks SQL de Vihag Gupta va găsi aici elementele care completează tabloul: nu doar interogarea datelor prin SQL, ci și integrarea acestora în fluxuri complexe de machine learning și automatizări CI/CD.
Spre deosebire de Delta Lake: Up and Running, care se concentrează strict pe formatul de stocare, lucrarea lui Jason Yip și Nikhil Gupta extinde perspectiva asupra întregii platforme de inteligență a datelor. Autorii abordează inclusiv aspecte pragmatice precum monitorizarea costurilor prin tabele de sistem și conformitatea securității, transformând volumul într-un instrument de referință pentru arhitecții de soluții care trebuie să echilibreze inovația tehnică cu riguroarea operațională.
Preț: 219.59 lei
Preț vechi: 274.49 lei
-20%
Carte disponibilă
Livrare economică 06-20 mai
Livrare express 21-25 aprilie pentru 114.62 lei
Specificații
Pagini: 492
Ilustrații: Approx. 300 p.
Dimensiuni: 155 x 235 x 27 mm
Greutate: 0.74 kg
Ediția:First Edition
Editura: Apress
Locul publicării:Berkeley, CA, United States
De ce să citești această carte
Recomandăm această lucrare inginerilor de date și arhitecților de soluții care doresc să stăpânească ecosistemul Databricks pentru implementarea GenAI. Cititorul câștigă o înțelegere profundă a modului în care Unity Catalog și Delta Lake colaborează pentru a crea modele AI sigure și scalabile. Este un manual tehnic esențial pentru cei care se pregătesc pentru examenele de certificare Databricks, oferind exemple concrete de configurare și bune practici de securitate.
Despre autor
Jason Yip și Nikhil Gupta sunt specialiști recunoscuți în ecosistemul Databricks, cu o vastă experiență în proiectarea arhitecturilor de date complexe. Jason Yip aduce o perspectivă valoroasă asupra modului în care tehnologia trebuie să servească utilizatorii finali, o temă explorată parțial și în lucrarea sa anterioară Participatory Design for Learning. În volumul de față, autorii își folosesc expertiza tehnică pentru a ghida organizațiile în procesul de transformare a datelor brute în active strategice, punând accent pe eficiența platformei Databricks în gestionarea sarcinilor de lucru moderne de AI și machine learning.
Descriere scurtă
Databricks offers a scalable and efficient solution for processing large volumes of both structured and unstructured data, facilitating advanced analytics, machine learning, and real-time processing. In today's GenAI world, Databricks plays a crucial role in empowering organizations to extract value from their data effectively, driving innovation and gaining a competitive edge in the digital age. This book will not only help you master the Data Intelligence Platform but also help power your enterprise to the next level with a bespoke LLM unique to your organization.
Beginning with foundational principles, the book starts with a platform overview and explores features and best practices for ingestion, transformation, and storage with Delta Lake. Advanced topics include leveraging Databricks SQL for querying and visualizing large datasets, ensuring data governance and security with Unity Catalog, and deploying machine learning and LLMs using Databricks MLflow for GenAI. Through practical examples, insights, and best practices, this book equips solution architects and data engineers with the knowledge to design and implement scalable data solutions, making it an indispensable resource for modern enterprises.
Whether you are new to Databricks and trying to learn a new platform, a seasoned practitioner building data pipelines, data science models, or GenAI applications, or even an executive who wants to communicate the value of Databricks to customers, this book is for you. With its extensive feature and best practice deep dives, it also serves as an excellent reference guide if you are preparing for Databricks certification exams.
What You Will Learn
- Foundational principles of Lakehouse architecture
- Key features including Unity Catalog, Databricks SQL (DBSQL), and Delta Live Tables
- Databricks Intelligence Platform and key functionalities
- Building and deploying GenAI Applications from data ingestion to model serving
- Databricks pricing, platform security, DBRX, and many more topics
Who This Book Is For
Solution architects, data engineers, data scientists, Databricks practitioners, and anyone who wants to deploy their Gen AI solutions with the Data Intelligence Platform. This is also a handbook for senior execs who need to communicate the value of Databricks to customers. People who are new to the Databricks Platform and want comprehensive insights will find the book accessible.
Cuprins
Notă biografică
Jason Yip is a data and machine learning architect. He currently serves as Director of Data and AI at Tredence, a leading data science and analytics company. He advises Fortune 500 companies on implementing data and Generative AI strategies on the cloud. He serves on multiple advisory boards at Databricks, including the Partner Product Advisory Board, and the Solution Architect Champion Advisory board. He is a top voice on Databricks and a former Microsoft employee who successfully led the Microsoft Corporate Finance big data transformation using Databricks.