Cantitate/Preț
Produs

Databricks Data Intelligence Platform

Autor Jason Yip, Nikhil Gupta
en Limba Engleză Paperback – 13 oct 2024

Ne-a atras atenția modul în care autorii propun un exercițiu tehnic de o importanță critică: configurarea unui pipeline complet de Retrieval-Augmented Generation (RAG) folosind arhitectura nativă a platformei. Databricks Data Intelligence Platform nu este doar o prezentare teoretică, ci un manual de inginerie care demonstrează cum poți trece de la ingestia datelor brute în Delta Lake la servirea unui model de limbaj (LLM) personalizat, protejat de regulile de guvernanță din Unity Catalog.

Merită menționat că structura celor 18 capitole este riguros organizată pentru a reflecta fluxul de lucru dintr-o organizație modernă. Putem afirma că progresia de la conceptele fundamentale de Lakehouse (capitolele 2-5) către analitica în timp real și inteligența artificială generativă (capitolele 8-11) oferă o acoperire exhaustivă a ecosistemului. Cititorul care a aplicat deja ideile din Business Intelligence with Databricks SQL de Vihag Gupta va găsi aici elementele care completează tabloul: nu doar interogarea datelor prin SQL, ci și integrarea acestora în fluxuri complexe de machine learning și automatizări CI/CD.

Spre deosebire de Delta Lake: Up and Running, care se concentrează strict pe formatul de stocare, lucrarea lui Jason Yip și Nikhil Gupta extinde perspectiva asupra întregii platforme de inteligență a datelor. Autorii abordează inclusiv aspecte pragmatice precum monitorizarea costurilor prin tabele de sistem și conformitatea securității, transformând volumul într-un instrument de referință pentru arhitecții de soluții care trebuie să echilibreze inovația tehnică cu riguroarea operațională.

Citește tot Restrânge

Preț: 21959 lei

Preț vechi: 27449 lei
-20%

Puncte Express: 329

Carte disponibilă

Livrare economică 06-20 mai
Livrare express 21-25 aprilie pentru 11462 lei


Specificații

ISBN-13: 9798868804434
Pagini: 492
Ilustrații: Approx. 300 p.
Dimensiuni: 155 x 235 x 27 mm
Greutate: 0.74 kg
Ediția:First Edition
Editura: Apress
Locul publicării:Berkeley, CA, United States

De ce să citești această carte

Recomandăm această lucrare inginerilor de date și arhitecților de soluții care doresc să stăpânească ecosistemul Databricks pentru implementarea GenAI. Cititorul câștigă o înțelegere profundă a modului în care Unity Catalog și Delta Lake colaborează pentru a crea modele AI sigure și scalabile. Este un manual tehnic esențial pentru cei care se pregătesc pentru examenele de certificare Databricks, oferind exemple concrete de configurare și bune practici de securitate.


Despre autor

Jason Yip și Nikhil Gupta sunt specialiști recunoscuți în ecosistemul Databricks, cu o vastă experiență în proiectarea arhitecturilor de date complexe. Jason Yip aduce o perspectivă valoroasă asupra modului în care tehnologia trebuie să servească utilizatorii finali, o temă explorată parțial și în lucrarea sa anterioară Participatory Design for Learning. În volumul de față, autorii își folosesc expertiza tehnică pentru a ghida organizațiile în procesul de transformare a datelor brute în active strategice, punând accent pe eficiența platformei Databricks în gestionarea sarcinilor de lucru moderne de AI și machine learning.


Descriere scurtă

This book is your comprehensive guide to building robust Generative AI solutions using the Databricks Data Intelligence Platform. Databricks is the fastest-growing data platform offering unified analytics and AI capabilities within a single governance framework, enabling organizations to streamline their data processing workflows, from ingestion to visualization. Additionally, Databricks provides features to train a high-quality large language model (LLM), whether you are looking for Retrieval-Augmented Generation (RAG) or fine-tuning.
 
Databricks offers a scalable and efficient solution for processing large volumes of both structured and unstructured data, facilitating advanced analytics, machine learning, and real-time processing. In today's GenAI world, Databricks plays a crucial role in empowering organizations to extract value from their data effectively, driving innovation and gaining a competitive edge in the digital age. This book will not only help you master the Data Intelligence Platform but also help power your enterprise to the next level with a bespoke LLM unique to your organization.
 
Beginning with foundational principles, the book starts with a platform overview and explores features and best practices for ingestion, transformation, and storage with Delta Lake. Advanced topics include leveraging Databricks SQL for querying and visualizing large datasets, ensuring data governance and security with Unity Catalog, and deploying machine learning and LLMs using Databricks MLflow for GenAI. Through practical examples, insights, and best practices, this book equips solution architects and data engineers with the knowledge to design and implement scalable data solutions, making it an indispensable resource for modern enterprises.
 
Whether you are new to Databricks and trying to learn a new platform,  a seasoned practitioner building data pipelines, data science models, or GenAI applications, or even an executive who wants to communicate the value of Databricks to customers, this book is for you. With its extensive feature and best practice deep dives, it also serves as an excellent reference guide if you are preparing for Databricks certification exams.
 
What You Will Learn
  • Foundational principles of Lakehouse architecture
  • Key features including Unity Catalog, Databricks SQL (DBSQL), and Delta Live Tables
  • Databricks Intelligence Platform and key functionalities
  • Building and deploying GenAI Applications from data ingestion to model serving
  • Databricks pricing, platform security, DBRX, and many more topics
 
Who This Book Is For
Solution architects, data engineers, data scientists, Databricks practitioners, and anyone who wants to deploy their Gen AI solutions with the Data Intelligence Platform. This is also a handbook for senior execs who need to communicate the value of Databricks to customers. People who are new to the Databricks Platform and want comprehensive insights will find the book accessible.

Cuprins

1. Introduction.- 2. Lakehouse Platform.- 3. Databricks Platform Overview.- 4. Data Ingestion and Real-Time Analytics.- 5. Delta Lake: Deep Dive.- 6. Data Governance with Unity Catalog.- 7. Data Engineering and Analytics.- 8. Data Science, Machine Learning, and AI.- 9. Building GenAI Applications on Databricks Platform.- 10. Data Warehousing with DBSQL.- 11. Data Intelligence Platform.- 12. CI/CD and Application Development.- 13. Databricks Pricing and Observability using System Tables.- 14. Platform Security and Compliance.- 15. Advanced Topics and Industry Applications.- 16. Streaming Applications and HA/DR.- 17. Databricks in the Cloud Ecosystem.- 18. Conclusion.

Notă biografică

Nikhil Gupta is a seasoned data professional with over 18 years of experience in big data technologies, driving innovation and strategic growth in the field. As a Solution Architect at Databricks, he leverages his expertise to help customers across various industries, including retail, CPG, financial services, banking, and manufacturing, modernize their data and AI implementations on the Databricks platform. His expertise spans a range of big data technologies, including data warehousing, data lakes, and real-time data processing, making him a trusted advisor for Fortune 500 companies. 
Jason Yip is a data and machine learning architect. He currently serves as Director of Data and AI at Tredence, a leading data science and analytics company. He advises Fortune 500 companies on implementing data and Generative AI strategies on the cloud. He serves on multiple advisory boards at Databricks, including the Partner Product Advisory Board, and the Solution Architect Champion Advisory board. He is a top voice on Databricks and a former Microsoft employee who successfully led the Microsoft Corporate Finance big data transformation using Databricks.
 

Caracteristici

First comprehensive guide to end-to-end Databrick Intellifence Platform Build Gen AI Applications plus Data Applications from Data Ingestion to Model Serving and Dashboards Insider best practices and insights keep you ahead of the curve