Cantitate/Preț
Produs

Practical Synthetic Data Generation

Autor Khaled El Emam, Lucy Mosquera, Richard Hoptroff
en Limba Engleză Paperback – 23 iun 2020

Prin parcurgerea acestui ghid tehnic, cititorul va reuși să implementeze fluxuri de lucru pentru crearea datelor sintetice — date artificiale derivate din seturi reale — care permit partajarea informațiilor fără a compromite confidențialitatea. Reținem că principala barieră în proiectele de big data este accesul limitat la date din motive de securitate, iar Practical Synthetic Data Generation oferă soluția tehnică pentru a debloca acest potențial în scopuri de analiză secundară. Descoperim aici o metodologie care transformă datele sensibile în active digitale sigure, gata de utilizat pentru modelarea comportamentului clienților sau dezvoltarea de noi produse. Ca și Ted Dunning în Sharing Big Data Safely, autorul distilează experiență reală în principii acționabile, axându-se pe echilibrul fragil între accesibilitate și control. Totuși, spre deosebire de abordările pur teoretice, această lucrare sub egida O'Reilly pune accent pe pașii de execuție pentru analiști și pe argumentele de eficiență pentru factorii de decizie. În contextul operei sale, Khaled El Emam continuă și rafinează temele explorate în Anonymizing Health Data și Building an Anonymization Pipeline. Dacă lucrările sale anterioare se concentrau pe anonimizarea tradițională și arhitectura conductelor de date, volumul de față face pasul către generarea sintetică, o metodă mai avansată de a asigura utilitatea statistică. Structura este concisă, axată pe rezultate, oferind un cadru de lucru esențial pentru organizațiile care doresc să monetizeze datele fără a încălca reglementările privind viața privată.

Citește tot Restrânge

Preț: 29528 lei

Preț vechi: 36910 lei
-20%

Puncte Express: 443

Carte disponibilă

Livrare economică 20 iunie-04 iulie
Livrare express 09-13 iunie pentru 6820 lei

Livrare prin curier în România Termenul estimat este afișat lângă disponibilitate.
Transport gratuit de la 40000 lei Plată online sau ramburs, în funcție de opțiunile comenzii.
Retur gratuit în 14 zile Comandă securizată și suport în română.

Specificații

ISBN-13: 9781492072744
ISBN-10: 1492072745
Pagini: 163
Dimensiuni: 174 x 231 x 10 mm
Greutate: 0.31 kg
Editura: O'Reilly

De ce să citești această carte

Recomandăm această carte liderilor tehnici și analiștilor care au nevoie de acces rapid la date de calitate pentru testare și cercetare. Cititorul câștigă o metodă riguroasă de a ocoli blocajele birocratice legate de confidențialitate, învățând să genereze seturi de date sintetice care păstrează proprietățile statistice ale celor originale, dar elimină riscurile legale.


Despre autor

Khaled El Emam este profesor asociat la Universitatea din Ottawa și cercetător principal la Institutul de Cercetare al Spitalului de Copii din estul Ontario. Expert recunoscut internațional în securitatea datelor medicale, el deține o catedră de cercetare în Informații Electronice de Sănătate și este fondatorul Privacy Analytics, Inc. Cariera sa este dedicată dezvoltării protocoalelor de calcul securizat și tehnicilor de anonimizare, fiind unul dintre puținii specialiști care îmbină rigoarea academică cu implementarea practică în sectorul privat de sănătate și tehnologie.


Descriere

One challenge with big data and other secondary analytics initiatives is getting access to large and diverse data. Secondary analytics allow insights beyond the questions that data initially collected can answer. This practical book introduces techniques for generating synthetic data--fake data generated from real data--that can provide secondary analytics to help you understand customer behaviors, develop new products, or generate new revenue.

CTOs, CIOs, and directors of analytics will learn how synthetic data generation provides a way to make such data broadly available for secondary purposes while addressing many privacy concerns. Analysts will learn the principles and steps of synthetic data generation from real data sets. Business leaders will examine how synthetic data can help accelerate time to a solution.