Library Hours
Monday to Friday: 9 a.m. to 9 p.m.
Saturday: 9 a.m. to 5 p.m.
Sunday: 1 p.m. to 9 p.m.
Naper Blvd. 1 p.m. to 5 p.m.
     
Limit search to available items
Results Page:  Previous Next
Author Herbold, Steffen.

Title Data-Science-Crashkurs [electronic resource] : Eine interaktive und praktische Einführung. [O'Reilly electronic resource]

Imprint Heidelberg : Dpunkt.verlag, 2022.
QR Code
Description 1 online resource (346 pages)
Contents Intro -- Inhaltsverzeichnis -- Vorwort -- Inhaltsübersicht -- Inhaltsverzeichnis -- 1 Big Data und Data Science -- 1.1 Einführung in Big Data -- 1.1.1 Volumen -- Abb. 1-1 Wachstum des Datenvolumens im Internetverkehr -- 1.1.2 Velocity/Geschwindigkeit -- 1.1.3 Variety/Vielfalt -- Abb. 1-2 Datenpyramide -- 1.1.4 Innovative Informationsverarbeitungsmethoden -- 1.1.5 Wissen generieren, Entscheidungen treffen, Prozesse automatisieren -- 1.1.6 Noch mehr Vs -- 1.2 Einführung in Data Science -- 1.2.1 Was gehört zu Data Science? -- 1.2.2 Beispielanwendungen -- 1.3 Fähigkeiten von Data Scientists
2 Der Prozess von Data-Science-Projekten -- Abb. 2-1 Beziehung von Menschen, Techniken und Prozessen -- 2.1 Der generische Data-Science-Prozess -- Abb. 2-2 Überblick über den generellen Prozess von Data-Science-Projekten -- 2.1.1 Discovery -- 2.1.2 Datenvorbereitung -- 2.1.3 Modellplanung -- Abb. 2-3 Vergleich der Güte zweier fiktiver Modelle, bezogen auf die Datengröße -- 2.1.4 Modellerstellung -- 2.1.5 Kommunikation der Ergebnisse -- 2.1.6 Operationalisierung -- 2.2 Rollen in Data-Science-Projekten -- 2.2.1 Anwenderin -- 2.2.2 Projektsponsorin -- 2.2.3 Projektmanagerin -- 2.2.4 Dateningenieurin
2.2.5 Datenbankadministratorin -- 2.2.6 Data Scientist -- 2.3 Deliverables -- 2.3.1 Sponsorenpräsentation -- 2.3.2 Analystenpräsentation -- 2.3.3 Quelltext -- 2.3.4 Technische Spezifikation -- 2.3.5 Daten -- 3 Allgemeines zur Datenanalyse -- 3.1 Das No-free-Lunch-Theorem -- 3.2 Definition von maschinellem Lernen -- 3.3 Merkmale -- Abb. 3-1 Bild von einem Wal -- Tab. 3-1 Skalen für Merkmale -- 3.4 Trainings- und Testdaten -- Tab. 3-2 Beispiel für Instanzen von Objekten mit ihren Merkmalen
Tab. 3-3 Beispiel für Instanzen von Objekten mit ihren Merkmalen und Werten von Interesse. Diese werden häufig auch als Label bezeichnet. -- Abb. 3-2 Verwendung von Daten zur Kreuzvalidierung -- 3.5 Kategorien von Algorithmen -- 3.6 Übung -- Laden von CSV-Daten -- Entfernen von Merkmalen -- Entfernen von Instanzen mit fehlenden Werten -- Rechnen mit Dataframes -- Zusammenfügen von Dataframes -- Auswahl von Teilmengen -- 4 Erkunden der Daten -- 4.1 Texteditoren und die Kommandozeile -- 4.2 Deskriptive Statistik -- 4.2.1 Lagemaße -- 4.2.2 Variabilität -- 4.2.3 Datenbereich -- 4.3 Visualisierung
4.3.1 Anscombes Quartett -- Tab. 4-1 Anscombes Quartett -- 4.3.2 Einzelne Merkmale -- 4.3.3 Beziehungen zwischen Merkmalen -- 4.3.4 Scatterplots für hochdimensionale Daten -- 4.3.5 Zeitliche Trends -- 4.4 Übung -- Deskriptive Statistiken -- Visualisierungen einzelner Merkmale -- Paarweise Beziehungen -- 5 Assoziationsregeln -- Abb. 5-1 Warenkörbe als Beispiel für Assoziationen -- Abb. 5-2 Konzept der Assoziationsanalyse -- 5.1 Der Apriori-Algorithmus -- 5.1.1 Support und Frequent Itemsets -- 5.1.2 Ableiten von Regeln -- 5.1.3 Confidence, Lift und Leverage -- 5.1.4 Exponentielles Wachstum
Note 5.1.5 Die Apriori-Eigenschaft.
Summary Dieses Buch bietet einen praxisnahen Einstieg in Data Science, angereichert mit interaktiven Elementen, der die Breite der Mg̲lichkeiten der Datenanalyse aufzeigt und tief genug geht, um Vorteile, Nachteile und Risiken zu verstehen, aber dennoch nicht zu tief in die zugrunde liegende Mathematik einsteigt. Es wird nicht nur erklr̃t, wofür wichtige Begriffe wie Big Data, machinelles Lernen oder Klassifikation stehen, sondern auch anschaulich mit zahlreichen Beispielen aufgezeigt, wie Daten analysiert werden. Ein breiter Überblick über Analysemethoden vermittelt das nṯige Wissen, um in eigenen Projekten geeignete Methoden auszuwh̃len und anzuwenden, um das gewünschte Ergebnis zu erreichen. Der benṯigte Python-Quelltext, der z.B. zur Durchführung von Analysen oder zur Erstellung von Visualisierungen verwendet wird, ist in Form von Jupyter-Notebooks frei verfügbar.
Subject Data mining.
Big data.
Data Mining
Exploration de données (Informatique)
Données volumineuses.
Big data
Data mining
Other Form: Print version: Herbold, Steffen. Data-Science-Crashkurs. Heidelberg : dpunkt.verlag, ©2022 9783864908620
ISBN 3969106184
9783969106181 (electronic bk.)
Patron reviews: add a review
Click for more information
EBOOK
No one has rated this material

You can...
Also...
- Find similar reads
- Add a review
- Sign-up for Newsletter
- Suggest a purchase
- Can't find what you want?
More Information