UID:
kobvindex_ERBEBC6898313
Umfang:
1 online resource (363 pages)
Ausgabe:
1
ISBN:
9783836284646
Anmerkung:
Intro -- Materialien zum Buch -- 1 Einleitung -- 1.1 Warum dieses Buch? -- 1.2 Das Zeitalter der Daten - alles nur ein Hype? -- 1.3 Warum nun Data Science? -- 1.4 Warum Data Science mit R? -- 1.5 Für wen ist dieses Buch? -- 1.6 Kann man Data Science ohne Mathe lernen? -- 1.7 Wie Sie dieses Buch verwenden können -- 1.8 Materialien und Kontakt -- 1.9 Danksagungen -- 2 Machine Learning, Data Science und künstliche Intelligenz -- 2.1 Aus der Geschichte lernen - alles nur ein Hype? -- 2.1.1 Daten und Maschinen vor den Anfängen der KI -- 2.1.2 Der erste Frühling der künstlichen Intelligenz -- 2.1.3 Der erste KI-Winter -- 2.1.4 Der zweite KI-Frühling: Expertensysteme -- 2.1.5 Der zweite KI-Winter -- 2.1.6 Kommt nun der dritte KI-Frühling? -- 2.1.7 Rückschläge -- 2.1.8 Technologische Singularität: Haben Maschinen ein Bewusstsein? -- 2.1.9 Alan Turing und der Turing-Test -- 2.2 Begriffsdefinitionen -- 2.2.1 Machine Learning -- 2.2.2 Künstliche Intelligenz -- 2.2.3 Data Science -- 2.2.4 Datenanalyse und Statistik -- 2.2.5 Big Data -- 3 Ablauf eines Data-Science-Projekts -- 3.1 Der allgemeine Ablauf eines Data-Science-Projekts -- 3.1.1 Die CRISP-DM Stages -- 3.1.2 ASUM-DM -- 3.1.3 Der Ablauf nach Hadley Wickham -- 3.1.4 Welcher Ansatz ist für mich der richtige? -- 3.2 Business Understanding: Welches Problem soll gelöst werden? -- 3.2.1 Senior-Management-Unterstützung und Einbeziehung der Fachabteilung -- 3.2.2 Anforderungen verstehen -- 3.2.3 Widerstände überwinden: Wer hat Angst vor der bösen KI? -- 3.3 Grundsätzliche Ansätze im Machine Learning -- 3.3.1 Supervised versus Unsupervised versus Reinforcement Learning -- 3.3.2 Feature Engineering -- 3.4 Performancemessung -- 3.4.1 Test- und Trainingsdaten -- 3.4.2 Fehler ist nicht gleich Fehler: False Positives und False Negatives -- 3.4.3 Confusion Matrix -- 3.4.4 ROC AUC -- 3.4.5 Precision Recall Curve
,
3.4.6 Wirkung des Modells -- 3.4.7 Data Science ROI -- 3.5 Kommunikation mit Stakeholdern -- 3.5.1 Reporting -- 3.5.2 Storytelling -- 3.6 Aus dem Labor in die Welt: Data-Science-Applikationen in Produktion -- 3.6.1 Von Data Pipelines und Data Lakes -- 3.6.2 Integration in andere Systeme -- 3.7 Die verschiedenen Rollen in einem Data-Science-Projekt -- 3.7.1 Data Scientist -- 3.7.2 Data Engineer -- 3.7.3 Data Science Architect -- 3.7.4 Business Intelligence Analyst -- 3.7.5 Der Subject Matter Expert -- 3.7.6 Projektmanagement -- 3.7.7 Citizen Data Scientist -- 3.7.8 Weitere Rollen -- 4 Einführung in R -- 4.1 R: kostenlos, portierbar und interaktiv -- 4.1.1 Geschichte -- 4.1.2 Erweiterung mit Paketen -- 4.1.3 Die IDE RStudio -- 4.1.4 R versus Python -- 4.1.5 Andere Sprachen -- 4.2 Installation und Konfiguration von R und RStudio -- 4.2.1 Installation von R und kurzer Funktionstest -- 4.2.2 Installation von RStudio -- 4.2.3 Konfiguration von R und RStudio -- 4.2.4 Ein Rundgang durch RStudio -- 4.2.5 Projekte in RStudio -- 4.2.6 Die Cloud-Alternative: RStudio Cloud -- 4.3 Erste Schritte mit R -- 4.3.1 Alles in R ist ein Objekt -- 4.3.2 Grundlegende Befehle -- 4.3.3 Datentypen -- 4.3.4 Daten einlesen -- 4.3.5 Daten schreiben -- 4.3.6 Tipps zum professionellen und schnellen Arbeiten -- 5 Explorative Datenanalyse -- 5.1 Daten: Sammlung, Reinigung und Transformation -- 5.1.1 Datenakquise -- 5.1.2 Wie viel Daten sind genug? -- 5.1.3 Datenreinigung: Die verschiedenen Dimensionen der Datenqualität -- 5.1.4 Datentransformation: Der unterschätzte Aufwand -- 5.2 Notebooks -- 5.2.1 EDAs mit Notebooks und Markdown -- 5.2.2 Knitting -- 5.3 Das Tidyverse -- 5.3.1 Warum das Tidyverse nutzen? -- 5.3.2 Die Grundverben -- 5.3.3 Von Data Frames zu Tibbles -- 5.3.4 Transformation von Daten -- 5.3.5 Reguläre Ausdrücke und mutate() -- 5.4 Datenvisualisierung
,
5.4.1 Datenvisualisierung als Teil der Analyse -- 5.4.2 Datenvisualisierung als Teil des Reportings -- 5.4.3 Plots in Base R -- 5.4.4 ggplot2: A Grammar of Graphics -- 5.5 Datenanalyse -- 6 Anwendungsfall Prognosen -- 6.1 Lineare Regression -- 6.1.1 Wie der Algorithmus funktioniert -- 6.1.2 Wie wird die lineare Regression in R durchgeführt? -- 6.1.3 Interpretation der Ergebnisse -- 6.1.4 Vor- und Nachteile -- 6.1.5 Nicht lineare Regression -- 6.1.6 Kleiner Hack: Lineare Regression bei nicht linearen Daten -- 6.1.7 Logistische Regression -- 6.2 Anomalie-Erkennung -- 6.2.1 Ein kleiner Exkurs: Zeitreihenanalysen -- 6.2.2 Fitting mit dem Forecast-Package -- 7 Clustering -- 7.1 Hierarchisches Clustering -- 7.1.1 Einführung in die Vorgehensweise -- 7.1.2 Die euklidische Distanz und ihre Konkurrenten -- 7.1.3 Die Distanzmatrix, aber skaliert -- 7.1.4 Das Dendrogramm -- 7.1.5 Dummy-Variablen: Was, wenn wir keine numerischen Daten haben? -- 7.1.6 Was macht man nun mit den Ergebnissen? -- 7.2 k-Means -- 7.2.1 Wie der Algorithmus funktioniert -- 7.2.2 Woher kennen wir eigentlich k? -- 7.2.3 Interpretation der Ergebnisse -- 7.2.4 Ist k-Means immer die Antwort? -- 8 Klassifikation -- 8.1 Anwendungsfälle für eine Klassifikation -- 8.2 Trainings- und Testdaten erstellen -- 8.2.1 Der Titanic-Datensatz: Eine kurze EDA -- 8.2.2 Das Caret-Package: Dummy-Variablen und Aufteilen der Daten -- 8.2.3 Das pROC-Package -- 8.3 Decision Trees -- 8.3.1 Wie der Algorithmus funktioniert -- 8.3.2 Training und Test -- 8.4 Support Vector Machines -- 8.4.1 Wie der Algorithmus funktioniert -- 8.4.2 Vorbereitung der Daten -- 8.4.3 Training und Test -- 8.4.4 Interpretationen der Ergebnisse -- 8.5 Naive Bayes -- 8.5.1 Wie der Algorithmus funktioniert -- 8.5.2 Vorbereitung der Daten -- 8.5.3 Training und Test -- 8.5.4 Interpretation der Ergebnisse -- 8.6 XG Boost: Der Newcomer
,
8.6.1 Wie der Algorithmus funktioniert -- 8.6.2 Vorbereitung der Daten -- 8.6.3 Training und Test -- 8.6.4 Interpretation der Ergebnisse -- 8.7 Klassifikation von Text -- 8.7.1 Vorbereiten der Daten -- 8.7.2 Training und Test -- 8.7.3 Interpretation der Ergebnisse -- 9 Weitere Anwendungsfälle -- 9.1 Warenkorbanalyse - Association Rules -- 9.1.1 Wie der Algorithmus funktioniert -- 9.1.2 Vorbereitung der Daten -- 9.1.3 Anwendung des Algorithmus -- 9.1.4 Interpretationen der Ergebnisse -- 9.1.5 Visualisierung von Assoziationsalgorithmen -- 9.1.6 Association Rules mit dem Datensatz »Groceries« -- 9.2 k-nearest Neighbours -- 9.2.1 Wie der Algorithmus Ausreißer identifiziert -- 9.2.2 Wer ist denn jetzt am weitesten draußen von allen? -- 9.2.3 kNN als Klassifikator -- 9.2.4 LOF zur Analyse der Fehlklassifikationen -- 10 Workflows und Werkzeuge -- 10.1 Versionierung mit Git -- 10.1.1 Warum Versionierung? -- 10.1.2 Git, GitHub und GitLab -- 10.1.3 Basisbefehle -- 10.1.4 Integration in RStudio -- 10.1.5 Code committen und pushen -- 10.2 Mit großen Datenmengen umgehen -- 10.2.1 Größerer Computer gefällig? Cloud-Computing mit R -- 10.2.2 Mit Clustern arbeiten: Spark und Sparklyr -- 10.2.3 data.table -- 10.3 Applikationen via API bereitstellen -- 10.3.1 Was ist eine REST API? -- 10.3.2 Eine API mit dem Package »plumber« bereitstellen -- 10.3.3 Der nächste Schritt: Docker -- 10.4 Applikationen erstellen mit Shiny -- 10.4.1 Was ist Shiny? -- 10.4.2 UI and Server -- 10.4.3 Veröffentlichen einer Shiny-App aus RStudio -- 10.4.4 Beispielapplikationen -- 10.4.5 ShinyApps.io -- 11 Ethischer Umgang mit Daten und Algorithmen -- 11.1 Datenschutz -- 11.1.1 Die Entwicklung des Datenschutzes am Beispiel von Deutschland -- 11.1.2 Gesetze sind das eine, das eigene Verhalten das andere -- 11.1.3 Was bedeutet Datenschutz für Data-Science-Projekte?
,
11.1.4 Die Datenschutz-Folgeabschätzung -- 11.2 Ethik: Gegen Profiling und Diskriminierung -- 11.2.1 Was ist Diskriminierung? -- 11.2.2 Wie kann Diskriminierung verhindert werden? -- 11.2.3 Was ist Profiling? -- 11.2.4 Wie kann Profiling verhindert werden? -- 12 Was kommt nach diesem Buch? -- 12.1 Projekte, Projekte, Projekte -- 12.1.1 Ein Projektportfolio zusammenstellen -- 12.1.2 Kaggle -- 12.2 Wer hilft Ihnen jetzt weiter? -- 12.2.1 RTFM -- 12.2.2 Stack Overflow -- 12.2.3 Die R-Help-Mailingliste -- 12.3 RSeek -- Anhang -- A Typische Fehlermeldungen und geeignete Lösungen -- A.1 Ganz typische Fehler und wie man sie vermeidet -- A.2 R beziehungsweise RStudio reagieren nicht -- A.3 Typische Fehlermeldungen -- B Glossar -- C Literatur -- Index
Weitere Ausg.:
Print version: Alby, Tom Data Science in der Praxis Bonn : Rheinwerk Verlag,c2022 ISBN 9783836284622
Schlagwort(e):
Electronic books.
URL:
https://ebookcentral.proquest.com/lib/th-brandenburg/detail.action?docID=6898313
Bookmarklink