Die Auswertung von Datenmengen in Verbindung mit maschinellen Lernen spielt in unserer Gesellschaft von Tag zu Tag eine größere Rolle. Mittlerweile werden große Datensätze in vielen Bereichen gesammelt. Zum Beispiel im privaten Bereich um das eigene Fitness Level zu beurteilen aber auch in vielen Unternehmen bekommt dieses Thema immer mehr Relevanz. Umso mehr Daten verarbeitet werden können, desto präziser können mathematische Modelle trainiert werden. Dadurch können wiederum sehr genaue Prognosen erstellt werden, die einen wichtigen Einfluss auf die Wirtschaft haben. Das Buch Data Science aus dem dpunkt.verlag bietet eine umfassende Einführung in dieses Thema. Neben den grundlegenden Methoden der Data Science werden aber auch Bereiche wie Data Privacy und Ethik thematisiert.
Aufbau
Jedes Kapitel fängt mit einer kleinen und verständlichen Einleitung an. Die Konzepte werden sehr häufig anhand von Grafiken sehr verständlich erklärt. An vielen Stellen wird Lektüre zitiert, um sich bei Bedarf näher mit einem Thema zu beschäftigen. Zu dem Themengebiet Grundlegende Methoden der Data Science wird unter anderem das Clustering vorgestellt. Bei dem Clustering werden Daten eines Datensatzes nach bestimmten Merkmalen gruppiert. Obwohl das Buch für Einsteiger geschrieben wurde, werden allerdings auch theoretische Grundlagen vermittelt. Der Nearest Centroid Algorithmus erfordert eine mathematische Formel zur Berechnung der Distanz einzelner Datenelemente. In dem Buch werden dann verschiedene Formel wie zum Beispiel die Cosinus-Distanz oder die euklidische Distanz dafür vorgeschlagen. Die Vielfältigkeit der Informationen in diesem Lehrbuch führen zu einem fundierten und nachhaltigen Grundwissen zu dem Thema Data Science.
Meine Meinung
Insgesamt kann man das Buch sehr gut lesen um sich einen ersten Eindruck zum Thema Data Science zu verschaffen. Die Autoren schaffen es auch komplizierte Themen kurz und unkompliziert auf den Punkt zu bringen. Das Buch Data Science ist meiner Meinung nach ein sehr guter Ausgangspunkt um sich mit dem Thema Data Science zu beschäftigen und auch in vielen Gebieten mehr Interesse zu wecken.
Das Buch Data Science hat 336 Seiten und kostet 59,90€ und ist am 09.05.2019 erschienen.
Das Buch wurde mir kostenlos von dem Verlag zur Verfügung gestellt.