UID:
kobvindex_ZLB34408126
Umfang:
762-ö Seiten
,
Illustrationen
,
24 cm
Ausgabe:
1. Auflage
ISBN:
9783747500361
Serie:
mitp Professional
Inhalt:
Praktische Einführung in das Reinforcement Learning von den grundlegenden Prinzipien bis hin zu den neuesten Algorithmen mit Codebeispielen in Pytho. Selbstständig lernende Agenten programmieren für die Steuerung von Robotern, NLP in interaktiven Spielen, Chatbots und mehr Alle wichtigen Methoden anschaulich erläutert: Deep-Q-Networks, Wertiteration, Policy Gradients, Trust Region Policy Optimization (TRPO), genetische Algorithmen u.v.m. Reinforcement Learning ist ein Teilgebiet des Machine Learnings. Hierbei werden selbstständig lernende Agenten programmiert, deren Lernvorgang ausschließlich durch ein Belohnungssystem und die Beobachtung der Umgebung gesteuert wird. In diesem umfassenden Praxis-Handbuch zeigt Ihnen Maxim Lapan, wie Sie diese zukunftsweisende Technologie in der Praxis einsetzen. Sie lernen, wie Sie passende RL-Methoden für Ihre Problemstellung auswählen und mithilfe von Deep-Learning-Methoden Agenten für verschiedene Aufgaben trainieren wie zum Beispiel für das Lösen eines Rubik's Würfels, für Natural Language Processing in Microsofts TextWorld-Umgebung oder zur Realisierung moderner Chatbots. Alle Beispiele sind so gewählt, dass sie leicht verständlich sind und Sie diese auch ohne Zugang zu sehr großer Rechenleistung umsetzen können. Unter Verwendung der Bibliothek PyTorch ermöglicht Ihnen der Autor so einen einfachen und praktischen Einstieg in die Konzepte und Methoden des Reinforcement Learnings wie Deep-Q-Networks, Wertiteration, Policy Gradients, Trust Region Policy Optimization (TRPO), genetische Algorithmen und viele mehr. Es werden grundlegende Kenntnisse in den Bereichen Machine Learning und Deep Learning sowie ein sicherer Umgang mit Python vorausgesetzt. Aus dem Inhalt: Implementierung komplexer Deep-Learning-Modelle mit RL in tiefen neuronalen Netzen Ermitteln der passenden RL-Methoden für verschiedene Problemstellungen, darunter DQN, Advantage Actor Critic, PPO, TRPO, DDPG, D4PG und mehr Bauen und Trainieren eines Hardware-Roboters für unter 100EUR ; NLP in Microsofts TextWorld-Umgebung für interaktive Spiele ; Diskrete Optimierung zur Lösung von Rubik's Würfeln ; Trainieren von Agenten für Vier Gewinnt mittels AlphaGo Zero ; Die neuesten Techniken von Deep RL für Chatbots Fortgeschrittene Exploration-Techniken wie verrauschte Netze und Destillation Neuronaler Netze.
Anmerkung:
Deutsch
Sprache:
Deutsch
Schlagwort(e):
Deep Learning
;
Bestärkendes Lernen 〈Künstliche Intelligenz〉
Mehr zum Autor:
Lapan, Maxim
Mehr zum Autor:
Lorenzen, Knut
Bookmarklink