AlphaGo ist ein KI-Programm von Google DeepMind, das 2016 den weltbesten Go-Spieler Lee Sedol besiegte. Go galt als zu komplex für Computer, weil es mehr mögliche Spielzüge gibt als Atome im Universum. AlphaGo nutzte eine Kombination aus Deep Learning und Reinforcement Learning.
Go ist ein Brettspiel mit einfachen Regeln, aber einer Komplexität, die Schach um Größenordnungen übertrifft. Während IBMs Deep Blue Schach-Weltmeister Kasparov bereits 1997 schlug, galt Go als unlösbar für Computer. Die Zahl möglicher Spielzustände übersteigt die Zahl der Atome im beobachtbaren Universum.
Im März 2016 besiegte AlphaGo den südkoreanischen Profi-Spieler Lee Sedol 4:1. Das Ereignis wurde weltweit live übertragen und gilt als einer der Wendepunkte in der Geschichte der Künstlichen Intelligenz.
AlphaGo kombinierte zwei Ansätze: Deep Learning (neuronale Netze, die aus Millionen von Go-Partien lernten) und Reinforcement Learning (das System spielte Millionen von Partien gegen sich selbst und verbesserte sich dabei kontinuierlich). Die Nachfolgerversion AlphaGo Zero lernte komplett ohne menschliche Partien und wurde noch stärker.
AlphaGo bewies, dass Deep Learning und Reinforcement Learning zusammen Probleme lösen können, die vorher als unlösbar galten. Dieselben Methoden bilden heute die Grundlage für RLHF (Reinforcement Learning from Human Feedback), das Verfahren, mit dem ChatGPT und Claude trainiert werden.
🔗 Verwandte Begriffe:
Google DeepMind, Deep Learning, Reinforcement Learning, AlphaFold, RLHF
➡ Du willst KI in deinem Arbeitsalltag einsetzen? In meinen „KI at Work“ Kursen zeige ich dir Schritt für Schritt, wie das geht. Ohne Vorwissen.
Änderungshistorie: