David Silver

David Silver FRS (nacido en 1976) dirige el grupo de investigación de aprendizaje por refuerzo en DeepMind y fue investigador principal de AlphaGo, AlphaZero y codirector de AlphaStar.

Se graduó en la Universidad de Cambridge en 1997 con el premio Addison-Wesley, y allí se hizo amigo de Demis Hassabis. Posteriormente, Silver cofundó la empresa de videojuegos Elixir Studios, donde fue director de tecnología y programador principal, y recibió varios premios por su tecnología e innovación.^[1]^[2]

Silver volvió al mundo académico en 2004 en la Universidad de Alberta para estudiar un doctorado sobre el aprendizaje por refuerzo, donde cointrodujo los algoritmos utilizados en los primeros programas de Go 9×9 de nivel maestro.^[3]^[4] Su versión del programa MoGo (en coautoría con Sylvain Gelly) era uno de los programas de Go más potentes a partir de 2009.^[5]

Silver recibió una beca de investigación de la Royal Society en 2011, y posteriormente se convirtió en profesor del University College London, donde ahora es catedrático.^[6] Sus conferencias sobre el aprendizaje por refuerzo están disponibles en YouTube.^[7] Silver fue consultor de DeepMind desde su creación y se incorporó a tiempo completo en 2013.

Su trabajo reciente se ha centrado en combinar el aprendizaje por refuerzo con el aprendizaje profundo, incluido un programa que aprende a jugar a los juegos de Atari directamente desde los píxeles.^[8] Silver dirigió el proyecto AlphaGo, que culminó con el primer programa que derrotó a un jugador profesional de alto nivel en el juego de Go a tamaño real.^[9] Posteriormente, AlphaGo recibió una certificación profesional 9 Dan honorífica y ganó el premio Cannes Lion a la innovación.^[10] A continuación, dirigió el desarrollo de AlphaZero, que utilizó la misma IA para aprender a jugar al Go desde cero (aprendiendo solo jugando a sí mismo y no a partir de partidas humanas) antes de aprender a jugar al ajedrez y al shogi de la misma manera, hasta niveles superiores a los de cualquier otro programa informático.

Silver es uno de los miembros del personal de DeepMind que más ha publicado, con más de 67.000 citas y un índice h de 66.^[11]

Ha sido galardonado con el Premio ACM de Informática 2019 por sus avances en el juego por ordenador.^[12]

En 2021, Silver fue elegido miembro de la Royal Society por sus contribuciones a Deep Q-Networks y AlphaGo.^[13]

Referencias

↑ Shead, Sam. «David Silver: The unsung hero and intellectual powerhouse at Google DeepMind». Business Insider. Consultado el 26 de septiembre de 2020.
↑ «What the AI Behind AlphaGo Can Teach Us About Being Human». Wired.com. Consultado el 17 de mayo de 2016.
↑ David, Silver (2009). «Reinforcement Learning and Simulation-Based Search in Computer Go». ERA (en inglés). doi:10.7939/R39D8T.
↑ Sylvain Gelly, David Silver (2008). «Achieving Master Level Play in 9 × 9 Computer Go». Proceedings of the Twenty-Third AAAI Conference on Artificial Intelligence.
↑ Stuart J. Russell, Peter Norvig (2009). Artificial Intelligence: A Modern Approach (3rd edición). Prentice Hall. Parámetro desconocido |title-link= ignorado (ayuda)
↑ «CSML | David Silver». www.csml.ucl.ac.uk (en inglés estadounidense). Archivado desde el original el 24 de abril de 2021. Consultado el 27 de mayo de 2017.
↑ «RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning». 13 de mayo de 2015 – via YouTube.
↑ Mnih, Volodymyr; Kavukcuoglu, Koray; Silver, David; Rusu, Andrei A.; Veness, Joel; Bellemare, Marc G.; Graves, Alex; Riedmiller, Martin et al. (26 de febrero de 2015). «Human-level control through deep reinforcement learning». Nature (en inglés) 518 (7540): 529-533. Bibcode:2015Natur.518..529M. ISSN 0028-0836. PMID 25719670. S2CID 205242740. doi:10.1038/nature14236.
↑ Silver, David; Huang, Aja; Maddison, Chris J.; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis; Panneershelvam, Veda; Lanctot, Marc; Dieleman, Sander; Grewe, Dominik; Nham, John; Kalchbrenner, Nal; Sutskever, Ilya; Lillicrap, Timothy; Leach, Madeleine; Kavukcuoglu, Koray; Graepel, Thore; Hassabis, Demis (28 de enero de 2016). «Mastering the game of Go with deep neural networks and tree search». Nature 529 (7587): 484-489. Bibcode:2016Natur.529..484S. ISSN 0028-0836. PMID 26819042. S2CID 515925. doi:10.1038/nature16961.
↑ «Google DeepMind AlphaGo in U.K. Wins Innovation Grand Prix» (en inglés). Consultado el 27 de mayo de 2017.
↑ «David Silver – Google Scholar Citations». Consultado el 1 de marzo de 2021.
↑ Ormond, Jim. «ACM Prize in Computing Awarded to AlphaGo Developer: David Silver Recognized for Breakthrough Advances in Computer Game-Playing». acm.org. Consultado el 2 de abril de 2020.
↑ «Royal Society elects outstanding new Fellows and Foreign Members». royalsociety.org. Consultado el 8 de junio de 2021.

Datos: Q25208036

[Unsung_Hero2-1] Shead, Sam. «David Silver: The unsung hero and intellectual powerhouse at Google DeepMind». Business Insider. Consultado el 26 de septiembre de 2020.

[MyUser_Wired.com_May_17_2016c2-2] «What the AI Behind AlphaGo Can Teach Us About Being Human». Wired.com. Consultado el 17 de mayo de 2016.

[3] David, Silver (2009). «Reinforcement Learning and Simulation-Based Search in Computer Go». ERA (en inglés). doi:10.7939/R39D8T.

[4] Sylvain Gelly, David Silver (2008). «Achieving Master Level Play in 9 × 9 Computer Go». Proceedings of the Twenty-Third AAAI Conference on Artificial Intelligence.

[5] Stuart J. Russell, Peter Norvig (2009). Artificial Intelligence: A Modern Approach (3rd edición). Prentice Hall. Parámetro desconocido |title-link= ignorado (ayuda)

[6] «CSML | David Silver». www.csml.ucl.ac.uk (en inglés estadounidense). Archivado desde el original el 24 de abril de 2021. Consultado el 27 de mayo de 2017.

[7] «RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning». 13 de mayo de 2015 – via YouTube.

[8] Mnih, Volodymyr; Kavukcuoglu, Koray; Silver, David; Rusu, Andrei A.; Veness, Joel; Bellemare, Marc G.; Graves, Alex; Riedmiller, Martin et al. (26 de febrero de 2015). «Human-level control through deep reinforcement learning». Nature (en inglés) 518 (7540): 529-533. Bibcode:2015Natur.518..529M. ISSN 0028-0836. PMID 25719670. S2CID 205242740. doi:10.1038/nature14236.

[9] Silver, David; Huang, Aja; Maddison, Chris J.; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis; Panneershelvam, Veda; Lanctot, Marc; Dieleman, Sander; Grewe, Dominik; Nham, John; Kalchbrenner, Nal; Sutskever, Ilya; Lillicrap, Timothy; Leach, Madeleine; Kavukcuoglu, Koray; Graepel, Thore; Hassabis, Demis (28 de enero de 2016). «Mastering the game of Go with deep neural networks and tree search». Nature 529 (7587): 484-489. Bibcode:2016Natur.529..484S. ISSN 0028-0836. PMID 26819042. S2CID 515925. doi:10.1038/nature16961.

[10] «Google DeepMind AlphaGo in U.K. Wins Innovation Grand Prix» (en inglés). Consultado el 27 de mayo de 2017.

[MyUser_Https:_May_17_2016c2-11] «David Silver – Google Scholar Citations». Consultado el 1 de marzo de 2021.

[12] Ormond, Jim. «ACM Prize in Computing Awarded to AlphaGo Developer: David Silver Recognized for Breakthrough Advances in Computer Game-Playing». acm.org. Consultado el 2 de abril de 2020.

[13] «Royal Society elects outstanding new Fellows and Foreign Members». royalsociety.org. Consultado el 8 de junio de 2021.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

David Silver

Referencias

€4.95