Алгоритму DeepMind передали управління термоядерним реактором у Лозанні
Розробники штучного інтелекту з команди DeepMind продовжують пропонувати варіанти практичного застосування свого ШІ для розв’язання складних наукових проблем. У співпраці зі Швейцарським центром плазми при університеті Лозанни британська компанія навчила алгоритм керувати розпеченою матерією всередині термоядерного реактора. Проривна технологія допоможе вченим краще зрозуміти фізику синтезу та наблизити настання ери чистої та дешевої електроенергії.
“Це одне з найскладніших застосувань навчання з підкріпленням у реальному світі”, – заявив Мартін Рідміллер, дослідник з DeepMind.
Контрольований синтез ядер атомів водню, у процесі якого виділяється велика кількість енергії, виявилося надзвичайно складно відтворити у земних умовах. Ядра відштовхують один одного, тому змусити їх зіткнутися можна тільки при температурі в сотні мільйонів градусів. Речовина в таких умовах стає плазмою, яку потрібно утримувати всередині реактора достатньо часу, щоб видобути з неї енергію. Усередині зірок цю роботу виконує гравітація. На Землі вчені вдаються до різних трюків на кшталт лазерів та магнітів.
Управління плазмою вимагає постійного спостереження та зміни параметрів магнітного поля. Алгоритм DeepMind навчили виконувати цю роботу в симуляції, а потім, коли він показав, що здатний контролювати та змінювати форму плазми усередині віртуального реактора, вчені передали йому управління експериментальним токамаком TCV, розповідає Technology Review.
Результати експерименту показала, що ШІ може контролювати реальний термоядерний реактор без додаткового налаштування. Він керував плазмою протягом двох секунд – це граничний час для токамака TCV, інакше температура стає для нього занадто високою.
За цей час алгоритм кілька тисяч разів виміряв 90 різних параметрів, що описують форму та положення плазми, та керував напругою в 19 магнітах. Цей контур зворотнього зв’язку набагато швидше, ніж, з якими доводилося мати справу системам навчання з підкріпленням раніше. Для того, щоб прискорити процес, ШІ розділили на дві нейромережі. Велика — названа критиком — навчалася методом спроб і помилок, як управляти реактором усередині симуляції. Потім навички критика реалізовувала швидка нейромережа – “актор” – яка й займалася реактором.
«Це неймовірно потужний метод, — визнав Джонатан Сітрін із Голландського інституту фундаментальної енергетики, який не брав участі в дослідженні. — Це важливий перший крок у дуже перспективному напрямі».
Вчені переконані, що застосування ШІ для управління плазмою спростить проведення експериментів із різними умовами всередині реактора, допоможе зрозуміти процес та прискорить появу комерційної енергії термоядерного синтезу.