Увеличение производительности ИИ: повышение скорости и интеллекта с помощью физики
В возрасте 10 лет Роз Ю получила преобразующий подарок на день рождения от своего дяди — компьютер. Это было редкое имущество в Китае 25 лет назад, но оно зажгло в ней страсть к технологиям на всю жизнь. Изначально увлеченная компьютерными играми, талант Ю вскоре стал очевиден, когда она выиграла награду за веб-дизайн в средней школе, положив начало своему пути в технологии.
Роз Ю изучала компьютерные науки в Университете Чжэцзян, заслужив признание за свои инновационные исследования. Для аспирантуры она выбрала Университет Южной Калифорнии (USC), на что повлияла близость её дяди, работающего в Лаборатории реактивного движения в Пасадене. Ю защитила свою докторскую диссертацию в 2017 году, получив награду за выдающееся исследование. Примечательно, что в январе она получила Президентскую премию за раннюю карьеру от президента Джо Байдена.
В настоящее время являясь доцентом в Университете Калифорнии в Сан-Диего (UCSD), Ю является пионером в области глубокого обучения, ориентированного на физику. Интегрируя физику в искусственные нейронные сети, она разработала новаторские техники для улучшения этих систем. Её работа имеет практическое применение, от улучшения прогнозов движения на основе динамики жидкости до ускорения симуляций турбулентности, которые имеют решающее значение для понимания ураганов, а также разработки методов прогнозирования распространения Covid-19.
Амбициозное видение Ю включает развертывание AI Scientist, набора цифровых лабораторных помощников. Она видит сотрудничество между человеческими исследователями и ИИ, основанное на физике, как способ получения новых научных инсайтов. Она верит, что объединение контрибьюторов таких ИИ-помощников может значительно ускорить процесс открытия.
Журнал Quanta Magazine связался с Ю, чтобы обсудить сложности турбулентности, максимизацию полезности ИИ и решение проблем городских пробок. Беседа была отредактирована для ясности.
Когда вы впервые попытались интегрировать физику с глубоким обучением?
Роз Ю: Мой интерес начался с проблем движения. Будучи аспирантом в USC, я постоянно пересекала загруженные перекрестки I-10 и I-110. В 2016 году я размышляла над потенциальными решениями с помощью технологий.
В тот период глубокое обучение — известное использованием многослойных нейронных сетей для обнаружения паттернов в данных — набирало популярность, особенно в классификации изображений. Однако я была любопытна к его применению в динамических сценариях. Хотя я не была первой, кто исследовал это, я и мои коллеги разработали новый подход к проблеме.
Каково было ваше новаторское решение?
Мы концептуализировали движение потока автомобилей, используя принципы диффузии в физических процессах. Наша модель сопоставляла движение транспорта по дорожным сетям с динамикой жидкости на поверхностях. Наша основная инновация заключалась в том, что мы представили движение транспорта в виде графа — концепции из теории графов. Датчики мониторинга дорожного движения стали узлами, в то время как дороги и расстояния между ними стали ребрами.
Граф предлагает моментальный снимок всей дорожной сети в любой момент времени, подробно описывая среднюю скорость автомобиля на каждом узле. Содержая эти снимки каждые пять минут, мы могли отслеживать эволюцию движения и прогнозировать будущие изменения.
Глубокое обучение требует обширных данных для обучения нейронных сетей. К счастью, у меня был доступ к обширному хранилищу данных о движении в Лос-Анджелесе благодаря многолетней работе моего советника Сайруса Шахаби по прогнозированию движения.
Насколько точными были ваши прогнозы?
До нашего исследования надежные прогнозы движения касались только 15 минут. Наша модель продлила этот период надежности до одного часа, что стало значительным прогрессом. Наш код был интегрирован в Google Maps в 2018 году, и я впоследствии была приглашена присоединиться к Google в качестве исследователя.
Это когда началась ваша работа над моделированием климата?
Действительно, в 2018 году, после презентации в Национальной лаборатории имени Лоренса Беркли, я сотрудничала с учеными для выяснения подходящей проблемы для глубокого обучения, ориентированного на физику. Мы остановились на прогнозировании эволюции турбулентного потока — критического, но неопределенного компонента в климатических моделях.
Турбулентность, проявляющаяся в вихрях кофе или огромных океанских завихрениях, играет ключевую роль в климатических прогнозах. Уравнение Навье-Стокса, моделирующее движение жидкости, служит золотым стандартом, но требует обширных вычислений, что ограничивает точные прогнозы ураганов и циклонов.
Может ли глубокое обучение решить эти проблемы?
Определенно. Глубокие нейронные сети, обученные на надежных численных симуляциях, могут имитировать эти симуляции, выявляя внутренние паттерны данных без исчерпывающих вычислений. Наши модели достигли 20-кратного увеличения скорости прогнозирования для двумерных условий и 1000-кратного увеличения для трехмерных условий. Такие достижения могут значительно улучшить климатические модели для более точных прогнозов ураганов.
Где еще проявляется турбулентность?
Турбулентность повсеместна. В кровотоке она может привести к инсультам или сердечным приступам. Будучи в Caltech, я исследовала стабилизацию дронов, решая проблемы, вызванные турбулентностью, создаваемой потоками воздуха от винтов. Моделируя эту турбулентность с помощью нейронных сетей, мы улучшили управление дроном в критические моменты.
В настоящее время я сотрудничаю с UCSD и General Atomics в области термоядерной энергии. Понимание поведения плазмы, отмеченной турбулентностью при экстремальных температурах, имеет решающее значение. Мы разрабатываем модель глубокого обучения для быстрого прогнозирования динамики плазмы, хотя требуется еще много работы.
Что вдохновило концепцию AI Scientist?
В последние годы мы создали алгоритмы ИИ, способные автономно выявлять принципы симметрии из данных. Удивительно, но наш алгоритм выявил симметрию Лоренца и вращательную симметрию без явного обучения. Хотя это уже устоявшиеся концепции, наши инструменты могут открыть неизвестные симметрии, что является значительным прорывом в физике.
Эта способность привела к пониманию того, что эти инструменты могут генерировать новые идеи или гипотезы для исследований. Так родилась концепция AI Scientist.
Что такое AI Scientist — просто расширенная нейронная сеть?
AI Scientist состоит из набора программ, предназначенных для содействия научным открытиям. Мы разработали алгоритмы для конкретных задач, от прогнозирования погоды до анализа глобальных факторов температуры и определения влияния прививочной политики.
Наша цель — создать базовую модель, способную выполнять различные задачи. Ученые собирают данные из множества источников, и мы стремимся, чтобы наша модель могла обрабатывать разные типы данных, включая числа, текст, изображения и видео. Хотя она все еще в стадии прототипа, мы стремимся увеличить её интеллект и обучение перед выпуском, возможно, в течение нескольких лет.
Какой потенциал вы видите для AI Scientist?
ИИ может поддерживать практически каждый аспект научного открытия. Под «AI Scientist» я подразумеваю помощника ИИ, который содействует научному процессу. Например, проведение обзора литературы требует обширного сбора и организации данных, что соответствует возможностям ИИ. Однако у ИИ нет суждения о научной надежности, где опытные исследователи преуспевают. Хотя ИИ может содействовать в генерации гипотез и анализе данных, выполнение сложных экспериментов все еще выходит за его рамки.
Как далеко вы хотите продвинуть эту концепцию?
Я вижу AI Scientist как способ снятия рутинных задач, позволяя исследователям сосредоточиться на творческих аспектах науки. Человеческое творчество остается незаменимым. Моя цель не заключается в том, чтобы заменить человеческих ученых, а в том, чтобы дополнить их креативность с помощью ИИ.
Оригинальная история перепечатана с разрешения Quanta Magazine, редакционно независимого издания Фонда Симонса, посвященного углублению общественного понимания науки путем освещения научных достижений в математике, физике и биологических науках.