N+1
Ученые объяснили принятие решений с помощью квантовой физики
by Олег МакаровУченые из Китая создали два самообучающихся алгоритма принятия решений, которые основаны на принципах квантовой физики. Квантовые алгоритмы сыграли в простую игру наряду с 12 классическими программами машинного обучения, а также с курящими и некурящими людьми. Оказалось, что квантовые алгоритмы описывают поведение человека не хуже (а часто и лучше) самых точных классических вариантов. Ученые предполагают, что квантовая физика причастна к принятию решений как на поведенческом, так и нейрофизиологическом уровне. Работа опубликована в журнале Nature Human Behaviour.
Когда обучение с учителем невозможно, исследователи часто используют обучение с подкреплением — метод, пришедший в машинное обучение из ранней поведенческой психологии: термин «обучение с подкреплением» впервые использовал физиолог Иван Петрович Павлов. В ходе такого обучения интересующая нас система (агент) взаимодействует с внешней средой так, чтобы максимизировать свой выигрыш или получить наибольшее вознаграждение. Агентом в концепции обучения с подкреплением может быть не только алгоритм, но и человек. Поэтому на сегодняшний день обучение с подкреплением — предмет и машинного обучения, и психологии принятия решений.
На протяжении последних десятилетий ученым довольно успешно удавалось строить алгоритмы машинного обучения для получения точных предсказаний и интересных трактовок в области психологии. Однако, некоторые явления (например, ошибку конъюнкции) не получалось описать стандартным способом, ведь поведение человека далеко не всегда рационально.
На помощь неожиданно пришла квантовая физика, точнее ее математический аппарат. Квантовое описание так сильно отличается от классического, что иногда даже простые законы логики перестают работать (например, нарушается неравенство Белла). Частицу в квантовой физике описываются волновыми функциями с разными амплитудами вероятности. Так, используя подобие таких волновых функций, ученые еще в 2008 году показали превосходство квантовой модели случайных блужданий в цепи Маркова над классическим вариантом.
Группа ученых во главе с Джи-Ан Ли (Ji-An Li ) из научно-технического университета Китая впервые применила квантовые алгоритмы к проблеме принятия решений на основе стоимости. Два квантовых алгоритма, которые построили ученые, сыграли в простую игру Iowa Gambling Task — она имитирует принятие решений в реальной жизни. Испытуемый каждый раз выбирает одну из четырех возможных табличек (или карту из четырех колод), за свой выбор он получает вознаграждение или теряет условные деньги. Произвольные на первый взгляд выигрыши и проигрыши оказываются подчинены логике. Для максимизации выигрыша нужно выбирать определенные таблички. Задача игрока — как можно быстрее вычислить их.
Кроме новых квантовых, игру прошли 12 старых классических алгоритмов, курящие люди (43 человека) и некурящие люди (58 человек). Ранее, ученые показали, что в среднем курильщики справляются с игрой несколько хуже, чем некурящие люди.
Ученые использовали несколько критериев совпадения всех 14 алгоритмов с двумя группами людей и пришли к выводу: квантовые алгоритмы либо лучше классических, либо не уступают им. При этом, нужно принимать во внимание тот факт, что квантовые модели — первые в своем роде, а значит, скорее всего, они будут усовершенствованы в ближайшем будущем.
Подобно тому, как электрон может переходить из одного состояния в другое, поглощая или высвобождая энергию, предпочтения агента могут изменяться при получении информации из среды, утверждают ученые. Ученые используют понятие обобщенных квантовых расстояний (они определяют его как геометрическое среднее между двумя сигналами влияющими на программу), которое указывает на амплитуду вероятности перехода.
Они вычислили обобщенные квантовые расстояния и выяснили, что они уменьшаются со временем. Это значит, что по мере накопления знаний о правилах игры, вероятность изменения решений также падает. Ученые подтвердили свой алгоритм и данными фМРТ играющих людей. Квантовый алгоритм очень хорошо согласуется с данными фМРТ контрольной группы (некурящих людей), а вот для группы курящих найти связь не удалось. По мнению ученых, это может служить доказательством нарушений механизмов принятия решений у людей с никотиновой зависимостью.
Исследование ученых открывает огромные возможности для различных трактовок механизмов работы мозга и моделей машинного обучения на квантовых принципах. Однако, стоит подождать следующих публикаций. Основываясь на единственной работе, не стоит делать общих заключений.
Ученых заботит не только мозг курильщиков. Так, например, исследователи обнаружили неожиданно много здоровых клеток в легких бывших курильщиков.
Олег Макаров