https://nplus1.ru/images/2020/02/14/758967a71dec40d6b8c56df85101d98d.jpg

N+1

Нейросеть научилась распознавать узлы в полимерах

14 Feb 2020, 17:09 by Тимур Кешелава

Ученые проверили способность нейросетей классифицировать возникающие в химии полимеров узлы. Исследователи протестировали несколько различных архитектур, лучшая из которых показала правильное распознавание в 99 процентов случаев при анализе циклических молекул из ста сегментов. Такой точности уже сегодня достаточно для некоторых применений, а в случае прогресса в будущем нейросетевое определение узлов может стать полноценным методом как в случае физико-химических систем, так и в контексте математики, пишут авторы в журнале Physical Review E.

Узлы повсеместны в окружающей реальности, от спутавшихся в кармане наушников до альпинисткой обвязки. Они также возникают во многих разделах науки, в том числе в физике, химии и биологии. Например, бывают заузленные течения в жидкости, в узлы также скручиваются многие молекулы - в частности, белки и ДНК.

С точки зрения математики узел — это вложение окружности в трехмерное пространство, при этом одинаковые с точностью до непрерывных преобразований (без разрывов) узлы считаются эквивалентными. Известно, что задача о классификации узлов алгоритмически разрешима, но пока не придумано алгоритма полиномиальной сложности даже для распознавания тривиальных узлов, то есть обычных окружностей с точностью до деформаций.

Стандартный подход заключается в поиске топологических инвариантов, по которым можно отличить узлы. Здесь выделяются два направления: полиномиальные инварианты (Александера, Джонса и другие) и гомотопические инварианты (Хованова, Хегора — Флоера и другие). Однако все предложенные методы обладают недостатками. В частности, бесконечно много неодинаковых на самом деле узлов обладают одинаковым полиномом Александера, а гомотопии в общем случае нереалистично сложно подсчитать.

Исследователи из Китая и Сингапура под руководством Лян Дая (Liang Dai) из Городского университета Гонконга опробовали принципиально иной метод на основе нейросетей. В отличие от аналитических алгоритмов он не позволяет добиться абсолютной уверенности в ответе, но зато теоретически может работать в недоступных для других способов случаях. Авторы хотели проверить принципиальную возможность использования нейросетей для распознавания узлов, поэтому ограничились пятью разными узлами и двумя нейросетями.

Исследовали использовали нейросеть с прямой связью и рекуррентную нейросеть. Обучающей и тестовой выборкой были проведенные методом Монте-Карло симуляции конфигурации полимера в виде кольца из ста мономеров. В каждом случае тип узла определялся с помощью многочлена Александера, а для нейросетей выбиралось по 200 тысяч или 2 миллиона каждого из пяти видов получаемых узлов. В качестве дополнительного испытания нейросети также определяли тип узла у миллиона полимеров из 60 и 80 мономеров, которых не было в обучающей выборке.

https://nplus1.ru/images/2020/02/14/5b765486fbf6b01c87c0713fdc69ef4d.jpg — Результаты обучения нейросетей
*O. Vandans et al. / Physical Review E, 2020*

Рекуррентная нейросеть во всех тестах показала себя лучше. Наивысшего результата удалось добиться в случае работы с суммарной выборкой в 2 миллиона полимеров длиной в сто элементов — выше 99 процентов. В то же время максимальная точность более простой нейросети с прямой связью составила всего немногим более 80 процентов. В целом ученые заключают, что их работа вселяет уверенность, что более сложные нейросети в случае наличия достаточно больших обучающих выборок смогут стать мощным инструментом по классификации узлов.Ранее ученые нашли среди миллионов молекулярных узлов шесть устойчивых, вывели прочность веревочного узла из его топологии и скрутили рекордно сложный молекулярный узел.

Тимур Кешелава