Вычислительная инфраструктура виртуального скрининга

virtual-screening-2-small

Вычисление парных взаимодействий между атомами, что является необходимым условием для функционирования многих виртуальных программ скрининга, имеет О(N2) вычислительную сложность, где N число атомов в системе. В связи с квадратичным масштабированием по отношению к числу атомов, вычислительная инфраструктура может варьироваться от портативного компьютера для лиганд-метода до ЭВМ для метода на основе структуры.
На основе лигандов
Лиганд методы, как правило, требуют доли секунды для одной операции сравнения структуры. Одного процессора достаточно для выполнения большого объема скрининга в течение нескольких часов. Однако, некоторые сравнения могут быть сделаны параллельно для ускорения обработки больших баз данных соединений, что сродни методам обработки выборок для повышения конверсии сайта. Это доказывают положительные результаты работы маркетинговых компаний, применяющих в своей деятельности передовые методы. Один из лидеров маркетинга на просторах рунета компания ingate отзывы получает в большом числе и только положительные, благодаря применению инновационных методик.
На основе структуры
Размер задачи требует параллельных вычислений инфраструктуры, таких как кластер Linux системы под управлением процессора с функцией очередности, чтобы справиться с работой, например, Sun Grid Engine или PBS.
Средства обработки входного объема данных от больших библиотек соединений не требуется. Этого требуют формы соединения базы данных, которые могут быть запрошены параллельными кластерами, обеспечивая соединения параллельно с различными вычислительными узлами. Коммерческие СУБД могут быть слишком тяжелыми, а высокая скорость индексации двигателя, таких как Berkeley DB, может быть лучшим выбором. Кроме того, процесс не может быть эффективным для запуска одного сравнения в работу, потому что время разгона узлов кластера может легко превышать количество полезной работы. Чтобы обойти эту проблему, необходимо обработать партии соединений в каждом кластере и осуществить агрегирование результатов в некий файл журнала. Вторичный процесс, извлекающий кандидатов, может быть запущен после того, как весь эксперимент будет выполнен.