Поддержка

В ближайшие десятилетия могут исчезнуть из обихода известные нынешним специалистам персональные компьютеры, серверы, локальные сети и др., так как вычислительные и информационные услуги превратятся в такие же коммунальные удобства, как электричество и водопровод сегодня, а отдельные компьютеры с многоядерными процессорами растворятся в глобальной информационной инфраструктуре Grid. Сначала Grid технологии предназначались для решения сложных научных и инженерных задач, которые невозможно решить в разумные сроки на отдельных вычислительных установках. Однако теперь область применения технологий Grid не ограничивается только этими типами задач. С развитием Grid проникает в промышленность и бизнес, претендуя на роль универсальной инфраструктуры для обработки данных, в которой функционирует множество служб (Grid Services), которые не только позволяют решать конкретные прикладные задачи, но и предлагают услуги по поиску необходимых ресурсов, сбора информации о состоянии ресурсов, хранения и доставки данных.

Информатизация сегодня вступила в четвертый этап своего развития. Первый был связан с появлением больших компьютеров (мейнфреймов), второй — с созданием персональных компьютеров, третий — с появлением Интернета, объединившего пользователей в единое информационное пространство путем совместимого доступа к информации. С началом XXI века отмечается переход на новые Grid-технологии, когда на смену уже известному Интернету с его web-услугами идет всемирная Grid-сеть, как средство совместного использования вычислительных мощностей и хранилищ данных. Grid позволяет выйти за рамки простого обмена данными между компьютерами, и превратить их глобальную сеть в своего рода гигантский виртуальный компьютер, доступный в режиме удаленного доступа из любой точки, независимо от местоположения пользователя.

Следует признать, что идеи Grid пока не очень распространены. Но не так давно (каких-то восемь-десять лет назад) Интернет и Web также были известны только узкому кругу профессионалов. Однако в 2006 году число пользователей Интернета превысило миллиард. Пожалуй, при всем желании трудно найти человека, который хотя бы не слышал этих слов. Есть основание считать, что со временем и Grid приобретет не меньшую популярность. Его нынешнее состояние можно сравнить с Интернетом «образца» 1997 года и признать, что потенциал и темпы роста Grid отнюдь не ниже, чем были тогда.

Если переводить дословно, Grid означает «решетка». Согласитесь, ассоциации, связанные в нашем языке с этим словом, совсем не соответствуют смыслу свободной кооперации компьютеров для высокопроизводительных вычислений, заложенному в технологиях Grid. Ближе всего по смыслу, пожалуй, power grid — сеть электропитания, распределенный ресурс общего пользования, когда каждый может легко подключиться через розетку и использовать столько электроэнергии, сколько ему нужно. Аналогично пользователи с помощью Grid получают возможность прямого подключения к удаленной вычислительной сети, не интересуясь, откуда берутся требуемые для работы вычислительные ресурсы и данные, какие для этого используются линии передачи, пароли или протоколы и т.п. При этом аналогом инфраструктуры электрических сетей (линий электропередачи, подстанций, трансформаторов и др.) выступает Grid — промежуточный программный слой, или MiddleWare.

Что дает Grid ученым

Формально авторами концепции Grid считаются Ян Фостер из Арагонской национальной лаборатории Чикагского университета и Карл Кессельман из Института информатики Университета Южной Калифорнии. Именно они в 1998 году впервые предложили термин Grid-компьютинг (Grid computing) для обозначения универсальной программно-аппаратной инфраструктуры, объединяющей компьютеры и суперкомпьютеры в территориально-распределенную информационно-вычислительную систему. По их определению, ставшему уже классическим, «Grid — согласованная, открытая и стандартизованная среда, которая обеспечивает гибкое, безопасное, скоординированное разделение ресурсов в рамках виртуальной организации». Обычно слово «компьютинг» или «метаком компьютинг» употребляется там, где на основе отдельных компьютеров строятся системы более высокого уровня. К этому слову вполне можно привыкнуть (привыкли же автомобилисты к слову «тюнинг», экологи — к «мониторингу», спортсмены — к «дайвингу», а все вместе — к «шопингу»). Кстати, и само слово «компьютер» тоже входило в наш язык нелегко, заменив словосочетание «электронная вычислительная машина» которое трудно переводить. Так и слово «компьютинг», можно надеяться, заменит эквивалентную ему фразу «услуга на выполнение вычислений или обработки данных на компьютере».

Grid-компьютинг — новый класс инфраструктур, в которых из удаленных ресурсов строится безопасный и масштабируемый вычислительный механизм в составе компьютеров, от настольных и до суперкомпьютеров, программных пакетов и устройств ввода /вывода. В основе Grid лежат программные технологии, использующие новые стандарты и протоколы совместно с известными сетевыми и интернет-протоколами. Время покажет, стоит ли записывать название Grid кириллицей.
Идея более эффективного использования вычислительных мощностей путем соединения множества компьютеров в единую структуру возникла в научном сообществе сравнительно давно — в эпоху больших компьютеров. Уже в 80-е годы ученые (прежде всего физики-ядерщики) для решения сложных математических задач пытались объединять ресурсы отдельных рабочих станций и использовать свободные ресурсы центральных процессоров для сокращения времени обработки своих данных. Обычный путь развития вычислительных сетей в организации примерно такой.

Вначале небольшая группа пользователей, занятых научными или инженерными расчетами, решает объединить свои ресурсы на основе простых правил и договоренностей. Это можно легко сделать на основе программного обеспечения, которое свободно распространяется. Успешный опыт приживается, и вскоре другие группы пользователей идут тем же путем. Таких групп становится больше, и у них возникает вполне законное желание обмениваться ресурсами, заполняя простаивающие вычислительные мощности. Здесь уже простыми договоренностями обойтись трудно, необходимо внедрять какие-то технические средства учета и «взаиморасчетов».

Технология управления распределенными ресурсами является одной из важнейших задач. Она направлена, прежде всего, на обеспечение управляемости информационной инфраструктуры в условиях возрастающей нагрузки и увеличения числа компонентов сети. Принципы работы системы управления заданиями хорошо известны: это очередь, поиск свободных ресурсов, диспетчеризация, политики и приоритеты. Сетевая система управления заданиями была реализована достаточно давно, однако применение технологий Grid позволяет строить систему управления распределенными вычислительными ресурсами. В такой ситуации пользователю уже не важно, на каком конкретном узле сети выполняется его задача, он просто потребляет определенное количество виртуальной процессорной мощности, имеющейся в сети.

Есть несколько причин, побуждающих ученых использовать Grid-технологии.

Во-первых, часто необходимо обработать огромное количество данных, хранящихся в разных организациях (возможно, расположенных в разных частях мира). Примером может служить задача обработки снимков Земли, полученных со спутников.

Во-вторых, необходимо при исследованиях выполнить огромное количество вычислений. Например, при моделировании влияния тысяч молекул (потенциальных лекарственных препаратов) на белки при поиске лекарства для определенных болезней.

В-третьих, научная команда, члены которой работают в разных уголках земного шара, хочет совместно использовать большие массивы данных, быстро и интерактивно осуществлять их комплексный анализ, визуализировать и обсуждать результаты в онлайновом режиме.

Разумеется, решаемые при этом задачи имеют большое значение для различных фундаментальных научных исследований и проектных работ. К таким задачам можно отнести изучение эволюции протопланетного вещества, планет и Земли; общее метеорологическое прогнозирование и прогноз различных стихийных бедствий (цунами, землетрясений, извержений вулканов); моделирование и анализ экспериментов в ядерной физике; исследования в области нанотехнологии, проектирование аэрокосмических аппаратов и автомобилей, расшифровка ДНК и идентификация протеинов и т. д. Наверное, скоро проще будет назвать научную дисциплину, где суперкомпьютеры и распределенные вычисления еще не применяются. Среди ключевых факторов, содействующих внедрению Grid, не только возможность гибкой адаптации инфраструктуры к новым требованиям, но и повышение эффективности использования имеющихся вычислительных и человеческих ресурсов, поскольку при совместной работе над разными проектами специалисты применяют одну и ту же инфраструктуру.