Расчёт совокупной стоимости владения вычислительным комплексом (The total cost of ownership (TCO))


Сегодня существует большое количество методов оценки стоимости владения вычислительными комплексами. Использование таких методов является очень важной задачей, которую необходимо решить ещё на этапе планирования.
Ни для кого не секрет, что применение IT технологий обходится весьма недёшево. Значительную долю в стоимости IT системы составляют затраты на её обслуживание, использование и поддержку.

Подсчет TCO призван помочь компаниям добиться максимальной отдачи от инвестиций и понять, какие средства придется тратить ежегодно на ту вычислительную технику, которая была куплена сегодня, по, вполне возможно, весьма привлекательной цене.
При расчете ТСО в сфере информационных технологий, различные алгоритмы расчета применяются для различных типов ресурсов, действий, или событий (запланированных и незапланированных) находящихся в полной или частичной собственности. Так же учитывается стоимость сопровождения всех имеющихся активов.
Совокупная стоимость владения (TCO) может быть представлена в виде двух составных частей:
·    Totalcost of operations (TCOp) – совокупная стоимость использования
·    Totalcost of assets (TCA) – совокупная стоимость прямых расходов
Таким образом, TCO = TCOp + TCA

tco1.jpg

 

Совокупная стоимость использования (TCOp)


Совокупная стоимость использования (TCOp) представляет собой сумму всех косвенных затрат сопровождающих использование вычислительного комплекса. В качестве примера можно привести процедуру покупки и использования автомобиля. Если после покупки автомобиль стоит и не используется, то совокупная стоимость владения окажется равной совокупной стоимости прямых расходов (количеству потраченных на его покупку денег). В случае, когда автомобиль используется по прямому назначению (на нём ездят), то его владельцу придется изредка  покупать бензин, тратить деньги на техническое обслуживание и ремонт. Эти затраты и будут включены в совокупную стоимость использования.
На первый взгляд, не существует необходимости в индивидуальном расчете TCOp и TCA, однако понимание разницы в затратах является очень важным при принятии или непринятии решения о приобретении и/или консолидации вычислительного комплекса.

При расчете TCOp все затраты можно разделить на несколько классов:

Peoplecosts (PCs) — Стоимость человеческих ресурсов:
·    Системные администраторы и операторы
·    Специалисты по поддержке пользователей
·    Администраторы баз данных (DBAs)
·    Специалисты по поддержке  приложений
·    Сетевые администраторы
·    Управляющий персонал
·    Консультанты
Стоимость окружения вычислительного комплекса
·    Энергопотребление
·    Охлаждение
·    Стоимость помещения
·    Противопожарная система
·    Прокладка сети (компьютерной и электрической)
·    Кондиционирование и фильтрация воздуха
·    Оборудование серверных и «чистых» комнат
Стоимость простоя
·    Запланированного
·    Незапланированного
Стоимость сопровождения
·    аппаратного и программного обеспечения после истечения гарантийного срока
·    операционной системы
·    приложений или баз данных
Другие затраты
·    обучение персонала
·    стоимость внедрения единой системы безопасности
·    стоимость хранения резервных копий
·    приобретение дополнительной документации, руководств
·    стоимость процедуры выбора программных продуктов, затрат (косвенных) на их приобретение.

Согласно оценке Gartner Group совокупная стоимость использования составляет в среднем 70% от совокупной стоимости владения вычислительным комплексом. Львиная же долю в TCOp – стоимость человеческих ресурсов.
Обычно, стоимость человеческих ресурсов (PCs) определяется по очень простой формуле – подсчитывается количество специалистов непосредственно занятых эксплуатацией вычислительного комплекса, и зная их среднемесячную заработную плату, путём арифметических операций высчитывается их общая стоимость за год.
Однако, при расчете PCs, зачастую требуется учитывать и возможные косвенные затраты. Так специалист по закупкам комплектующих и расходных материалов для вычислительного комплекса должен хотя бы приблизительно ориентироваться в тех технологиях, которые применяются сегодня на его предприятии, уметь видеть разницу между производителями комплектующих. А для всего этого, специалиста по закупкам необходимо правильно и своевременно обучить. В качестве другого примера можно привести ситуацию, когда один из  администраторов уходит в отпуск (получая отпускные). Его задачи ложатся на плечи помощника, которому придется оплачивать сверхурочные.

Скрытые затраты

При расчете PCs необходимо учитывать и возможные скрытые затраты. Сколько администраторов необходимо для управления 60-тью серверами? А сколько человек надо для поддержки 250-ти серверов? Есть ли здесь какие либо закономерности?
Для решения этой задачи необходимо знать следующее: при расчете  PCs все серверы можно разбить на несколько классов
·    непохожие (uncloned)
·    похожие (average cloned)
·    очень похожие (average supercloned)

Очень похожие серверы (average supercloned) – серверы имеющие идентичную аппаратную конфигурацию, версию операционной системы, установлены одинаковые приложения. Функциональное назначение таких серверов одинаково. Отличаться они могут только месторасположением. В качестве примера таких серверов можно представить сервера баз данных расположенных в региональных отделениях компании, или её дочерних структурах. В среднем, эффективность использования таких систем весьма велика, ибо, один администратор в состоянии обслуживать порядка 25 серверов.

Похожие серверы(average cloned) – не очень сильно отличаются друг от друга с точки зрения аппаратной конфигурации. Имею схожие версии операционных систем. Приложения установленные на таких серверах выполняют похожие задачи. Примером могут являться файл-серверы, Web, proxy, DNS серверы, почтовые серверы, серверы печати итд. Обычно, один администратор может поддерживать в работоспособном состоянии около 6-ти таких серверов.

Непохожие серверы(uncloned) – серверы со специфичной аппаратной и программной конфигурацией, выполняющие уникальные задачи. В качестве таких серверов могут выступать серверы приложений, серверы баз данных итп. В связи с уникальностью требований предъявляемых к этим серверам, они, как следствие требуют большего вмешательства в их работу, нежели average cloned и uncloned системы. Среднее количество непохожих серверов на одного администратора – от 3-х до 5-ти.

tco2.jpg

Знание этих особенностей может помочь при расчете конечной стоимости PCs в случае добавления сервера в существующую инфраструктуру.

 

Стоимость окружения

Стоимость помещения, электричества, освещения, охлаждения, прокладки кабеля увеличивают итоговую стоимость использования системы.
Чем больше площадь занимаемая серверами, тем больше приходится платить за аренду помещений (если же помещение находится в собственности, то можно говорить о
недополученной прибыли). При наличии в компании большого количества серверов, большее количество средств приходится тратить на прокладку компьютерной сети и сети электропитания. Для кондиционирования большого помещения (или большого количества маленьких помещений) требуется больше затрат на закупку, обслуживание и электропитание кондиционеров воздуха. Так же могут потребоваться большие средства на приобретение и обслуживание источников бесперебойного питания (UPS) для каждого из серверов.
В случае, если серверам необходимо сетевое взаимодействие, то и на закупку активного сетевого оборудования (коммутаторы, маршрутизаторы, мосты) могут быть затрачены значительные суммы.

К сожалению, все эти факторы подчас не учитываются при принятии решения о закупке вычислительной техники. А затраты, на всё вышеперечисленное, могут быть огромны.

Одним из способов минимизации расходов на окружение может являться консолидация, базирующаяся на физическом объединении серверов.

Стоимость простоя
Согласно отчету корпорации Tandem за 1995 год, порядка 60% компаний работают в режиме 7х24.
В случае выхода из строя программного или аппаратного обеспечения пострадавшие компании теряют:
·    330 000$ в час (в среднем по индустрии)
·    Максимальные потери: 130 000 $ в минуту (телефонные компании)
·    Лояльность и доверие заказчиков

И, как следствие:
·    50% компаний никогда больше не открываются вновь
·    90% компаний уходят из бизнеса в течении ближайших 2-х лет

Несмотря на кажущуюся неактуальность данных (особенно  в денежном выражении на сегодня) их важность со временем только растёт.

Простой вычислительного  комплекса всегда стоит денег.

Всё возможное время простоя вычислительного комплекса можно разбить на 2 класса:
1.    Запланированное время простоя
2.    Незапланированное время простоя

К запланированному времени простоя можно отнести:
·    Обновление аппаратного обеспечения
·    Обновление программного обеспечения
·    Процедура создания резервных копий системы
·    Тестирование
·    Разработка

Незапланированный простой вычислительного комплекса может возникнуть  по следующим причинам:
·    Ошибки администратора системы
·    Сбой в приложении
·    Выход из строя аппаратного обеспечения
·    Форс-мажорные обстоятельства

При расчете TCOp необходимо учитывать не только те плановые процедуры, при выполнении которых часть вычислительного комплекса может оказаться недоступной для пользователей, но и возможные затраты возникающие при выходе из строя вычислительной техники или наступлении форс-мажорных обстоятельств.

Так существует статистика по отказам среди различных платформ и операционных систем. Некоторорые из этих данные приведены в табл. 1

tco-table1.jpg

Многие известные производители вычислительной техники (такие как HP, IBM, Intel, Fujitsu) прикладывают огромные усилия для увеличения надежности своих систем. Некоторыми из таких решения являются:

FirstFailure Data Capture (FFDC)– технология позволяющая анализировать поведение системы в реальном времени, собирать статистику по возникающим ошибкам и  предсказывать их появление в дальнейшем. Некоторые компоненты сервера, например, жесткие диски и вентиляторы, подвержены износу. Их отказ может привести к потере данных.
·    Поэтому необходимо заблаговременно оповещать пользователей и администраторов о первых признаках приближающихся отказов, чтобы иметь возможность заменить компонент до того, как он выйдет из строя. Многие современные серверы снабжены дополнительными электронными компонентами, которые обеспечивают мониторинг аппаратных средств. Если обнаружены признаки приближающегося отказа, то немедленно извещается администратор и/или служба служба поддержки производителя сервера.
·    DynamicCPU deallocation и OnDemand CPU Sparring – в случае выхода из строя одного из центральных процессоров, он автоматически подменяется запасным (запасные процессоры находятся в специальном пуле называемом CPU OnDemand, и, как правило, стоимость такого пула незначительна). В большинстве случаев, такая замена происходит без перезагрузки ОС (Реализовано в серверах IBM e-Server pSeries).
·    Нот Plug– установка и замена компонент сервера без его выключения. (PCI адаптеры, блоки питания, вентиляторы, диски, батареи источников бесперебойного питания и прочее)
·    Automated System Reconfiguration & Restart (ASR&R) (Fujitsu). На стадии производства модули оперативной памяти и процессоры тестируются и проходят тщательный отбор, что гарантирует их высокое качество. Но что будет, если они всетаки выйдут из строя? Для таких ситуаций компания Fujitsu Siemens Computers разработала технологию автоматической реконфигурации и перезагрузки (Automated System Reconfiguration & Restart, ASR&R). Она реализована во всех серверах PRIMERGY. Если модуль памяти или процессор выходит из строя, сервер выполняет перезагрузку, исключает отказавшие компоненты из конфигурации и запускается на оставшихся. Таким образом, пользователи могут продолжить работу с сервером после небольшого перерыва, а отказавшие компоненты можно заменить позже. В результате сокращается время простоя.
·    Error Correction Code (ECC) Код исправления ошибок (Error Correction Code, ECC) – алгоритм, использующий  модули памяти с дополнительными ячейками. При записи слова данных на модуль оперативной памяти вычисляется и также записывается его контрольная сумма. Когда слово данных считывается из памяти, заново вычисляется его контрольная сумма и сравнивается с контрольной суммой, хранящейся в модуле. Если эти суммы совпадают, то слово данных передается в процессор, если нет, то оно может быть восстановлено с помощью хранящейся в модуле памяти контрольной суммы.
Memory Scrubbing — Memory Scrubbing – это технология, расширяющая возможности ECC. В серверах с большим количеством установленной памяти, в течение длительного периода не происходит обращения к некоторым областям памяти. В этих случаях технология ECC бессильна, так как она позволяет обнаружить и исправить ошибки в памяти только при чтении. Соответственно, когда нет обращений к какой-либо области памяти в течение долгого времени, могут произойти не только исправимые одиночные ошибки, но и накопиться множественные. Такая проблема решается с помощью “очистки памяти”. Все установленные в
·    сервере модули памяти циклически “просматриваются”, и все обнаруженные при этом одиночные ошибки сразу же исправляются, что обеспечивает надежную работу серверов с большими объемами памяти.
·    Chipkill (RAID для памяти)
Технология Chipkill также является развитием ECC. В связи с тем, что ECC позволяет исправить не более одного разряда в 64-разрядном слове, поэтому при отказе микросхемы памяти, в которой размещаются несколько разрядов слова (обычно 4), данные теряются.

tco3.jpg


Встроенный в системную плату контроллер Chipkill объединяет память в банки по 4 модуля  и распределяет каждое слово по всем 4 модулям банка. Если какая-либо микросхема выходит из строя, то теряется по одному разряду в каждом слове банка, и данные могут быть восстановлены с помощью контрольной суммы и алгоритма ECC. Chipkill не требует специальных модулей памяти, а позволяет использовать стандартные модули ECC.

·    «Горячее» резервирование памяти Если частота ошибок в определенном банке памяти вдруг резко возросла, то вероятность того, что однажды одновременно произойдут 2 ошибки в разных микросхемах, но в одном слове памяти, увеличивается. Такая двойная ошибка не будет исправлена вышеперечисленными средствами защиты памяти. Банк памяти объявляется дефектным, содержащиеся в нем данные копируются в дополнительный банк, находящийся в «горячем» резерве, а операционная система и приложения продолжают нормальную работу. Модули, объявленного дефектным банка могут быть заменены во время ближайшей плановой остановки сервера.

·    Резервирование (дублирование)
Отказ какого-либо компонента сервера часто приводит к выходу его из строя. Для предотвращения таких отказов, компоненты должны быть избыточными, или резервными. Как правило, в нормальном режиме все избыточные компоненты равномерно загружены, а в случае отказа одного из них нагрузка автоматически распределяется по оставшимся, и сервер продолжает бесперебойную работу.
·    Резервные вентиляторы
Вентиляторы охлаждают воздух внутри сервера. Так как они втягивают окружающий воздух, то вскоре их лопасти загрязняются, и частота вращения падает. Так же, частота вращения падает из-за износа подшипников электромоторов. Для предотвращения перегрева, вентиляторы должны резервироваться. В этом случае, даже если вентилятор полностью отказывает, сервер продолжает бесперебойную работу.
·    Резервные источники питания
Источники питания преобразуют напряжение и снабжают им все компоненты сервера. Сервер не может работать при отказавшем источнике питания, даже если используется внешний источник бесперебойного питания. Поэтому большинство современных серверов снабжается резервными источниками питания. Замена отказавшего модуля может быть выполнена позже.

Резервные сетевые контроллеры
Сетевые контроллеры являются точками контакта сервера с внешним миром. Если в сервере есть только один контроллер и он выходит из строя, то сервер становится недоступным, даже если другие компоненты работают нормально. Практически все сетевые контроллеры можно защитить от выхода из строя добавлением еще одного контроллера такого же типа. Благодаря интеллектуальному драйверу операционной системы два контроллера могут функционировать как одно целое. Если один из контроллеров выходит из строя, второй автоматически берет на себя его функции. Администратор может в любое время заменить отказавший контроллер и тем самым восстановить резервирование.
·    Резервные жесткие диски (RAID)
Технология RAID защищает данные при отказах жестких дисков, обеспечивая доступ к данным и позволяя затем заменить отказавший диск и полностью восстановить резервирование. RAID требует наличия в сервере дополнительных жестких дисков. Имеется несколько алгоритмов (уровней) RAID, и в соответствии с ними специализированные RAID-контроллеры или драйверы операционной системы поддерживают “зеркало” (точную копию) одного или нескольких дисков или вычисляют и записывают контрольную сумму на один или на все диски. С помощью “зеркала” или контрольной суммы можно восстановить “на лету” данные отказавшего диска. Если сервер оснащен дисками с “горячей” заменой, то замену можно произвести не выключая сервер.
·    Зеркалирование памяти
Зеркалирование памяти применяется для того, чтобы исправлять ошибки любых типов, в том числе полный отказ банка памяти. Функционирование этого механизма обеспечивает специальный контроллер памяти. Все данные записываются сразу в два банка, а считываются из любого доступного.
·    «Горячая» замена. (Замена без остановки сервера)
Резервные компоненты важны для обеспечения высокой степени готовности. Для того чтобы обеспечить замену компонентов без выключения сервера и таким образом обеспечить круглосуточное функционирование, применяются компоненты с “горячей” заменой.
·    Вентиляторы с “горячей” заменой
Почти во всех современных серверах, вентиляторы не только резервируются, но и могут заменяться в “горячем” режиме. Механические и электрические компоненты спроектированы для обеспечения надёжной замены за считанные секунды.
·    Источники питания с “горячей” заменой
Резервные источники питания практически любого современного сервера могут быть заменены в “горячем” режиме. К ним обеспечивается удобный доступ с передней или задней стороны сервера. Как правило, нужно только отсоединить силовой кабель, открыть защелку и вытащить модуль.
·    Жесткие диски с “горячей” заменой
Если в сервере используется RAID, то доступ к данным обеспечивается и в случае отказа жесткого диска. Однако этот диск все же нужно заменить как можно быстрее. Для того чтобы можно было заменять жесткие диски в работающем сервере, они должны быть смонтированы в модулях “горячей” замены, обеспечивающих доступ снаружи. Многие современные серверы оснащены такими выдвижными жесткими дисками с “горячей” заменой. Если жесткий диск выходит из строя, то на модуле загорается индикатор. Этот диск можно просто и быстро заменить. Интеллектуальная система управления заменой дисков распознает новый диск и снова включает его в состав конфигурации RAID. RAID-контроллер позволяет проводить эту процедуру автоматически. На новый диск записываются данные, которые были на отказавшем, и резервирование восстанавливается.
·    PCI-Х с “горячей” заменой
Для того чтобы лучше защитить данные во время работы, некоторые модели современных серверов оснащены разъемами PCI-Х с “горячей” заменой. Технология “горячей” замены PCI-Х позволяет заменять контроллеры без выключения сервера. Эта возможность используется, например, контроллерами SCSI, FibreChannel и сетевыми контроллерами. Если, например, вышел из строя контроллер SCSI, обеспечивающий подключение к внешней системе хранения данных, то его можно заменить не выключая сервера: открывается корпус и контроллер отключается с помощью специального программного обеспечения. В результате разъем PCI-Х обесточивается. Индикатор подтверждает это, и отказавший контроллер можно извлечь. Когда исправный контроллер установлен в разъем, этот разъем вновь подключается к шине, и операционная система может работать с контроллером.
·    «Горячая» замена памяти
В некоторых системах c поддержкой зеркалирования памяти, модули отказавшего банка памяти могут быть заменены в горячем режиме.
·    Внешнее резервирование
Если требуется большая степень готовности, чем та, которая может быть достигнута с помощью одного сервера, необходимо применять внешнее резервирование. Такие компании как Fujitsu
Siemens Computers, IBM и некоторые другие предлагаеют для этого несколько стандартных решений. Такие решения позволяют обеспечить практически все требования заказчика, от резервирования каналов передачи данных к внешним системам хранения до полного резервирования систем.
·    Резервирование каналов передачи данных с помощью механизма MultiPath
Решение MultiPath основано на технологии Fibre Channel. Данные, которые должны быть переданы на внешнюю систему хранения, распределяются по нескольким имеющимся каналам Fibre Channel с помощью специального драйвера. Если один из каналов выходит из строя, то MultiPath автоматически перераспределяет нагрузку на оставшиеся. Такая конфигурация не только обеспечивает отказоустойчивую связь между сервером и системой хранения, но и увеличивает пропускную способность, так как каналы могут использоваться параллельно.
·    Резервирование серверов в кластерах
Повысить степень готовности приложений и данных, с которыми они работают, можно с помощью кластеров. Кластер состоит минимум из двух серверов (узлов кластера), на каждом из которых могут выполняться приложения, и, как правило, внешней системы хранения, к которой могут получить доступ оба сервера. Пользователи работают с приложениями, обращаясь к кластеру как к “логическому серверу” по общему (виртуальному) имени. Если приложение не может продолжать работу на одном из узлов (в том числе из-за отказа сервера), оно может быть автоматически запущено на другом, который получает доступ к внешней системе хранения с данными этого приложения.
·    MultiPath в кластере
Если применить механизмы MultiPath в кластере, то практически всё в такой конфигурации будет зарезервировано. Два узла (резервные серверы) обращаются по резервным каналам Fibre Channel к зеркалированным внешним системам хранения. Технология Fibre Channel позволяет разнести эти компоненты по различным зданиям. Эта конфигурация обеспечивает полную катастрофоустойчивость, так как приложения продолжат работу, даже если одно из зданий будет разрушено.

Так же весьма интересным, с точки зрения повышения доступности системы, представляется проект «автономных вычислений» компании IBM, в основу которого положена идея самодиагностики и самовосстановления вычислительных систем.

Totalcost of assets (TCA) – совокупная стоимость прямых расходов

В то время как TCOp фокусируется на стоимости повседневного использования системы, TCA имеет дело с первоначальными и дальнейшими вложениями в вычислительный комплекс. Вернёмся к аналогии с автомобилем. Казалось бы, TCA  это те деньги, которые покупатель платит в автосалоне за сам автомобиль. Но владелец транспортного средства, со временем, будучи
уверенным что у него хороший слух устанавливает в свой автомобиль новую аудио систему. Или решает прорубить в крыше своего авто люк, для пущего комфорта. Или же семья автолюбителя разрастается, и он решает обменять свой автомобиль на больший по системе trade-in.
Все эти и подобные факторы являются составной частью TCA. Более того, совокупная стоимость прямых расходов может со временем очень сильно вырасти.

    Затраты на аппаратные средства.
Определение точных инвестиции в актив аппаратных средств может казаться достаточно простым делом. Надо только инвентаризировать конфигурацию всех серверов, посчитать суммарные затраты на покупку, фактор амортизации, и подвести итог затрат.
Однако всё не так просто. Дело в том, что точная конфигурация системы и затраты на её использование подчас не зарегистрированы надлежащим образом. В течении  долгого времени жизни системы, часть её компонент, вполне возможно, была модернизирована (заменён на более мощный процессор, добавлена память, контроллеры или диски.

На самом деле всё гораздо хуже… Например, выполнение нового приложения, наряду с его набором необходимых серверных платформ, может диктовать потребность в дополнительном аппаратном обеспечении (внешние дисковые массивы, ленты или оптические библиотеки, источники бесперебойного питания (UPS), и так далее). При всём при этом, процесс приобретения аппаратных средств меняется день ото дня. Это могут быть прямые закупки, аренда, лизинг. И всё это оборудование к тому же обесценивается. И тот зоопарк оборудования, что был куплен год назад за 500 000 $, сегодня может стоить в два раза меньше.
Все эти факторы имеют тенденцию, с течением времени, усложнять задачу определения точных инвестиций в аппаратные средства, которые в свою очередь воздействуют на общую стоимость актива.

Эффективность использования центрального процессора
Как правило, при приобретении серверов, такие параметры как производительность центрального процессора, количество оперативной памяти и, отчасти, объем дисковой подсистемы определяются исходя из той максимальной нагрузки, которая должна быть выдержана сервером без ущерба для сервисов, которые он предоставляет (время реакции системы на запросы пользователей не должно деградировать до неприемлемых величин, выросшая нагрузка не должна приводить к нештатному и преждевременному завершению задач). Всё это конечно замечательно, но вот только пиковые нагрузки на сервер случаются не так часто. И как показывают исследования таких компаний как IBM, Gartner Group, DH Brown и многих других, большинство UNIX серверов, во время стандартного восьми часового дня, оказываются нагружены в среднем на 30%. Плачевнее дело обстоит x86/Windows серверами. Средняя полезная нагрузка таких серверов составляет не более 5–10% (т.е. купив сервер за 100 000$ вы используете его возможности максимум на 10 000$). Рачительные хозяева так не поступают. Конечно же, эти средние числа изменяются с типом рабочей нагрузки или функции, но предоставленные проценты являются представительными для соответствующих парадигм вычислений.

Давайте посмотрим на другой край серверных технологий. Мэинфреймы. От этого слова началась ностальгия? Или вспомнились динозавры из фильма про вымерших животных? Как бы не так. Мэинфреймы мало того что живы, так они еще и развиваются. Впрочем разговор не об этом. Средняя полезная нагрузка в мэинфреймах достигает 90% и более. И всё это, в значительной степени, из-за их врожденной способности к логическому разделению рабочих нагрузок, и динамического распределения ресурсов  исходя из установленных для задач приоритетов. Какое отношение всё это имеет к стоимости оборудования и TCO? Самое, что ни на есть, непосредственное. Давайте представим себе сервер. Обычный сервер. В один прекрасный момент оказывается, что при пиковых нагрузках на него, он со своей работой не справляется. Не хватает производительности центрального процессора или недостаёт памяти. Как в этом случае обычно поступают? Правильно. Докупают память и меняют CPU на более мощный. И все эти новые ресурсы будут полностью использоваться, при большой удаче, несколько дней в месяц (составление отчетов, вал платежей в конце месяца и прочее). Не очень удачное вложение средств. Да и TCO при этом растёт как на дрожжах. Так что же, не производить модификацию оборудования вообще, или наплевать на расходы? Ни то ни другое.

Необходим аналог мэинфрейма. Нужен сервер общего назначения обладающий способностями мэинфрейма по выполнению многих задач в их собственных полностью изолированных средах, и способный, к тому же, динамически перераспределять ресурсы (процессорное время, память, элементы подсистемы ввода-вывода) между этими средами. А ещё он должен быть надежным. Желательно как мэинфрейм. К сожалению, всеми этими возможностями, на сегодня, обладают в основном системы построенные на базе RISC архитектуры. Да и то, сервер не всякого производителя обладает совокупностью качеств способных вывести его на уровень надежности и защищенности мэинфрейма. Весьма неплохие возможности у систем производства компаний  Fujitsu Siemens, HP, IBM (в алфавитном порядке).

Одной из ключевых возможностей, использование которой позволяет вывести уровень обслуживания клиентов на новый уровень, является технология деления сервера на разделы, и технологии виртуализации ресурсов.


·    Создание физических и логических разделов. Деление системы на микроразделы.
Возможность разбиения сервера на физические разделы, на логические разделы либо микроразделы позволяет внутри одного высокопроизводительного многопроцессорного сервера создать несколько независимых друг от друга серверов, каждый из которых будет полностью независим от всех других подобных ему серверов внутри этой многопроцессорной системы. Подходы различных производителей, используемые при создании физических разделов, логических разделов и микроразделов, отличаются друг от друга достаточно сильно. Все эти особенности будут рассмотрены позднее.
·    Виртуальные локальные сети
Одной из функций низкоуровневого программного обеспечения виртуализации, является предоставление виртуальных Ethernet адаптеров операционной системе. При использовании виртуальных Ethernet адаптеров и виртуальных локальных сетей, разделы (виртуальные машины)
могут общаться друг с другом без использования физических адаптеров. Тем самым уменьшаются потребности в оригинальных аппаратных ресурсах.
·    Виртуализация подсистемы ввода-вывода
Подсистема виртуального ввода – вывода позволяет разделить один физический адаптер ввода – вывода между несколькими физическими, логическими разделами, виртуальными машинами либо микроразделами внутри одного сервера. Таким образом, данные, располагаемые на одном и том же жестком диске, на одном и том же устройстве, как правило, могут быть доступны сразу нескольким операционным системам, работающим в разделах данного сервера.

Все эти, и многие другие возможности современных высокопроизводительных серверов позволяют снизить затраты на ТСА и как следствие на TCO.

Затраты на программное обеспечение
Реальная стоимость программного обеспечения является весьма коварной величиной. Не стоит считать, что все затраты на программное обеспечение ограничиваются той суммой, которая будет затрачена в момент покупки. Затраты на ПО можно разделить на две части: первоначальная стоимость лицензий на ПО, и стоимость поддержки (сюда можно включить как и процедуру получения обновлений ПО, так и механизм продления срока действия лицензий).
Важно упомянуть ещё об одной проблеме связанной с ПО. Это shelfware- лицензии, которые были куплены, но по различным причинам, эти лицензии не использовались и не будут использоваться в ближайшем будущем, и поэтому не нужны в настоящее время. Недавние исследования установили, что целых 39 процентов продуктов становятся shelfware.

Есть несколько ключевых вопросов связанных с покупкой и использованием ПО на которые необходимо найти ответ:
·    Достаточен, недостаточен или избыточен имеющийся уровень поддержки?
·    Есть ли у производителя ПО и ОС различные уровни поддержки (платиновый, золотой, серебряный)?
·    Какие действия по сопровождению ПО выполняются специалистами компании производителя ПО, а какие возложены на плечи собственного персонала.
·    Достаточен ли уровень подготовки собственного персонала для нормального сопровождения программных продуктов.
·    Требуется ли дополнительное обучение собственного персонала, необходимое для сопровождения ПО.
·    Нужно ли нанимать новых специалистов (а если да, то в каком количестве и на какую ставку) для сопровождения программных продуктов.

При лицензировании ПО важно понять механизм лицензирования. Покупаются ли лицензии на определенный период времени? Какова стоимость продления лицензий? Лицензия покупается «на сервер» или исходя из количества процессоров в нем? Последний вопрос, некоторое время назад, стал особенно актуален. Так UNIX серверы семейства pSeries компании IBM оснащенные 16 процессорами Power5 показывают производительность сопоставимую с 72-х процессорными машинами некоторых других производителей. Разница в ценах на приобретаемые лицензии очевидна.

Все вышеперечисленные факторы очень сильно влияют на совокупную стоимость прямых расходов (TCA), и должны обязательно учитываться при выборе программного и аппаратного обеспечения.

Стоимость сопровождения

Стоимость сопровождения системы складывается из следующих частей:
·    Инсталляция
·    Миграция
·    Портирование
·    Тестирование
·    Затраты на обучение

Понимание того, в какую сумму выльется инсталляция и сопровождение существующей системы, инсталляция новой, или миграция приложений на другой сервер, в значительной степени позволяет оценить возможности и сроки возврата  инвестиций (ROI) в IT инфраструктуру предприятия.
Обычно, стоимость инсталляции и настройки программного и аппаратного обеспечения не включена в их первоначальную стоимость. А процедуры эти могут быть достаточно сложны и продолжительны. Настройка системы исходя из заранее разработанных спецификаций может потребовать серьёзных финансовых затрат. Эти затраты могут состоять из:
·    Установка ОС
·    Создание файловых систем, логических томов
·    Создание учетных записей пользователей
·    Настройка системы безопасности сервера
·    Настройка и тестирование периферийных устройств (например диски и ленты)
·    Конфигурирование сетевых подключений
·    Подключение и настройка внешних дисковых массивов
·    Разработка плана нового или модификация старого плана создания резервных копий
·    Тестовая эксплуатация
·    Введение в промышленную эксплуатацию

Все эти, и многие другие действия, потребуют больших дополнительных трат. При этом, траты не только материальные, но и на первый взгляд весьма эфемерные – время, людские ресурсы… А всё это, в конечном счёте – деньги.

Суммарные затраты на прямые расходы (TCA)


Итак, основными факторами влияющими на TCA являются:
Стоимость аппаратного обеспечения
Первоначальная стоимость аппаратного обеспечения (полная стоимость, стоимость аренды или лизинга)
Стоимость системы хранения данных, включая стоимость внешних дисковых массивов и SAN (Storage Area Network)
Стоимость сетевого аппаратного обеспечения (маршрутизаторы, DNS, proxy и т.п.)
Стоимость ленточных библиотек или накопителей используемы для создания резервных копий данных
Стоимость системы резервирования/восстановления (запасные серверы, UPS и пр.)
Обесценивание, со временем, аппаратных средств. Возможность их обмены по системе trade-in
Потенциальная возможность замены всего вышеперечисленного оборудования, на более производительной при возникновении такой необходимости.
Стоимость программного обеспечения
Первоначальная стоимость лицензий на ОС
Стоимость лицензий на промежуточное программное обеспечение и сервера баз данных
Цена лицензий на серверы приложений
Стоимость будущих апдейтов всех вышеперечисленных видов программных продуктов
Тип сопровождения программных продуктов со стороны фирмы производителя (телефон, Internet, непосредственный выезд к заказчику)
Стоимость сопровождения системы
Инсталляция
Миграция
Портирование
Тестирование
Затраты на обучение

Продолжение следует….

При перепечатке ссылка на источник — обязательна.

Автор: Кирилл Терешенко

Оставьте комментарий