Отрежьте облачные отходы в масштабе: Akamai экономит 70%, используя AI -Agents, организованные Kubernetes


Присоединяйтесь к событию, надежно со стороны корпоративных лидеров в течение почти двух десятилетий. VB Transform собирает людей, строящих настоящую корпоративную стратегию ИИ. Узнать больше


Особенно в эту зажатую эпоху генеративного ИИ затраты на облачные средства всегда высоки. Но это не только потому, что предприятия используют более вычислительно – они не используют его эффективно. На самом деле, только в этом году предприятия ждут 44,5 миллиарда долларов на ненужные облачные расходы.

Это усиленная проблема для Akamai Technologies: компания имеет большую и сложную облачную инфраструктуру на нескольких облаках, не говоря уже о многих строгих требованиях безопасности.

К Решите это, поставщик кибербезопасности и контента -Delivery обратился к платформе Kubernetes -Auto Cast AI, чьи агенты искусственного интеллекта помогают оптимизировать стоимость, безопасность и быстро через облачные среды.

Наконец, платформа помогла Akamai сократить от 40% до 70% затрат на облачные, в зависимости от рабочей нагрузки.

«Нам нужен был постоянный способ оптимизировать нашу инфраструктуру и сократить наши облачные затраты, не жертвуя действиями», – сказал Dekl Shavit, старший директор Cloud Engineering в Akamai, Venturebeat. «Мы те, кто обрабатывает события безопасности. Задержка не является выбором. Если мы не можем ответить на атаку безопасности в режиме реального времени, мы потерпели неудачу».

Специализированные агенты, которые контролируют, анализируют и действуют

Kubernetes управляет инфраструктурой, которая управляет приложениями, содействуя развертыванию, масштабированию и управлению ими, особенно в облачных аттестатах и ​​сервисных архитектурах Micros.

CAST AI, интегрированный в экосистему Kubernetes, чтобы помочь клиентам масштабировать свои кластеры и рабочие нагрузки, выбирать лучшую инфраструктуру и управлять компьютерными жизненными циклами, объяснил основатель и генеральный директор Лоран Гил. Его основной платформой является автоматизация производительности приложений (APA), которая работает через команду специальных агентов, которые постоянно контролируют, анализируют и действуют для повышения производительности, безопасности, эффективности и затрат. Компании предоставляют только тот компьютер, который ему нужен, от AWS, Microsoft, Google или других.

APA оснащена несколькими моделями машинного обучения (ML) с укреплением обучения (RL) на основе исторических данных и изученных моделей, улучшенных стеком наблюдений и эвристики. Он в сочетании с инструментами инфраструктуры как кода (IAC) на нескольких облаках, что делает его полностью автоматизированной платформой.

Гил объяснил, что APA была построена в соответствии с напряжением, что наблюдение является лишь отправной точкой; Как он назвал это, наблюдаемость – это «фундамент, а не цель». Cast AI также поддерживает все большее принятие, поэтому клиентам не нужно вытаскивать и заменять; Они могут интегрироваться в существующие инструменты и рабочие процессы. Кроме того, ничто никогда не оставляет инфраструктуры клиента; Весь анализ и действия происходят в рамках их выделенных ползучков Kubernetes, обеспечивая большую безопасность и контроль.

Гил также подчеркнул важность человеческого центра. «Автоматизация завершает принятие человеческих решений»,-сказал он, а APA поддерживает рабочие процессы в среднем человека.

Уникальные проблемы Акамай

Шавит объяснил, что крупные и сложные власти облачной инфраструктуры Akamai Powers Content (CDN) и услуги кибербезопасности, предоставляемые «некоторым из наиболее требовательных клиентов и промышленности в мире», соответствующих строгим соглашениям (SLA) и требованиям соответствия.

Он отметил, что для некоторых услуг, которые они потребляют, они, вероятно, являются крупнейшими клиентами для своего продавца, добавив, что они сделали «тонны основного инженера и переподключения» со своим гиперскладером в соответствии с их потребностями.

Кроме того, Akamai обслуживает клиентов из различных размеров и отраслей, в том числе крупные финансовые учреждения и компании по кредитным картам. Услуги компании напрямую связаны с постом его клиентов.

В конечном счете, Акамаи нужно было сбалансировать всю эту сложность с стоимостью. Шавит отметил, что реальные атаки на жизнь на клиентов могут эксплуатировать емкость в 100 раз или 1000x на определенных компонентах его инфраструктуры. Но «подниматься на нашу облачную вместимость в 1000x заранее просто невозможна финансово», – сказал он.

Его команда рассматривала оптимизацию кодовой стороны, но неотъемлемая сложность их бизнес -модели требовала сосредоточения внимания на самой основной инфраструктуре.

Автоматически оптимизация всей инфраструктуры Kubernetes

Акамай действительно нуждалась в kubernetes -аутоматической платформе, которая могла бы оптимизировать затраты на работу всей своей основной инфраструктуры в режиме реального времени на нескольких облаках, объяснил Шавит и масштабирует приложения на основе постоянно меняющегося спроса. Но все это должно было быть сделано без жертвоприношения применения.

Перед тем, как провести актерский состав, Шавит отметил, что DevOps Акамаи вручную настроили все рабочие нагрузки Kubernetes всего несколько раз в месяц. Учитывая масштаб и сложность его инфраструктуры, это было сложно и дорого. Анализируя только рабочие нагрузки спорадически, они явно упустили любой потенциал оптимизации реальной времени.

«Теперь сотни актеров делают одну и ту же настройку, если они не делают это каждую секунду каждого дня», – сказал Шавит.

Основной APA представляет Akamai, это автомобиль Car, Deep Cubernetes с упаковкой упаковки (минимизация количества используемых ведер), автоматический выбор самых дорогих компьютерных органов, права на рабочую нагрузку, автоматизация пятен на протяжении всего жизненного цикла и возможности аналитики затрат.

«Мы поняли дорогостоящий анализ в течение двух минут в интеграции, чего мы никогда не видели раньше», – сказал Шавит. «После того, как активные агенты были развернуты, оптимизация автоматически включена, и сбережения начали входить».

Спотовые власти – где предприятия могут получить доступ к неиспользованной облачной способности по дисконтированным ценам – очевидно, имел деловой смысл, но они оказались сложными из -за сложных рабочих нагрузок Акамай, особенно Apache Spark, отметил Шавит. Это означало, что они тоже нуждались в LABOR LOADS или на них больше рук, что оказалось финансово восстановленным.

С актерским искусственным интеллектом они смогли использовать точечные экземпляры на Spark с «нулевыми инвестициями» от инженерной группы или операций. Значение случаев окрашивания была «чрезмерной»; Им просто нужно было найти подходящий инструмент, чтобы иметь возможность их использовать. Это была одна из причин, по которой они продвинулись с актером, заметил Шавит.

При сохранении 2 раза или 3 раза в их облачном счете великолепно, Шавит отметил, что автоматизация без ручного вмешательства «бесполезна». Это привело к «массивной» экономии времени.

Прежде чем внедрить AST AI, его команда «постоянно перемещалась вокруг голов и переключений», чтобы гарантировать, что их производственные среды и клиенты будут равны услуге, необходимым для инвестирования.

«Самым большим преимуществом был тот факт, что нам больше не нужно управлять нашей инфраструктурой», – сказал Шавит. «Команда актеров сейчас делает это для нас. Это выпустило нашу команду, чтобы сосредоточиться на том, что является наиболее важным: для наших клиентов быстрее выпускать аспекты».

Примечание редактора: в этом месяце Transformation VB, Google Cloud CTO Will Grannis и Highmark Health SVP и главный аналитик Ричард Кларк обсудят новый стек ИИ в здравоохранении и реальные проблемы развертывания многомодельных систем ИИ в сложной, регулируемой среде. Зарегистрируйтесь сегодня.


Source link
Scroll to Top