Logo

S3 Vectors от AWS: Новая Эра Векторных Баз Данных и ИИ

9 октября 2025 г. Amazon Web Services представила S3 Vectors, новое решение для хранения и поиска векторов. Это расширение S3 сокращает затраты до 90%, интегрируется с Amazon Bedrock и меняет ландшафт ИИ-приложений.

16 жовтня 2025 р., 19:45
4 мин чтения

Amazon S3 Vectors: вызов привычным базам данных и новая эра в работе с ИИ

9 октября 2025 г. - Amazon Web Services (AWS) представляет S3 Vectors, расширяя возможности своего флагманского объектного хранилища S3. Это нововведение, следующее за S3 Tables, позволяет S3 не только хранить, но и индексировать векторные представления данных, а также выполнять векторный поиск. Появление S3 Vectors, впервые анонсированное 15 июля 2025 года, меняет привычное восприятие векторных баз данных, предлагая новый подход к их использованию, особенно для задач ИИ.

Логичный шаг в развитии: от Milvus до S3 Vectors

Векторный поиск, ставший критически важным для современных ИИ-приложений, традиционно отличался высокими требованиями к вычислительным ресурсам и, как следствие, дороговизной. Специализированные векторные базы данных, такие как Milvus (на которой базируется Zilliz), постоянно ищут баланс между производительностью и стоимостью. Изначально Milvus хранила индексы в оперативной памяти для максимальной скорости и точности, но экономические соображения привели к переходу на дисковое хранение.

«Появление такого серьёзного конкурента [как S3 Vectors] - это не конец для игроков поменьше, а важный этап в развитии всей сферы», - отметил руководитель департамента инжиниринга векторной БД Zilliz. Подобные решения, использующие недорогие объектные хранилища, представляют собой естественное развитие технологии в условиях экспоненциального роста объёмов данных. Молодые конкуренты, такие как TurboPuffer, уже используют S3 для снижения затрат, хотя и ценой некоторого падения скорости обработки запросов. В этом контексте решение AWS о внедрении S3 Vectors выглядит как подтверждение текущих трендов в развитии векторных баз данных.

Особенности S3 Vectors: экономия против производительности

S3 Vectors, по заявлению AWS, обещает сократить затраты на загрузку, хранение и запрос векторов на 90 %, предлагая при этом субисекундную производительность запросов для «AI-ready» данных. Служба интегрирована с Amazon Bedrock Knowledge Bases, Amazon OpenSearch Service и Amazon SageMaker Unified Studio, что упрощает создание приложений на основе Retrieval-Augmented Generation (RAG).

Ключевые характеристики S3 Vectors, анонсированные AWS 15 июля 2025 года, включают:

  • Экономичность: снижение расходов до 90 % по сравнению с традиционными решениями.
  • Масштабируемость и надёжность: обеспечение того же уровня масштабируемости и надёжности, что и у остального Amazon S3.
  • Гибкий API: простой и гибкий API для хранения, запросов и получения векторов.
  • «Векторные корзины» (Vector Buckets): новый тип корзины, оптимизированный для векторов, поддерживающий до 10 000 индексов в каждой корзине.
  • Поддержка метаданных: возможность прикреплять метаданные к каждому вектору для фильтрации запросов.
  • Автоматическая оптимизация: векторные данные автоматически оптимизируются для лучшего соотношения цена-производительность.

Однако сервис имеет и существенные ограничения по сравнению со специализированными векторными инструментами, прежде всего в плане производительности. Задержка при обработке запросов может достигать 200-700 мс, а скорость записи ограничена 2 МБ/с. Для сравнения, Milvus способен записывать гигабайты в секунду. Точность выполнения запросов S3 Vectors находится в диапазоне 85-90 %, иногда ниже, и пока этот параметр недоступен для настройки.

Таким образом, S3 Vectors не подходит для работы с большими, часто обновляемыми наборами данных или для создания алгоритмических рекомендательных систем, требующих минимальной задержки. Зато он может стать оптимальным решением для:

  • работы с «холодными» данными;
  • приложений с небольшой нагрузкой на базу;
  • прототипирования и тестирования идей при ограниченном бюджете, где высокая производительность не критична.

Новая эра: сегментация пайплайнов для «горячих» и «холодных» данных

Появление S3 Vectors знаменует новый этап в эволюции отрасли. Оно подтверждает тенденцию к разделению пайплайнов обработки данных на «горячие», «тёплые» и «холодные». Нет необходимости обрабатывать все данные одинаково, поскольку в разных сценариях приоритеты могут смещаться от экономии к максимальной производительности.

Руководство Zilliz утверждает, что AWS не разрушает рынок векторных баз данных, а, напротив, способствует его развитию, формируя новые ниши и сегменты. Это открывает возможности для инноваций и создания более гибких и экономически оправданных решений, адаптированных к специфическим потребностям различных ИИ-приложений. В конечном итоге пользователи получают больше вариантов выбора, позволяя им балансировать между скоростью, точностью и стоимостью в соответствии со своими бизнес-целями.

Вопросы и ответы

Amazon S3 Vectors: вызов привычным базам данных и новая эра в работе с ИИ
Логичный шаг в развитии: от Milvus до S3 Vectors
Особенности S3 Vectors: экономия против производительности
Новая эра: сегментация пайплайнов для «горячих» и «холодных» данных