Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в индустрии AI-лидирования. Узнать больше
Канадская AI-Starta Cohere, запущенная в 2019 году, специально предназначенная для бизнеса, но независимые исследования показали, что до сих пор они изо всех сил пытались заработать большую долю рынка среди сторонних разработчиков по сравнению с конкурентными собственными поставщиками моделей США, такими как OpenSeek и Antropical, не говоря уже о росте китайских конкурентов.
Тем не менее, COHERE продолжает укреплять свои предложения: сегодня его некоммерческое исследовательское подразделение COHEHER для ИИ объявило о публикации своей модели первого взгляда, Aya Vision, новой модели с открытым тяжелым мультимодалом, которая объединяет лингвистические и визуальные навыки и может похвастаться разницей в поддержке поддержки в 23-AAAAAA.
Aya Vision предназначено для улучшения способности интерпретировать изображения, генерировать текст и перевести визуальный контент на естественный язык, что делает многоязычный ИИ более доступным и эффективным. Это было бы особенно полезно для предприятий и организаций, работающих на многочисленных рынках по всему миру с различными языковыми предпочтениями.
Сейчас он доступен на веб-сайте Cohehe и в сообществах Code AI, обнимающих лицо, и Kaggle в рамках Creative Commons назначенной некоммерческой 4.0 International (CC BY-NC 4.0), позволяя исследователям и разработчикам свободно использовать, изменять и делиться моделью для некоммерческих целей, как уместно.
Кроме того, Aya Vision доступна через WhatsApp, что позволяет пользователям взаимодействовать с моделью непосредственно в семейной среде.
Это ограничивает его использование для предприятий и в качестве двигателя для платных программ или валютных рабочих процессов, к сожалению.
Он составляет 8 миллиардов и 32 миллиарда версий параметров (параметры относятся к количеству внутренних настроек в модели искусственного интеллекта, включая его веса и изгибы, при этом более часто называют более мощную и выполняющую модель).
Поддерживает 23 языка и рассчитывает
Хотя ведущие модели конкурентов ИИ могут понимать текст через несколько языков, расширение этой способности на основанные на зрении задачи является проблемой.
Но Aya Vision преодолевает это, позволяя пользователям генерировать подписи изображений, отвечать на визуальные вопросы, переводить изображения и выполнять текстовые языковые задачи на различных языках:
1. Английский
2. Французский
3. Немецкий
4. Испанский
5. Итальянский
6. Португальский
7. Японский
8. Корейский
9. Китайский
10. арабский
11. Греческий
12. Персидский
13. Польский
14. Индонезия
15. в Чехе
16. иврит
17. Хинди
18. Голландский
19. Румынский
20. русский
21. Турецкий
22. Украинский
23. Вьетнамцы
В своем сообщении в блоге Cohere показал, как Aya Vision может анализировать изображения и тексты на пакетах продуктов и предоставлять переводы или объяснения. Он также может идентифицировать и описать художественные стили из разных культур, помогая пользователям узнать об объектах и традициях посредством визуального понимания.
Способности Aya Vision имеют широкие последствия через несколько областей:
• Изучение языка и образование: Пользователи могут переводить и описывать изображения на нескольких языках, делая образовательный контент более доступным.
• Культурное сохранение: Модель может генерировать подробные описания искусства, вех и исторических артефактов, поддерживая культурную документацию на недопредставленных языках.
• Инструменты доступности: ИИ на основе зрения может помочь видимым пользователям, предоставляя подробные описания изображений на их родном языке.
• Глобальное общение: Реальный мультимодальный перевод позволяет организациям и частным лицам более эффективно общаться через языки.
Сильная производительность и высокая эффективность с помощью основных ссылок
Одной из выдающихся особенностей Aya Vision является его производительность и производительность по отношению к размеру модели. Несмотря на то, что Aya Vision была значительно меньше, чем любые крупные мультимодальные модели, превысило гораздо большие альтернативы в нескольких ключевых ссылках.
• Aya Vision 8b превышает Llama 90b, что в 11 раз больше.
• Aya Vision 32B превышает QWEN 72B, LAMA 90B и MOLMO 72B, все из которых по крайней мере вдвое больше (или более).
• Результаты сравнительного анализа AyavisionBench и M-Wildvision показывают, что Aya Vision 8b достигает показателей выигрыша до 79%, а Aya Vision 32B достигает 72% прироста в многоязычных задачах понимания изображений.
Визуальное сравнение производительности с действиями подчеркивает пользу Aya Vision. Как показано в эффективности против Performance Business Graph, Aya Vision 8b и 32b демонстрируют лучшие показатели качества по отношению к размеру их параметров, превышая гораздо более крупные модели, поддерживая эффективность вычислений.

Технические инновации TE, эксплуатирующие Aya Vision
Намекайте, чтобы приписать производительность Aya Vision нескольким ключевым инновациям:
• Синтетические комментарии: Модель использует генерацию синтетических данных для улучшения обучения задачам с несколькими модами.
• Многоязычное масштабирование данных: Перевод и переформулирование данных через языки, модель получает более широкое понимание многоязычных контекстов.
• Мультимодальная модель слияние: Усовершенствованные методы объединяют понимание как дальновидных, так и языковых моделей, улучшая общую производительность.
Эти достижения позволяют Aya Vision обрабатывать изображения и текст с большей точностью, сохраняя сильные многоязычные возможности.
Пошаговая диаграмма пошагового увеличения показывает, как постепенные инновации, включая синтетическую тонкую конфигурацию (SFT), слияние модели и восхождение, способствовали высоким показателям победы Aya Vision.

Последствия для корпоративных решений -руководители
Несмотря на то, что, по -видимому, служащий видение AYA для бизнеса, компаниям может быть трудно использовать его, учитывая его ограничительные некоммерческие условия лицензии.
Тем не менее, руководители, CTO, ИТ-лидеры и исследователи искусственного интеллекта могут использовать модели для изучения многоязычных и мультимодальных возможностей в своих организациях, особенно в исследованиях, прототипе и сравнительном анализе.
Предприятия все еще могут использовать его для внутренних исследований и разработок, оценивая многоязычную производительность ИИ и экспериментируя с мультимодальными приложениями.
Команды CTO и искусственного интеллекта считают Aya Vision стоимостью очень эффективной модели с открытым весом, которая превышает гораздо большие альтернативы, в то же время требуется меньше вычислительных ресурсов.
Это делает его полезным инструментом для сравнительного анализа против проприетарных моделей, исследования возможных решений, управляемых AI, и тестирование многоязычных мультимодальных взаимодействий, прежде чем создавать стратегию развертывания бизнеса.
Для данных и ученых ИИ Aya Vision гораздо более полезно.
Его естественные и строгие ссылки с открытым исходным кодом предоставляют прозрачную основу для изучения поведения модели, настройки в некоммерческих условиях и способствуют открытому прогрессу ИИ.
Независимо от того, используется ли для внутренних исследований, академического сотрудничества или этических оценок AI, Aya Vision служит наиболее выгодным ресурсом для предприятий, стремящихся остаться на переднем крае многоязычного и мультимодального AI-Sen ограничения проприетарных моделей с закрытым исходным кодом.
Исследования и сотрудничества с открытым исходным кодом
Aya Vision является частью Aya, более широкой инициативы Cohere, ориентированной на то, чтобы стать ИИ и связанной с ним технологии, более многоязычной.
С момента своей вспышки в феврале 2024 года инициатива AYA заняла глобальное исследовательское сообщество из более чем 3000 независимых исследователей в 119 странах, в сотрудничестве для улучшения моделей ИИ языка.
Чтобы продолжить свою приверженность открытой науке, Cohere выпустил открытые веса для Aya Vision 8b и 32b на Kaggle и обнимающееся лицо, обеспечивая доступ исследователей по всему миру и экспериментируйте с моделями. Кроме того, Cohere для AI представила Ayavisionbenchmark, новую многоязычную оценку зрения, предназначенную для обеспечения строгой структуры оценки для мультимодального ИИ.
Доступность Aya Vision как модель с открытым весом отмечает важный шаг, чтобы сделать многоязычные исследования ИИ более инклюзивными и доступными.
Aya Vision основана на успехе Aya Expanse, еще одной семейства LLM, сфокусированной на искусственном интеллекте, ориентированном на многоязычный ИИ. Расширяя свое внимание на мультимодальный ИИ, объедините позиции AI Aya Vision как ключевой инструмент для исследователей, разработчиков и компаний, стремящихся интегрировать многоязычный ИИ в свои рабочие процессы.
Поскольку инициатива AYA продолжает развиваться, Cohere для AI также объявила о планах запустить новые совместные исследования в ближайшие недели. Исследователи и разработчики, заинтересованные в содействии многоязычным прогрессам искусственного интеллекта, могут присоединиться к открытому научному сообществу или подать заявку на исследовательские субсидии.
На данный момент выпуск Aya Vision представляет собой значительный скачок в многоязычном многомодальном ИИ, предлагающий высокопроизводительное, открытое тяжелое решение, которое бросает вызов контролю более крупных моделей с замкнутым исходным кодом. Сделав эти достижения доступным для более широкого исследовательского сообщества, Cohere для искусственного интеллекта продолжает раздвигать границы того, что возможно при многоязычном коммуникации, управляемом искусственным интеллектом.
Ежедневное понимание коммерческих вариантов использования с VB Daily
Если вы хотите произвести впечатление на своего босса, VB Daily прикрыл вас. Мы даем вам внутреннюю руку о том, что компании делают с генеративным ИИ, от регулирующих ходов до практических развертываний, так что вы можете поделиться пониманием максимальной рентабельности инвестиций.
Прочитайте нашу политику конфиденциальности
Спасибо за подписку. Посмотрите на дополнительную информацию VB здесь.
Произошла ошибка.

Source link