Meta делится своими последними достижениями в области автоматизированной идентификации объектов, что является ключевым достижением в ее продвижении AR

Компания Meta рассказала о своих последних достижениях в области автоматизированной идентификации объектов на изображениях. ВИДЯЩАЯ система теперь, согласно Meta, это самая крупная и продвинутая из доступных моделей компьютерного зрения.

SEER — производное от «самоконтроля» — может учиться на любой случайной группе изображений в Интернете без необходимости ручного отбора и маркировки, что ускоряет его способность идентифицировать широкий спектр различных объектов в пределах одного изображения. кадр, и теперь он может превзойти ведущие стандартные системы компьютерного зрения с точки зрения точности.

Примеры Meta SEER

И становится только лучше. Оригинальная версия ВИДЯЩИЙ, который был первоначально анонсирован Meta в прошлом году, был построен на модели из более чем 1 миллиарда изображений. Эта новая версия теперь в 10 раз больше.

Как объяснил Мета:

Когда прошлой весной мы впервые анонсировали SEER, она превзошла самые современные системы, продемонстрировав, что обучение с самоконтролем может преуспеть в задачах компьютерного зрения в реальных условиях. Теперь мы увеличили SEER с 1 миллиарда до 10 миллиардов плотных параметров, что, насколько нам известно, сделало ее крупнейшей плотной моделью компьютерного зрения в своем роде».

Особо следует отметить способность системы идентифицировать различные изображения разных людей и культур, а также придавать значение и интерпретацию объектам из разных регионов мира.

Традиционные системы компьютерного зрения обучаются в основном на примерах из США и богатых стран Европы, поэтому они часто плохо работают с изображениями из других мест с другими социально-экономическими характеристиками. Но SEER дает хорошие результаты для изображений со всего мира, включая регионы за пределами США и Европы с широким диапазоном уровней дохода».

Это важно, потому что это расширит понимание системой различных объектов и их использования, что затем может помочь повысить точность и обеспечить более автоматизированные описания того, что находится в кадре. Затем это может предоставить больше контекста для пользователей с нарушениями зрения, наряду с сопоставлением идентификации продукта, сигналами вывесок, предупреждениями о брендинге и т. д.

Мета также отмечает, что система является ключевым компонентом ее следующей смены.

Совершенствование компьютерного зрения — важная часть построения Метавселенной. Например, чтобы создать очки дополненной реальности, которые помогут найти потерянные ключи или показать, как приготовить любимый рецепт, нам понадобятся машины, которые понимают визуальный мир так же, как люди. Им придется хорошо работать на кухнях не только в Канзасе и Киото, но и в Куала-Лумпуре, Киншасе и во множестве других мест по всему миру. Это означает распознавание всех различных вариаций предметов повседневного обихода, таких как ключи от дома, печи или специи. SEER открывает новые горизонты в достижении такой высокой производительности».

Meta годами работала над улучшением идентификации объектов и добилась значительных успехов с точки зрения автоматических подписей, описаний для чтения и многого другого.

Пример распознавания изображений Facebook

Он также работает над идентификацией объектов в видео, следующим этапом. И хотя это пока не вариант, он может, в конечном итоге, привести ко всем новым данным, позволяя вам узнать больше о том, о чем пишет каждый отдельный пользователь, и о том, как достучаться до них с помощью ваших рекламных акций.

Даже сейчас это может быть ценным. Если бы вы знали, например, что определенное подмножество пользователей в Instagram с большей вероятностью опубликует фотографию своей еды, основываясь на предыдущих шаблонах публикации, это могло бы помочь в таргетинге вашей рекламы. Экстраполируйте это на любую тему с высокой степенью точности сопоставления данных, и это может стать отличным способом получить максимальную отдачу от вашего рекламного подхода.

И это раньше, как отмечает Meta, учитывая продвинутые приложения в оверлеях AR или улучшая свои алгоритмы видео, чтобы показывать людям больше контента, с которым они с большей вероятностью будут взаимодействовать, на основе того, что на самом деле находится в каждом кадре.

Приближается следующий этап, и подобные системы будут способствовать серьезным изменениям в онлайн-подключении.

Вы можете прочитать больше о системе SEER Meta здесь.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован.