Главный ученый в области искусственного интеллекта и машинного обучения в Google Cloud Фей-Фей Ли поведала о новой технологии, способной " узнавать" объекты на видео. Произнося речь на симпозиуме Next Cloud, она представила интерфейс Video Intelligence API, из-за которому компьютерные алгоритмы имеют возможность " понять" суть того либо другого ролика.
В виде примера Ли включила короткое рекламное видео, А новый API сумел распознать таксу, как только собака возникла в кадре, и прийти к выводу, что коммерческим был целый ролик. А на другой демонстрации алгоритмы Google смогли обнаружить все релевантные клипы, отвечающие запросу " пляж".
Технология компьютерного зрения Google и прежде умела угадывать объекты, но только на неподвижных, статических изображениях." Ассистент", встроенный в фотосервис " Google Фото", автоматически наносит на карту места, где побывал пользователь, а также понимает достопримечательности, запечатленные на фотографиях, и привязывает к ним надлежащие теги.
Помимо этого, там можно обнаружить любую интересующую его фотографию, просто введя поисковый запрос — к примеру, " пицца" выдаст все фотографии с этим блюдом, а " Санкт-Петербург" покажет фотографии, сделанные в этом городе.
По данным Ли, прежде алгоритмы Google были не в состоянии выяснить смысл видео без проставленных вручную тегов." Мы готовы объяснить темную материю цифровой вселенной", — заявила она.