Инженеры IBM использовали хранящиеся на Flickr фотографии для обучения алгоритмов распознавания лиц и передавали их сторонним ученым. Однако согласия на это у запечатленных на снимках людей Фирма не запрашивала.
Как информирует NBC, научно-исследовательский отдел IBM позаимствовал с Flickr около миллиона изображений, которые потом были " скормлены" нейросетям. Граждане, изображенные на фото, разрешали себя снимать, но не имели понятия, что эти фотографии имеют возможность быть аннотированы и использованы для наблюдения за ними же.
Сбором самих изображений занималась не IBM, а бывший хозяин интернет представительства — Яху (прошлой весной фотохостинг, некогда бывший самым крупным в мире, перешел к организации SmugMug). Во время проекта YFCC100M было накоплено 99, 2 миллиона фото. Все они распространялись по лицензии Creative Commons, которая подразумевает свободное применение контента, хотя и с рядом ограничений.
То, что IBM использовала эти фотографии для обучения систем распознавания лиц, поднимает не столько юридические, сколько этические вопросы. Как сообщает The Verge, Фирма могла применять эти данные, чтобы научить ИИ различать на видео людей по этническому признаку. Однако в IBM отрицают, что стали бы " принимать участие в проекте, связанным с расовым профилированием".
В организации подчеркнули, что " уделяют повышенное внимание соблюдению принципов конфиденциальности", в список включены только общедоступные изображения, а доступ к ней имеют исключительно проверенные исследователи. Также, в случае подачи жалобы, в IBM выразили подготовленность исключить заявителя из набора данных.
Однако получить доступ к коллекции не так-то просто: она закрыта для всех, кто не проводит научных или корпоративных исследований. Корреспонденты NBC получили эти данные от иного источника и создали инструмент (встроен прямо в статью), из-за которому любой пожелавший может протестировать наличие своего никнейма Flickr в базе IBM.