Французские исследователи нашли средство, позволяющее отслеживать активность миллионов любителей торрент-трекеров практически в реальном времени.
Для этого им хватило всего одного компьютера. Эксперимент длился 103 дня. За это время ученые собрали 148 миллионов IP-адресов и проследили за двумя миллиардами файлов.
Для описания проделанной работы исследователям понадобилось всего восемь страниц. Они признались, что не по назначению использовали особенности протокола BitTorrent, чаще всего применяемого для файлообмена, а также некоторые сайты торрент-порталов - в частности, Mininova и The Pirate Bay.
Документ вообще богат на выводы, но главный заключается в том, что анонимность в пиринговых сетях - это миф. Экспериментаторам удалось установить IP-адреса 70 процентов пользователей, первыми запустивших в Сеть тот или иной контент. Надо ли говорить, что подавляющая часть этого контента - пиратская?
Поиск изначальных распространителей файлов очень важен с юридической точки зрения, так как именно это действие совершается пользователем осознанно - в отличие от дальнейшего распространения, производимого торрент-клиентом в автоматическом режиме.
Программы французов следили на популярных торрент-порталах за страницами, где выкладываются ссылки на только что появившиеся торренты. Тут же программа начинала скачивать этот торрент и пыталась выявить главного распространителя - это было несложно, так как к тому моменту посторонние не успевали подключиться.
Эта схема не работала с закрытыми торрент-трекерами, требющими логина и пароля для обмена файлами. В этом случае экспериментаторам удавалось узнать логин. В документе они объясняют, что это, в отличие от пароля, обычно открытая информация и ее достаточно для мониторинга активности распространителей.
Через сами трекеры, используя специальные запросы, исследователи узнавали статистику по торрентам, а также получали доступ к их уникальным идентификаторам. В дальнейшем это позволило подсчитать количество уникальных образцов контента, пересылаемых пользователями друг другу.
IP-адреса остальных участников файлообмена им удалось узнать, посылая сигналы о начале и остановке распространения контента - данный запрос возвращает список IP-адресов. Повторяя эту процедуру каждые два часа, исследователи выявили около 90 процентов адресов, распространяющих тот или иной файл. Ежедневно они отслеживали от 500 до 750 тысяч файлов.
Наконец, французы препарировали сами .torrent-файлы и попутно выяснили, что их набор серьезно отличается от трекера к трекеру. Так, при 974980 торрентах на The Pirate Bay и 1411940 на Mininova совпали лишь 227620. Эти два, да еще IsoHunt, стали "любимыми" торрент-порталами ученых.
Интересно, что активных и постоянных распространителей файлов сравнительно немного. Зато они весьма производительны - некоторые из них, в частности группа eztv, выкладывают по шесть файлов в день (в случае eztv это сериалы).
Те, кто поставил распространение контента через торренты на поток, естественно, вкладывается в инфраструктуру. Так, самые активные распространители, судя по IP, располагаются в хостинговых центрах. Из 20 самых крупных десять выбрали французский OVH и немецкий Keyweb (в список попала и российская Corbina). Там обычно стоят дешевые выделенные серверы, подключенные к быстрым каналам с неограниченным трафиком.
Исследователи подчеркивают, что услугами хостеров вряд ли пользуются только французы или немцы. Анализ названий файлов показал, что значительная их часть была рассчитана на испаноязычную аудиторию. По данным ученых, на сотню крупнейших распространителей приходится 30 процентов торрентов. Тысяча крупнейших отвечают за 60 процентов контента.
В том месте, где говорится о малочисленности злостных пиратов, сухой стиль ученых сменяется неподдельным удивлением. Авторы документа изумляются тому, что правообладатели зачастую пытаются остановить миллионы скачиваний, а не пресечь действия всего нескольких сотен пиратских групп, стоящих за большей частью нелицензионного контента.
Похоже, правообладателям, которые все чаще требуют от тысяч заподозренных в пиратстве пользователей денег за то, чтобы не доводить дело до суда, не улыбается проделывать то же самое с настоящими распространителями.
Им это просто невыгодно.