Издатели атакуют теневые библиотеки, защищая права и борясь с ИИ-скрейпингом.
Компания Link-Busters стала первой антипиратской организацией, сообщившей Google о более миллиарде URL-адресов, нарушающих авторские права. Наиболее часто удаляемыми доменами стали Anna's Archive и Z-Library, а самым активным правообладателем является издательство Penguin Random House.
Google обрабатывает больше запросов на удаление, чем любая другая компания. Сюда входит контент, хранящийся на Google Диск и YouTube, а также ссылки на пиратский контент, индексируемый Google. Недавно стало известно, что общее количество обработанных поисковиком запросов на удаление приближается к 10 миллиардам.
Компания Link-Busters отправила свой миллиардный запрос на удаление DMCA в Google. На данный момент счетчик составляет более 1,20 млрд. запросов, и это число может значительно возрасти уже на следующей неделе.
По количеству запросов Link-Busters обогнала MG Premium (дочерняя компания Aylo) и оставила многих конкурентов далеко позади. Анализируя рекордные показатели Link-Busters, можно увидеть, что они во многом обусловлены активностью издательских компаний. Рост теневых библиотек и угроза скрейпинга данных ИИ сделали компании особенно активными в антипиратской борьбе.
Онлайн-библиотеки Z-Library и Anna's Archive позволяют публике бесплатно скачивать книги, которые также могут использоваться для обучения ИИ. Чтобы предотвратить незаконное скачивание и использование, издатели стараются сделать такие сайты недоступными в Google. Из 10 самых атакуемых доменов 3 принадлежат Anna's Archive, за ними следуют серии доменов Z-Library. Эти домены составляют более 220 миллионов зарегистрированных URL.
В таблице также указаны главные правообладатели, работающие с антипиратской компанией. Все они являются издательскими компаниями, среди которых выделяется Penguin Random House с более 269 млрд. запросов на удаление. Другие активные отправители запросов включают HarperCollins, Simon and Schuster и Hachette.
Издатели, судя по отзывам, довольны сервисом Link-Busters. Однако стоит отметить, что миллиард запросов на удаление не означает миллиард удалений из поиска Google. Около 75% зарегистрированных URL были удалены, другие URL (21%) не входили в индекс Google и были занесены в черный список. Оставшиеся ссылки были отправлены более одного раза (2%) или не были удалены по другим причинам (1%).
Множество миллионов URL теневых библиотек, дублированных на десятках доменов, способствовали достижению рекордных показателей Link-Busters. Поскольку атакуемые сайты остаются устойчивыми, можно ожидать дальнейшего роста чисел.