Разработчиков ИИ уличили в сборе данных с сайтов СМИ вопреки прямым запретам

Admin 1 неделя тому назад

0 1 Время чтения: 1 минута

Несколько компаний, занимающихся разработкой систем искусственного интеллекта, игнорируют принятый отраслью веб-стандарт, который позволяет издателям блокировать сбор своего контента с целью его последующего включения в массивы для обучения генеративного ИИ. Об этом сообщает Reuters.

Источник изображений: Gerd Altmann / pixabay.com

Информация о неправомерных действиях разработчиков ИИ в отношении сайтов СМИ появилась в рамках публичного разбирательства ИИ-стартапа Perplexity и ресурса Forbes, при этом компании, предположительно оказавшиеся правонарушителями и пострадавшими, не называются. Деловое издание публично обвинило Perplexity в плагиате материалов своих расследований — в составляемых генеративным ИИ сводках оказываются материалы Forbes без запросов разрешения и ссылок на авторов. Поисковый веб-сканер Perplexity, вероятно, игнорирует директивы, которые указываются издателями в файле robots.txt — распространённый стандарт помогает администраторам сайтов определять, какие разделы разрешено сканировать поисковым роботам.

О проблеме сообщила компания TollBit — стартап, выступающий посредником между испытывающими потребность в обучающих материалах ИИ-компаниями и открытыми для заключения лицензионных соглашений издателями. Perplexity — не единственный нарушитель, который предположительно игнорирует директивы robots.txt, считают в TollBit. Сейчас в базе посредника значатся 50 издателей, и «чем больше журналов издателей мы принимаем, тем больше проявляется эта закономерность».

Протокол robots.txt был создан в середине девяностых годов, чтобы защитить сайты от перегрузок из-за поисковых роботов. Чёткого механизма правового принуждения соблюдать директивы файла не существует, но исторически они соблюдались добровольно. Недавно robots.txt стал основным инструментом, который издатели использовали, чтобы не допустить бесплатного включения их контента в массив данных для генеративного ИИ. Этот контент используется как для обучения ИИ, так и для создания сводок информации на его основе в режиме реального времени.

Некоторые издатели, включая New York Times, пытаются засудить разработчиков ИИ за нарушение авторских прав в связи с использованием материалов для этих целей. Другие подписывают с создателями ИИ лицензионные соглашения. Стороны часто расходятся во мнениях относительно ценности материалов — некоторые разработчики даже утверждают, что не нарушают законов, получая доступ к материалам СМИ бесплатно.

Источник

Разработчиков ИИ уличили в сборе данных с сайтов СМИ вопреки прямым запретам

Admin

Добавить комментарий Отменить ответ

Все три крупнейших производителя консолей отключили интеграцию с X — Nintendo стала последней

Asus представит на Computex 2024 консоль ROG Ally 2024, блок питания Thor 1600 III, ИБП Mojlonir и многое другое

Sharkoon представила деревянные геймерские клавиатуры SGK50 PBT Wood

Анонсирована Sonic Rumble — королевская битва в духе Fall Guys, но от создателей Angry Birds

MSI представила материнские платы MAG X870 Tomahawk WIFI и PRO X870-P WIFI для Ryzen 9000

Thermalright представила башенный кулер Burst Assassin 120 EVO DARK с парой вентиляторов

The Rogue Prince of Persia от соавторов Dead Cells вышла в раннем доступе Steam, причём без привязки к Ubisoft Connect

ASRock представила плату W790 WS R2.0 для рабочих станций на Intel Xeon W-3400 и W-2400

Sonos готовится выпустить премиальные наушники Ace со звуком Dolby Atmos

Утечка раскрыла детали о материнских платах для процессоров Ryzen 9000

«Стражи галактики» встречают Overwatch: мультиплеерный шутер Concord от бывших разработчиков Destiny 2 разочаровал игроков ещё до релиза

В Китае испытали грузовой беспилотник, который сможет доставить 700-кг груз более чем на 500 км

Репортаж со стенда MSI на выставке Computex 2024: материнские платы, видеокарты, СЖО и блоки питания

«Джеймс Уэбб» подтвердил открытие самой древней галактики — менее чем в 300 млн световых лет от Большого взрыва

Удар по Intel и AMD: Китай обязал операторов связи отказаться от зарубежных процессоров к 2027 году

Моддеры разблокировали в Starfield на Xbox Series S поддержку 60 кадров/с, но есть нюанс

Выручка Intel выросла на 9 %, но прогноз на текущий квартал вызвал падение курса акций на 7,75 %

Intel была вынуждена признать, что до сих пор контрактное подразделение только увеличивало убытки

Corsair представила геймерский монитор Xeneon 34WQHD240-C — 34 дюйма, QD-OLED и 240 Гц

«Бежим из Таркова, ребята!»: игроки встретили восторгами дату старта раннего доступа тактического шутера Gray Zone Warfare в духе Escape from Tarkov

Суд запретил продажу смартфонов и ноутбуков Lenovo и Motorola в Германии

В Беларуси физлицам полностью запретили дроны — покупать, использовать и даже хранить беспилотники теперь незаконно

NASA и ВВС США получили первое аэротакси Joby Aviation — они оценят его на пригодность к спецоперациям и не только

Китай первым в мире разрешил перевозить людей на беспилотных аэротакси

Insta360 представила экшн-камеры Ace и Ace Pro в стиле GoPro — с поворотным экраном и видео до 8K

Представлен гигантский датчик изображения на 316 Мп — почти размером с блюдце

Archer Aviation испытала фирменные литиевые аккумуляторы падением с высоты — это необходимо для будущей сертификации аэротакси

США вновь ужесточили санкции против Китая

В китайской лаборатории впервые обнаружили признаки гравитона — гипотетической частицы по переносу гравитации

Tesla отчиталась о выпуске шестимиллионного электромобиля

Эксперимент 100-летней давности повторили на квантовом уровне, что впустит квантовые явления в наш мир

Похожие статьи

Добавить комментарий Отменить ответ