Reddit заблокирует доступ к Internet Archive
Reddit заявляет, что компании, занимающиеся ИИ, извлекают данные из Wayback Machine в нарушение правил платформы, поэтому собирается запретить Internet Archive индексировать большую часть Reddit, сообщает The Verge.Архив Wayback Machine больше не сможет сканировать страницы с подробными описаниями постов, комментариями или профилями на Reddit.
Internet Archive сможет индексировать только главную страницу Reddit.com, то есть только информацию о том, какие заголовки новостей и посты были наиболее популярны в тот или иной день.«Нам известно о случаях, когда компании, занимающиеся искусственным интеллектом, нарушают правила платформы, в том числе наши, и извлекают данные из Wayback Machine», — сообщил The Verge представитель компании Тим Ратшмидт.Задача Internet Archive — хранить цифровой архив веб-сайтов в интернете и «других культурных артефактов», а Wayback Machine — это инструмент, с помощью которого можно просматривать страницы в том виде, в котором они были доступны в определённые даты.
habr.com