数字荒原上的掠食者:AI 爬虫与开源工具站点的生存悖论|Deep Reading
即使是最先进的 AI,也无法在一片焦土上繁荣。

Editor’s Note
新的一年,Deep Reading 也有了一些新的变化。工作日期间,我们会在 Dailyio 网站更新一篇长文推荐,同时在周末以邮件通讯的形式发送给订阅读者,让你不会错过每周的精彩的长文。
AI 爬虫正在对开源软件(FOSS)网站造成类似 DDoS 攻击的负担,迫使维护者采取极端措施保护基础设施。
今天推荐的这篇文章展示了这场发生在数字世界的不对称战争,其规模足够惊人,比如某些项目高达 97% 的流量来自 AI 公司的机器人,而 Read the Docs 在阻止爬虫后流量骤减 75%,每月节省约 1500 美元带宽成本。更令人震惊的是,这些「数字掠食者」已进化出绕过传统防御的高级技术,深入到开发者每一次提交的 Git 日志里寻找数据……
「More Reading, Less Junk」,欢迎进入今天的深度阅读时间。