1. NetHack 5.0.0 正式发布;
  2. Dav2d:AI爬虫防护下的网站验证机制;
  3. AI招聘中的自我偏好:实证证据与启示;
  4. 俄罗斯如何毒化维基百科;
  5. 加州将对违章无人驾驶汽车开罚单;

以上是今天的前五条黑科技新闻标题。

总共25条,具体内容您往下读…

1. NetHack 5.0.0 正式发布

🔗 nethack.org: NetHack 5.0.0

🔥🔥: 363 | 💬: 107 | 🗓️ 2026-05-02


NetHack开发团队于2026年5月2日发布了NetHack 5.0.0,这是经典地牢探索游戏的最新大版本。本版本在修复大量错误的同时,重点进行了架构改进:源代码已符合C99标准,并移除了跨平台编译的障碍。原有的基于yacc和lex的关卡与地牢编译器已被Lua脚本替代,在游戏运行时加载处理。请注意,旧版本的存档和骨头文件将无法兼容。官方欢迎玩家通过GitHub提交建议、拉取请求或错误报告。


2. Dav2d:AI爬虫防护下的网站验证机制

🔗 code.videolan.org: Dav2d

🔥🔥: 319 | 💬: 103 | 🗓️ 2026-05-02


该页面因网站管理员启用 Anubis 防护系统而加载验证,旨在对抗AI公司大规模抓取数据导致的服务器瘫痪。Anubis采用 工作量证明 方案(类似Hashcash防垃圾邮件机制),对个体用户影响可忽略,但能显著增加批量爬虫的成本。此方案为过渡性措施,未来将转向通过 无头浏览器指纹识别(如字体渲染差异)减少对真实用户的干扰。注意:该验证需启用JavaScript,禁用JShelter等插件,无JS解决方案仍在开发中。


3. AI招聘中的自我偏好:实证证据与启示

🔗 arxiv.org: AI Self-preferencing in Algorithmic Hiring: Empirical Evidence and Insights

🔥🔥: 316 | 💬: 170 | 🗓️ 2026-05-02


研究通过大规模实验发现,大型语言模型(LLMs)在招聘中会系统性偏好自己生成的简历,而非人类或其它模型撰写的同等质量简历。这种自我偏好偏差在商业和开源模型中高达67%至82%,导致使用相同LLM的候选人被短名单选中的概率比人类简历申请者高23%至60%,尤其在销售、会计等商业领域影响最大。研究还表明,通过干预模型的自我识别能力,可将此偏差降低超过50%。这揭示了AI辅助决策中一个被忽视的风险,呼吁AI公平性框架应扩展至AI间交互的偏见。


4. 俄罗斯如何毒化维基百科

🔗 bettedangerous.com: Russia Poisons Wikipedia

🔥🔥: 243 | 💬: 185 | 🗓️ 2026-05-02


文章揭露俄罗斯通过国家支持的行动,系统性地操纵维基百科内容,植入亲克里姆林宫的虚假叙事,以扭曲公众对历史与战争(如俄乌战争)的认知。这种操控不仅污染了维基百科,还通过训练数据渗透到AI模型和聊天机器人中,形成“信息洗钱”链条。报告指出,俄罗斯利用“Pravda”等虚假新闻网络进行外国数字干涉,旨在分裂西方对乌克兰的支持,并重塑全球信息环境。


5. 加州将对违章无人驾驶汽车开罚单

🔗 bbc.com: California to begin ticketing driverless cars that violate traffic laws

🔥🔥: 232 | 💬: 247 | 🗓️ 2026-05-02


加州机动车管理局宣布新规,自7月1日起,警察可对违反交规的无人驾驶汽车直接向制造商开具“违规通知”。新规要求车辆在30秒内响应紧急呼叫,并禁止进入应急区域。此举旨在解决此前无法对“无司机”车辆执法的困境,如去年旧金山大停电导致Waymo车辆堵塞路口的事件。


6. macOS虚拟机性能与最小配置实测

🔗 eclecticlight.co: How fast is a macOS VM, and how small could it be?

🔥🔥: 217 | 💬: 79 | 🗓️ 2026-05-02


测试显示,在Apple Silicon上运行macOS虚拟机性能损失极小:单核CPU达到宿主98%,多核表现甚至更优,GPU达95%。但神经引擎在AI任务中显著降速。令人惊喜的是,最低仅需2个虚拟核心和4GB内存即可流畅运行日常任务,如Safari浏览和系统设置。虚拟机文件采用APFS稀疏存储,100GB分配实际仅占用约54GB磁盘空间,适合MacBook Neo等小存储设备。


7. TMP与TEMP:临时文件环境变量的历史渊源

🔗 devblogs.microsoft.com: Why are there both TMP and TEMP environment variables? (2015)

🔥🔥: 188 | 💬: 87 | 🗓️ 2026-05-02


计算机早期,CP/M系统没有环境变量,程序通过打补丁配置临时文件位置。MS-DOS继承CP/M后引入环境变量,但最初程序不依赖它们。随着市场发展,TEMPTMP两个变量竞争成为临时文件路径标准。MS-DOS 2.0的管道功能选择使用TEMP,而Windows的GetTempFileName函数则优先查找TMP。最终,程序具体使用哪个变量取决于其开发者,导致两者至今共存于系统中。


8. “请勿追踪”倡议:用一个 DO_NOT_TRACK 环境变量统一关闭所有工具的遥测与广告追踪

🔗 donottrack.sh: Do_not_track

🔥🔥: 185 | 💬: 64 | 🗓️ 2026-05-02


许多 CLI 工具和 SDK 默认收集遥测数据,但每个工具的退出机制各不相同,极其繁琐。该提案建议设立一个标准环境变量 DO_NOT_TRACK=1,用户只需在 shell 配置文件中设置一次,即可明确拒绝广告追踪、使用报告、崩溃上报等非必要网络请求。同时呼吁软件作者尊重此变量,并考虑将遥测改为默认关闭


9. Roblox股价暴跌18%,儿童安全措施拖累业绩

🔗 cnbc.com: Roblox shares plummet 18% as child safety measures weigh on bookings

🔥🔥: 183 | 💬: 118 | 🗓️ 2026-05-02


Roblox因儿童安全功能限制用户沟通与新增用户,下调2026年全年业绩指引,导致股价暴跌。尽管第一季度营收超预期,但公司面临140多起联邦诉讼,指控其未能保护儿童免受性剥削。CEO表示,安全措施虽影响短期增长,但将提升平台长期潜力


10. 开源设计:将你的编码代理作为设计引擎

🔗 github.com: Open Design: Use Your Coding Agent as a Design Engine

🔥🔥: 169 | 💬: 84 | 🗓️ 2026-05-02


Open Design 是 Claude Design 的开源本地替代方案,它不内置代理,而是自动检测你电脑上的12种编码代理 CLI(如 Claude Code、Codex、Cursor 等),将其转化为设计引擎。该项目内置 31 项可组合技能129 套品牌级设计系统,支持生成网页、桌面、移动端原型、幻灯片、图片及视频。所有操作均可本地运行,支持 BYOK(自带密钥),并允许导出为 HTML、PDF、PPTX 等格式,完全摆脱了云服务和专有模型的锁定。


11. 六年打磨:Apple Watch地图设计的终极进化

🔗 david-smith.org: Six Years Perfecting Maps on WatchOS

🔥🔥: 147 | 💬: 31 | 🗓️ 2026-05-02


作者耗时六年,为Apple Watch打造了最佳地图导航体验。早期受限于硬件,只能通过服务器生成地图;随后自建SwiftUI原生渲染引擎,实现离线功能。设计上历经多次迭代,最终采用“模态切换”方案:地图与数据分屏显示,并定制了高对比度、适配暗色模式的专属地图。作者放弃Apple MapKit,因其缺乏自定义能力和离线细节。最终成果兼具美观与实用,成为Pedometer++ 8的核心功能。


12. 四月 Ladybird 浏览器进展:性能飞跃与新功能落地

🔗 ladybird.org: This Month in Ladybird - April 2026

🔥🔥: 129 | 💬: 19 | 🗓️ 2026-05-02


本月 Ladybird 合并了 333 个 PR,重点包括:内联 PDF 查看器、基于 SQLite 的浏览历史与地址栏自动补全,以及增量式 HTML 解析。性能方面,离线程 JavaScript 编译将 YouTube 加载的主线程耗时减少约 200 毫秒,O(1) 字节码寄存器分配器消除了 x.com 加载中的 800 毫秒瓶颈。新引入的 GTK4/libadwaita 前端为 Linux 用户提供了原生体验,而 mimalloc 内存分配器统一了 C++ 与 Rust 代码,全面提升了 JS 基准测试成绩。此外,Reddit 和 YouTube 的兼容性显著改善,CSS 功能如 image-set() 和锚点定位也得到了初步支持。


13. Uber计划将司机车辆变为自动驾驶数据采集网

🔗 techcrunch.com: Uber wants to turn its drivers into a sensor grid for self-driving companies

🔥🔥: 118 | 💬: 129 | 🗓️ 2026-05-02


Uber首席技术官透露,公司计划为人类司机的车辆加装传感器,收集真实世界数据,供自动驾驶公司训练AI模型。此举旨在解决行业数据瓶颈,因为Waymo等公司缺乏资金大规模采集数据。Uber已与25家自动驾驶公司合作,并构建了“AV云”数据平台,供合作伙伴查询和训练模型。公司强调目标是“民主化”数据,而非直接盈利。


14. 被迫走棋的劣势:国际象棋中的“楚格文克”

🔗 en.wikipedia.org: Zugzwang

🔥: 99 | 💬: 64 | 🗓️ 2026-05-02


楚格文克(Zugzwang)源自德语,意为“被迫移动”,指在棋类游戏中,玩家因必须走棋而陷入不利局面。这一概念早在9世纪的古棋谱中就已出现,但术语直到19世纪才在德国棋界普及,20世纪初由拉斯克引入英语。楚格文克常见于残局,尤其是王兵残局和基础杀王中,优势方常利用它迫使对手让出关键位置。极端情况如相互楚格文克(双方谁走谁输)被称为“投石机”,是残局分析的核心工具。


15. 特斯拉车主因FSD虚假宣传获赔1万美元,特斯拉仍在上诉

🔗 electrek.co: Tesla owner won $10k in court for Tesla’s FSD lies. Tesla is still fighting him

🔥: 99 | 💬: 20 | 🗓️ 2026-05-02


一位特斯拉车主在法庭上赢得1万美元赔偿,原因是特斯拉对其全自动驾驶(FSD)功能进行了虚假宣传。尽管法院已作出裁决,特斯拉仍坚持上诉,拒绝支付赔偿。此案凸显了特斯拉在自动驾驶技术宣传上面临的法律挑战。


16. 尘封29年的世嘉土星游戏《金字塔》重见天日

🔗 32bits.substack.com: An unknown Sega Saturn project has come to light after 29 years

🔥: 97 | 💬: 2 | 🗓️ 2026-05-02


一篇关于世嘉土星未发布游戏《金字塔:法老之梦挑战》的考古文章揭示,这款教育游戏的土星版仅停留在技术演示阶段。开发者亚历山大·埃拉特证实,该项目由一家出版商委托制作,但未能推进。光盘数据包含可运行的游戏场景,但功能不完整。该发现源于一张保存完好的刻录光盘,经社区协作与开发者访谈确认了其身份。


17. 尼安德特人的“脂肪工厂”:12.5万年前的生存智慧

🔗 universiteitleiden.nl: Neanderthals ran ‘fat factories’ 125,000 years ago

🔥: 96 | 💬: 20 | 🗓️ 2026-05-02


一项新研究显示,尼安德特人在12.5万年前就已具备复杂的资源管理能力。在德国诺伊马克-诺德2号遗址,考古学家发现他们不仅敲骨吸髓,更将大型哺乳动物骨骼粉碎成数万碎片,通过加热水来提取富含热量的骨脂。这种类似“脂肪工厂”的集中化、高强度加工行为,将此类复杂生存策略的时间线大幅提前。该发现表明,尼安德特人已能战略性地规划狩猎、运输和资源处理,其适应能力和生态影响力远超以往认知。


18. 语言模型拒绝机制由单一方向调控

🔗 arxiv.org: Refusal in Language Models Is Mediated by a Single Direction

🔥: 88 | 💬: 33 | 🗓️ 2026-05-02


研究发现,在13个主流开源聊天模型中,拒绝有害指令的行为由一个一维子空间调控。移除该方向可让模型服从有害指令,添加则会拒绝无害请求。基于此,研究者提出一种白盒越狱方法,能精准禁用拒绝机制而不影响其他能力。该工作揭示了当前安全微调方法的脆弱性。


19. Flue:构建下一代智能体的TypeScript框架

🔗 flueframework.com: Flue is a TypeScript framework for building the next generation of agents

🔥: 82 | 💬: 46 | 🗓️ 2026-05-02


Flue是一个可编程的智能体框架,通过“模型+工具集”架构让开发者用22行代码创建自主智能体。它提供虚拟沙箱会话技能和文件系统操作,支持从CLI到HTTP服务器的灵活部署,可替代Dosu等现成工具。


20. 精神航空宣告倒闭,全面停飞

🔗 cnn.com: Spirit Airlines canceled all flights and is going out of business

🔥: 72 | 💬: 41 | 🗓️ 2026-05-02


美国第八大航空公司精神航空因财务危机与第二次破产,于2026年5月2日全面停运,导致1.7万名员工失业及大量旅客滞留。该公司曾与特朗普政府谈判5亿美元纾困方案,但因关键债权人反对而失败。受伊朗战争导致油价飙升影响,这家廉价航空先驱最终无法维持运营。已购票旅客将获得退款,但其他航空公司已对受影响乘客实施票价上限,以缓解冲击。


21. 无符号尺寸:五年的错误

🔗 c3-lang.org: Unsigned Sizes: A Five Year Mistake

🔥: 68 | 💬: 74 | 🗓️ 2026-05-02


C3语言决定默认使用有符号整数表示尺寸和长度。无符号整数虽然看似“更正确”,却隐藏着无限循环、比较错误和难以察觉的算术陷阱。特别是取模运算中,无符号与有符号混合会导致意外结果。作者指出,无符号的边界(0和4亿)比有符号(±20亿)更危险,且其溢出常产生看似合理却错误的数值。最终,C3转向有符号优先,移除了隐式转换,使代码更简洁、更易推理,并重命名类型为sz以强调其首选地位。


22. MLJAR Studio:本地AI数据分析工具,自动保存分析为笔记本

🔗 mljar.com: Show HN: Mljar Studio – local AI data analyst that saves analysis as notebooks

🔥: 62 | 💬: 10 | 🗓️ 2026-05-02


MLJAR Studio是一款完全本地化的AI数据分析工具,无需云端即可用自然语言与数据对话、自动运行机器学习实验。它确保数据不离开电脑,所有代码可见且可复现。用户可通过AI助手探索数据、自动调优模型,并将分析一键转为交互式网页应用。适用于数据科学家、分析师及处理敏感数据的研究团队,提供隐私、控制与真实Python环境。支持本地LLM,无外部API依赖。


23. 美国新手机网络为基督徒屏蔽色情与性别内容

🔗 technologyreview.com: New US phone network for Christians to block porn and gender-related content

🔥: 60 | 💬: 108 | 🗓️ 2026-05-02


美国即将推出一款面向基督徒的手机网络,其核心特点是网络级屏蔽,强制封锁所有色情内容,且成人用户也无法关闭。该网络还默认开启针对“性与性别”相关内容的可选过滤器,旨在屏蔽涉及跨性别等议题的材料。该服务由虚拟运营商Radiant Mobile运营,租用T-Mobile网络,其创始人称此举是为了创造“以耶稣为中心”的网络环境。专家指出,这种不可移除的网络级屏蔽在美国手机套餐中尚属首次,但技术手段较为粗糙,可能导致对合法内容的过度封锁。


24. 现代C++编程课程(Busato)

🔗 github.com: Modern C++ Programming: Busato

🔥: 58 | 💬: 6 | 🗓️ 2026-05-02


这是一份免费开源的C++编程课程,覆盖C++03至C++26标准。课程包含29讲、2000多张幻灯片,面向已熟悉C语言和面向对象编程的学习者。内容涵盖基础到高级语义,并涉及代码优化、调试、项目组织等实用主题。课程基于作者实际工程经验,提供简洁的代码示例,并持续更新。


25. Agent 工具环应置于沙箱之外

🔗 mendral.com: The agent harness belongs outside the sandbox

🔥: 58 | 💬: 49 | 🗓️ 2026-05-02


Agent 工具环是驱动LLM的核心循环:发送提示、获取响应、执行工具调用、反馈结果,直至模型完成。其运行位置有两种架构:工具环在沙箱内(如本地运行Claude Code)或工具环在沙箱外(通过API调用沙箱)。后者优势显著:凭证与沙箱隔离,无权限泄露风险;可挂起闲置沙箱,仅需25ms冷启动恢复;沙箱成为可替换的“牲畜”,崩溃时自动重建;多用户场景下,记忆与技能通过共享数据库而非分布式文件系统管理。为此需解决三个问题:持久化执行(使用Inngest实现断点续传)、沙箱生命周期(Blaxel实现25ms恢复)、文件系统虚拟化(将路径映射到数据库或沙箱,保持模型训练过的API接口)。挑战包括:新能力需适配、Bash绕过虚拟层、多会话一致性采用最后写入者胜策略。


Image

勒西科技日报

这是一份给聪明人的科技日报,每天推送一篇。内容来自各大英文网站,提供中文摘要。

Back to Overview