勒西科技日报

Claude Opus 4.8 发布：更智能、更诚实的AI协作升级；
乐高收藏家20万美元藏品遭Bricks and Minifigs侵占；
前沿大语言模型在事实核查上存在严重分歧；
加州大学教职员工要求恢复STEM入学SAT考试；
AMD对Linux用户“钓鱼”式收费：Vivado免费版不再支持Linux；

以上是今天的前五条黑科技新闻标题。

总共25条，具体内容您往下读…

1. Claude Opus 4.8 发布：更智能、更诚实的AI协作升级

🔗 anthropic.com: Claude Opus 4.8

🔥🔥: 1188 | 💬: 958 | 🗓️ 2026-05-28

Anthropic推出Claude Opus 4.8，在编码、代理能力和推理等基准测试上全面超越前代，且价格不变。新版本显著提升了诚实性——模型更主动识别自身不确定性，代码缺陷遗漏率降低约四倍。同时引入动态工作流功能，支持并行运行数百个子代理处理大规模任务；新增“努力控制”选项，用户可调节模型思考深度以平衡速度与质量。早期测试者反馈，Opus 4.8在代理任务中判断更可靠，工具调用更高效，并能更好地保持长会话中的上下文一致性。

2. 乐高收藏家20万美元藏品遭Bricks and Minifigs侵占

🔗 mybricklog.com: Bricks and Minifigs Stole a Man’s $200k Lego Collection

🔥🔥: 555 | 💬: 310 | 🗓️ 2026-05-28

一名男子价值20万美元的乐高收藏被Bricks and Minifigs公司侵占。该收藏包含数千套稀有套装，公司以代售名义接收后拒绝归还，涉嫌欺诈。受害者已起诉，指控其非法占有并转售藏品。此案引发乐高社区对二手市场信任危机的广泛讨论。

3. 前沿大语言模型在事实核查上存在严重分歧

🔗 lenz.io: Disagreement among frontier LLMs on real-world fact-checks

🔥🔥: 484 | 💬: 334 | 🗓️ 2026-05-28

对1000个真实世界事实核查声明的分析显示，67%的案例中，五个前沿模型（GPT-5.4、Claude Opus 4.7、Gemini 3 Pro等）未能达成一致，至少有一个模型持异议。更严重的是，34%的案例存在实质性分歧（如“真”与“假”的对立），而非仅仅是细微校准差异。模型间最高一致性仅为75%（Gemini系列），最低仅53%。这表明，前沿模型在事实判断上远非可靠，其多数意见也不等同于真相。

4. 加州大学教职员工要求恢复STEM入学SAT考试

🔗 latimes.com: Citing ‘severe’ math deficits, UC faculty demand a return to SAT tests for STEM

🔥🔥: 389 | 💬: 587 | 🗓️ 2026-05-28

超过600名加州大学教职员工呼吁恢复SAT或ACT考试要求，理由是六年无考试招生导致数学能力严重不足，教授需重教中学数学。批评者认为SAT存在不公平，但支持者称其能更好预测学生成功。系统领导表示正在听取意见，学术委员会计划讨论改革路线图。

5. AMD对Linux用户“钓鱼”式收费：Vivado免费版不再支持Linux

🔗 itsfoss.com: AMD pulls a bait-and-switch on Linux users with Vivado licensing changes

🔥🔥: 329 | 💬: 154 | 🗓️ 2026-05-28

AMD宣布从2026.1版本起，其FPGA设计套件Vivado将改为分层许可模式。免费Basic版仅限Windows，Linux支持被锁定在每年1200-1800美元的Core付费版中。AMD声称这是“更灵活的许可”，但论坛管理员建议用户留在旧版，并称70%用户使用Windows。此举被批评为对Linux社区的背弃，尤其伤害依赖原生Linux工作流程的学生和研究人员。社区已在论坛和Hacker News上表达强烈不满。

6. 欧盟对Temu处以2亿欧元罚款，因其平台销售危险婴儿玩具和故障充电器等非法产品。

🔗 bbc.co.uk: EU fines Temu €200M for allowing sale of illegal products

🔥🔥: 303 | 💬: 230 | 🗓️ 2026-05-28

欧盟委员会认定Temu未能履行《数字服务法》规定的“系统性风险评估”义务，并责令其提交整改计划。Temu回应称罚款“不成比例”，正考虑法律选项。英国消费者组织Which?呼吁英国政府效仿欧盟，让在线平台对危险产品承担法律责任。

7. 在Postgres上构建持久化工作流

🔗 dbos.dev: Building durable workflows on Postgres

🔥🔥: 258 | 💬: 106 | 🗓️ 2026-05-28

本文主张用数据库自身替代外部编排器（如Temporal）来实现持久化工作流。核心思路是：应用程序服务器直接与Postgres通信，通过轮询工作流表来协同执行任务，并将每一步的进度检查点写入数据库。这种方式消除了中央编排器这一单点故障，使系统的扩展性、可用性、可观测性和安全性都能直接利用Postgres成熟的解决方案（如流复制、SQL查询和访问控制）。最终，持久化工作流变得更简单、更可靠，且无需引入额外的基础设施。

8. 纽约通过“第二套房税”填补预算缺口

🔗 cnbc.com: New York passes pied-a-terre tax

🔥🔥: 254 | 💬: 405 | 🗓️ 2026-05-28

纽约州议会通过针对非主要住宅的“第二套房税”，旨在帮助纽约市填补预算缺口。该税将分两阶段实施：2026-2028年，对估值超100万美元的公寓征收4%至6.5%的年度税；2028年后，基于可比销售调整估值，税率降至0.8%至1.3%。预计此举将带来5亿美元收入。Citadel CEO 肯·格里芬因市长在其豪宅前宣布该税而成为焦点，其房产税单将增加两倍以上，引发富人不满。专家指出，尽管税率看似高昂，但纽约市长期低估房产价值，实际税负可能低于预期。

9. Anthropic 完成 9650 亿美元估值的 650 亿美元 H 轮融资

🔗 anthropic.com: Anthropic raises $65B in Series H funding at $965B post-money valuation

🔥🔥: 249 | 💬: 241 | 🗓️ 2026-05-28

Anthropic 宣布完成 650 亿美元 Series H 融资，由 Altimeter Capital 等领投，公司估值达 9650 亿美元。本轮资金将用于推进 安全与可解释性研究、扩大算力以满足 Claude 的强劲需求，并扩展产品与合作伙伴关系。目前，Claude 的年化收入已突破 470 亿美元，并成为首个登陆全球三大云平台的前沿模型。战略合作伙伴包括 Micron、Samsung 和 SK hynix，同时与 Amazon、Google 及 SpaceX 签署了大规模算力协议。

10. 各种LLM气味

🔗 shvbsle.in: Various LLM Smells

🔥🔥: 207 | 💬: 156 | 🗓️ 2026-05-28

作者发现，使用LLM润色文章三个月后，其特有的句子结构和表达模式（如过多“点睛之笔”、连续短句、“X是Y的Z”句式）已泛滥全网，形成可识别的“AI气味”。此外，AI生成的网站也呈现统一视觉特征，如特定字体、按钮和卡片样式。作者并非反对AI，而是记录这一现象。

11. AI末日预言被CEO们撤回：Altman与Amodei承认误判

🔗 fortune.com: Sam Altman and Dario Amodei are both walking back AI jobs apocalypse predictions

🔥🔥: 176 | 💬: 145 | 🗓️ 2026-05-28

OpenAI CEO Sam Altman和Anthropic CEO Dario Amodei曾警告AI将摧毁白领就业，如今双双承认错误。Altman表示对“入门级白领岗位被淘汰”的预测“相当错误”，并称人际互动无法外包给AI。Amodei则修正观点，认为自动化不会消灭工作，而是成为“产出倍增器”，让员工专注于剩余10%的任务并提升效率。高盛CEO David Solomon始终反对恐慌，指出美国就业自1962年增长145%，AI如历史技术革命般将创造新岗位。数据显示，尽管科技裁员超11.5万，但高AI暴露岗位的失业率未显著变化。经济学家引用杰文斯悖论解释：AI降低成本反而扩大需求，如呼叫中心和放射科岗位不减反增。

12. 从宿舍起家，我做出了百万美元的产品

🔗 nick.winans.io: I made a million dollar product from my dorm room (2025)

🔥🔥: 165 | 💬: 18 | 🗓️ 2026-05-28

作者在大学宿舍设计出nice!nano无线微控制器，解决了DIY键盘无线化痛点。经历从原型失败、开源社区协作到ZMK固件诞生，产品销量突破5万件，销售额超百万美元。虽遭遇克隆与供应链压力，但凭借创新与家庭支持，最终创立了Typeractive键盘商店，成为行业领先者。

13. GitHub封禁发布Windows零日漏洞的安全研究员

🔗 tomshardware.com: GitHub bans security researcher who posted zero-day Windows exploits

🔥🔥: 144 | 💬: 63 | 🗓️ 2026-05-28

安全研究员Nightmare-Eclipse因发布Windows零日漏洞被GitHub封号，转投GitLab。其与微软的纠纷源于未收到漏洞赏金，并威胁在7月14日公布更多漏洞。专家批评微软解雇资深人员，导致流程僵化。此举被指无助于安全，因漏洞代码已公开。

14. Claude Code 推出动态工作流，可将季度计划缩短至数天完成

🔗 claude.com: Dynamic Workflows in Claude Code

🔥🔥: 138 | 💬: 112 | 🗓️ 2026-05-28

Claude Code 引入动态工作流功能，能自动编写编排脚本，在单次会话中并行运行数十至数百个子代理，并在交付前自动核查结果。该功能适用于大规模代码迁移、跨服务漏洞排查及安全审计等复杂任务。早期用户已用其将Bun从Zig重写为Rust，十一天内完成约75万行代码的移植。动态工作流支持中断恢复，但会消耗更多Token，建议从限定任务开始体验。

15. 《细抠《创：战纪》中的命令行历史场景》

🔗 chiark.greenend.org.uk: Nitpicking the shell history scene in ‘Tron: Legacy’

🔥🔥: 133 | 💬: 55 | 🗓️ 2026-05-28

作者Simon Tatham在2010年电影《创：战纪》中发现了一个几乎真实的Unix shell会话，主角Sam Flynn通过输入命令查看父亲的工作记录。作者将其作为教学案例，与同事花了一整天分析屏幕截图中的细节。他们发现了多处技术错误：例如bin/history命令而非内置history命令，暗示了电影制作方的伪造手法；uname -a输出的“SolarOS”混合了SunOS和Solaris，且同时出现sun4m和i386属于硬件标识矛盾；左侧窗口的top和iostat输出更接近Linux风格而非Solaris。此外，backdoor账户与root共享UID（用户ID），以及/proc/meminfo的存在进一步暴露了系统不一致性。作者最终对制作方的细节努力表示赞赏，尽管存在这些“吹毛求疵”的发现。

16. Rust 1.96 稳定版发布：新增可复制范围类型与断言宏

🔗 blog.rust-lang.org: Announcing Rust 1.96

🔥🔥: 105 | 💬: 12 | 🗓️ 2026-05-28

Rust 1.96.0 正式发布，主要亮点包括：引入新的 Range 类型（如 core::range::Range），它们实现 IntoIterator 而非 Iterator，因此支持 Copy 特性，方便存储切片访问器；新增 assert_matches! 和 debug_assert_matches! 宏，用于模式匹配断言并打印失败值；WebAssembly 目标默认不再传递 --allow-undefined，未定义符号将导致链接错误。此外，该版本修复了两个关于第三方注册表的安全漏洞，并稳定了多项 API。

17. 《阻止警方车牌识别系统的法案被悄然否决》

🔗 ipvm.com: Legislation Killed Would Have Effectively Blocked Police LPR, Including Flock

🔥: 97 | 💬: 60 | 🗓️ 2026-05-28

一项由两党议员共同提出的修正案（221号）在众议院委员会中被否决，该修正案本可通过切断联邦高速公路资金，有效禁止全国警方使用车牌识别系统（LPR），对Flock公司的核心执法业务构成生存威胁。尽管修正案已列入议程，但在长达14小时的听证会上未获任何实质讨论即被投票否决。值得注意的是，修正案的民主党共同提案人加西亚的前幕僚长目前正是Flock的注册说客，而加西亚本人未在听证会上为该修正案发言。此举暴露了Flock迅速扩张的游说影响力，但反对LPR的政治力量已上升至更高层面。

18. 开源孤岛：一位开发者与匿名文化、偏见和体制的缠斗

🔗 justine.lol: Social Animus

🔥: 76 | 💬: 33 | 🗓️ 2026-05-28

作者在开源社区因缺乏筛选机制而遭遇匿名攻击与抄袭指控，甚至引发健康问题。他通过Cosmopolitan Libc和llamafile项目取得技术成功，却因跨性别身份被谷歌解雇，并持续面临税务与社区排斥。最终，他反思技术赋权与知识传播的永恒代价。

19. Zig日活动应限制大语言模型讨论与使用

🔗 kristoff.it: About LLMs at Zig Days

🔥: 68 | 💬: 63 | 🗓️ 2026-05-28

Zig Day是以协作编程为核心的社区活动，旨在培养系统思维与对软件工程的热爱。作者建议主动限制关于大语言模型的讨论，因为这类话题常占据过多时间，挤占了交流数据结构、算法等宝贵内容的机会。同时，鼓励手动编码，优先向现场同伴求助而非依赖AI，以免失去学习机会与人际互动。组织者应在活动开始时明确这一导向，但不必极端禁止，以保护Zig Day独特的社群价值。

20. 谷歌恨你

🔗 sfgate.com: Google Hates You

🔥: 67 | 💬: 40 | 🗓️ 2026-05-28

这篇文章控诉谷歌搜索质量下滑，并批评其2026年转向AI优先的策略。作者认为，谷歌用AI摘要取代传统链接，扼杀了外部网站的流量，威胁到新闻业和小企业的生存。他呼吁将谷歌分拆，并指出用户正转向DuckDuckGo等更纯粹的搜索工具。

21. Creusot：用形式化方法验证 Rust 代码正确性

🔗 github.com: Creusot helps you prove your Rust code is correct

🔥: 66 | 💬: 8 | 🗓️ 2026-05-28

Creusot 是一款演绎验证器，可确保 Rust 代码无恐慌、无溢出及断言失败。通过添加注解，用户能进一步验证代码行为是否符合预期。它先将 Rust 代码翻译为 Why3 平台的中间语言 Coma，再借助 Why3 自动验证条件。项目基于 LGPL-2.1 许可，提供安装指南与开发文档，并附有示例（如二分查找、向量排序）及大型验证项目 CreuSAT。

22. Endive：JVM原生WebAssembly运行时

🔗 github.com: Endive: A JVM native WebAssembly runtime

🔥: 56 | 💬: 15 | 🗓️ 2026-05-28

Endive是一个纯Java实现的WebAssembly运行时，无需任何原生依赖或JNI，可在任何支持JVM的环境中运行Wasm程序。它源于Chicory项目，专注于安全性和简洁性，旨在成为JVM上Wasm的默认运行时。核心优势在于解决了原生运行时在分发和运行时安全上的痛点，让Java库无需捆绑多平台原生代码，同时保留JVM的内存与安全保证。项目已支持核心Wasm规范、SIMD、异常处理等多项特性，并持续优化性能与WASIp2支持。

23. ktx：面向数据代理的开源上下文层

🔗 github.com: Show HN: Ktx – Open-source executable context layer for data agents

🔥: 52 | 💬: 12 | 🗓️ 2026-05-28

ktx是一个自改进的上下文层，它能自动学习公司知识、映射数据栈并构建语义层，让代理（如Claude Code）使用已批准的指标定义准确查询数据仓库。它解决了通用代理在数据任务中重新探索仓库、发明指标逻辑的问题，也避免了传统语义层需要手动维护的缺陷。ktx支持PostgreSQL、Snowflake等数据库，集成dbt、Notion等工具，通过CLI和MCP工具提供服务，且设计为只读模式保障数据安全。

24. 机器人公司租用Airbnb测试原型机，却把房子搞得一团糟

🔗 sfstandard.com: Bot Company allegedly trashing Airbnb rentals with their prototype robots

🔥: 47 | 💬: 8 | 🗓️ 2026-05-28

旧金山一家名为Bot Company的初创公司被指控秘密租用Airbnb房源，用于测试其家用机器人原型，结果导致多处房产严重受损。房主Sean Donovan发现，租客搬入大型黑箱后，屋内出现划痕、物品丢失，甚至安全系统被关闭。他起诉该公司索赔1.2万美元，并指出至少12位其他房东也遭遇类似破坏，包括橱柜刮伤、家具损坏等。该公司由特斯拉和Cruise前员工创立，估值20亿美元，但尚未公开回应。房主们表示，若公司坦诚租赁目的，他们本可同意，但“欺骗行为”令人愤怒。

25. AI自动化所有认知劳动的时间线预测

🔗 futuresearch.ai: How long until AI automates all cognitive labor?

🔥: 45 | 💬: 78 | 🗓️ 2026-05-28

该文追踪了多位AI研究者对AGI（通用人工智能）实现时间的预测变化。从2023年到2025年，多数人认为AGI会更快到来；但在2025年至2026年初，包括Metaculus社区和Dario Amodei在内的预测者将时间线推后。然而，从2026年1月到4月，所有更新预测的人都再次将时间线提前。作者总结为“ChatGPT时代”人们认为AI更快，“xAI、Meta、Gemini时代”认为更晚，而“Anthropic时代”又认为更快。核心定义是“大多数纯认知劳动能以优于人类的质量、速度和成本实现自动化”。

勒西科技日报 - 2026年05月28日