1. Claude Opus 4.8 发布:更智能、更诚实的AI协作升级;
  2. 乐高收藏家20万美元藏品遭Bricks and Minifigs侵占;
  3. 前沿大语言模型在事实核查上存在严重分歧;
  4. 加州大学教职员工要求恢复STEM入学SAT考试;
  5. AMD对Linux用户“钓鱼”式收费:Vivado免费版不再支持Linux;

以上是今天的前五条黑科技新闻标题。

总共25条,具体内容您往下读…

1. Claude Opus 4.8 发布:更智能、更诚实的AI协作升级

🔗 anthropic.com: Claude Opus 4.8

🔥🔥: 1188 | 💬: 958 | 🗓️ 2026-05-28


Anthropic推出Claude Opus 4.8,在编码、代理能力和推理等基准测试上全面超越前代,且价格不变。新版本显著提升了诚实性——模型更主动识别自身不确定性,代码缺陷遗漏率降低约四倍。同时引入动态工作流功能,支持并行运行数百个子代理处理大规模任务;新增“努力控制”选项,用户可调节模型思考深度以平衡速度与质量。早期测试者反馈,Opus 4.8在代理任务中判断更可靠,工具调用更高效,并能更好地保持长会话中的上下文一致性。


2. 乐高收藏家20万美元藏品遭Bricks and Minifigs侵占

🔗 mybricklog.com: Bricks and Minifigs Stole a Man’s $200k Lego Collection

🔥🔥: 555 | 💬: 310 | 🗓️ 2026-05-28


一名男子价值20万美元的乐高收藏被Bricks and Minifigs公司侵占。该收藏包含数千套稀有套装,公司以代售名义接收后拒绝归还,涉嫌欺诈。受害者已起诉,指控其非法占有并转售藏品。此案引发乐高社区对二手市场信任危机的广泛讨论。


3. 前沿大语言模型在事实核查上存在严重分歧

🔗 lenz.io: Disagreement among frontier LLMs on real-world fact-checks

🔥🔥: 484 | 💬: 334 | 🗓️ 2026-05-28


对1000个真实世界事实核查声明的分析显示,67%的案例中,五个前沿模型(GPT-5.4、Claude Opus 4.7、Gemini 3 Pro等)未能达成一致,至少有一个模型持异议。更严重的是,34%的案例存在实质性分歧(如“真”与“假”的对立),而非仅仅是细微校准差异。模型间最高一致性仅为75%(Gemini系列),最低仅53%。这表明,前沿模型在事实判断上远非可靠,其多数意见也不等同于真相。


4. 加州大学教职员工要求恢复STEM入学SAT考试

🔗 latimes.com: Citing ‘severe’ math deficits, UC faculty demand a return to SAT tests for STEM

🔥🔥: 389 | 💬: 587 | 🗓️ 2026-05-28


超过600名加州大学教职员工呼吁恢复SAT或ACT考试要求,理由是六年无考试招生导致数学能力严重不足,教授需重教中学数学。批评者认为SAT存在不公平,但支持者称其能更好预测学生成功。系统领导表示正在听取意见,学术委员会计划讨论改革路线图。


5. AMD对Linux用户“钓鱼”式收费:Vivado免费版不再支持Linux

🔗 itsfoss.com: AMD pulls a bait-and-switch on Linux users with Vivado licensing changes

🔥🔥: 329 | 💬: 154 | 🗓️ 2026-05-28


AMD宣布从2026.1版本起,其FPGA设计套件Vivado将改为分层许可模式。免费Basic版仅限Windows,Linux支持被锁定在每年1200-1800美元的Core付费版中。AMD声称这是“更灵活的许可”,但论坛管理员建议用户留在旧版,并称70%用户使用Windows。此举被批评为对Linux社区的背弃,尤其伤害依赖原生Linux工作流程的学生和研究人员。社区已在论坛和Hacker News上表达强烈不满。


6. 欧盟对Temu处以2亿欧元罚款,因其平台销售危险婴儿玩具和故障充电器等非法产品。

🔗 bbc.co.uk: EU fines Temu €200M for allowing sale of illegal products

🔥🔥: 303 | 💬: 230 | 🗓️ 2026-05-28


欧盟委员会认定Temu未能履行《数字服务法》规定的“系统性风险评估”义务,并责令其提交整改计划。Temu回应称罚款“不成比例”,正考虑法律选项。英国消费者组织Which?呼吁英国政府效仿欧盟,让在线平台对危险产品承担法律责任。


7. 在Postgres上构建持久化工作流

🔗 dbos.dev: Building durable workflows on Postgres

🔥🔥: 258 | 💬: 106 | 🗓️ 2026-05-28


本文主张用数据库自身替代外部编排器(如Temporal)来实现持久化工作流。核心思路是:应用程序服务器直接与Postgres通信,通过轮询工作流表来协同执行任务,并将每一步的进度检查点写入数据库。这种方式消除了中央编排器这一单点故障,使系统的扩展性、可用性、可观测性和安全性都能直接利用Postgres成熟的解决方案(如流复制、SQL查询和访问控制)。最终,持久化工作流变得更简单、更可靠,且无需引入额外的基础设施。


8. 纽约通过“第二套房税”填补预算缺口

🔗 cnbc.com: New York passes pied-a-terre tax

🔥🔥: 254 | 💬: 405 | 🗓️ 2026-05-28


纽约州议会通过针对非主要住宅的“第二套房税”,旨在帮助纽约市填补预算缺口。该税将分两阶段实施:2026-2028年,对估值超100万美元的公寓征收4%至6.5%的年度税;2028年后,基于可比销售调整估值,税率降至0.8%至1.3%。预计此举将带来5亿美元收入。Citadel CEO 肯·格里芬因市长在其豪宅前宣布该税而成为焦点,其房产税单将增加两倍以上,引发富人不满。专家指出,尽管税率看似高昂,但纽约市长期低估房产价值,实际税负可能低于预期。


9. Anthropic 完成 9650 亿美元估值的 650 亿美元 H 轮融资

🔗 anthropic.com: Anthropic raises $65B in Series H funding at $965B post-money valuation

🔥🔥: 249 | 💬: 241 | 🗓️ 2026-05-28


Anthropic 宣布完成 650 亿美元 Series H 融资,由 Altimeter Capital 等领投,公司估值达 9650 亿美元。本轮资金将用于推进 安全与可解释性研究、扩大算力以满足 Claude 的强劲需求,并扩展产品与合作伙伴关系。目前,Claude 的年化收入已突破 470 亿美元,并成为首个登陆全球三大云平台的前沿模型。战略合作伙伴包括 Micron、Samsung 和 SK hynix,同时与 Amazon、Google 及 SpaceX 签署了大规模算力协议。


10. 各种LLM气味

🔗 shvbsle.in: Various LLM Smells

🔥🔥: 207 | 💬: 156 | 🗓️ 2026-05-28


作者发现,使用LLM润色文章三个月后,其特有的句子结构表达模式(如过多“点睛之笔”、连续短句、“X是Y的Z”句式)已泛滥全网,形成可识别的“AI气味”。此外,AI生成的网站也呈现统一视觉特征,如特定字体、按钮和卡片样式。作者并非反对AI,而是记录这一现象。


11. AI末日预言被CEO们撤回:Altman与Amodei承认误判

🔗 fortune.com: Sam Altman and Dario Amodei are both walking back AI jobs apocalypse predictions

🔥🔥: 176 | 💬: 145 | 🗓️ 2026-05-28


OpenAI CEO Sam Altman和Anthropic CEO Dario Amodei曾警告AI将摧毁白领就业,如今双双承认错误。Altman表示对“入门级白领岗位被淘汰”的预测“相当错误”,并称人际互动无法外包给AI。Amodei则修正观点,认为自动化不会消灭工作,而是成为“产出倍增器”,让员工专注于剩余10%的任务并提升效率。高盛CEO David Solomon始终反对恐慌,指出美国就业自1962年增长145%,AI如历史技术革命般将创造新岗位。数据显示,尽管科技裁员超11.5万,但高AI暴露岗位的失业率未显著变化。经济学家引用杰文斯悖论解释:AI降低成本反而扩大需求,如呼叫中心和放射科岗位不减反增。


12. 从宿舍起家,我做出了百万美元的产品

🔗 nick.winans.io: I made a million dollar product from my dorm room (2025)

🔥🔥: 165 | 💬: 18 | 🗓️ 2026-05-28


作者在大学宿舍设计出nice!nano无线微控制器,解决了DIY键盘无线化痛点。经历从原型失败、开源社区协作到ZMK固件诞生,产品销量突破5万件,销售额超百万美元。虽遭遇克隆与供应链压力,但凭借创新与家庭支持,最终创立了Typeractive键盘商店,成为行业领先者。


13. GitHub封禁发布Windows零日漏洞的安全研究员

🔗 tomshardware.com: GitHub bans security researcher who posted zero-day Windows exploits

🔥🔥: 144 | 💬: 63 | 🗓️ 2026-05-28


安全研究员Nightmare-Eclipse因发布Windows零日漏洞被GitHub封号,转投GitLab。其与微软的纠纷源于未收到漏洞赏金,并威胁在7月14日公布更多漏洞。专家批评微软解雇资深人员,导致流程僵化。此举被指无助于安全,因漏洞代码已公开。


14. Claude Code 推出动态工作流,可将季度计划缩短至数天完成

🔗 claude.com: Dynamic Workflows in Claude Code

🔥🔥: 138 | 💬: 112 | 🗓️ 2026-05-28


Claude Code 引入动态工作流功能,能自动编写编排脚本,在单次会话中并行运行数十至数百个子代理,并在交付前自动核查结果。该功能适用于大规模代码迁移、跨服务漏洞排查及安全审计等复杂任务。早期用户已用其将Bun从Zig重写为Rust,十一天内完成约75万行代码的移植。动态工作流支持中断恢复,但会消耗更多Token,建议从限定任务开始体验。


15. 《细抠《创:战纪》中的命令行历史场景》

🔗 chiark.greenend.org.uk: Nitpicking the shell history scene in ‘Tron: Legacy’

🔥🔥: 133 | 💬: 55 | 🗓️ 2026-05-28


作者Simon Tatham在2010年电影《创:战纪》中发现了一个几乎真实的Unix shell会话,主角Sam Flynn通过输入命令查看父亲的工作记录。作者将其作为教学案例,与同事花了一整天分析屏幕截图中的细节。他们发现了多处技术错误:例如bin/history命令而非内置history命令,暗示了电影制作方的伪造手法;uname -a输出的“SolarOS”混合了SunOS和Solaris,且同时出现sun4mi386属于硬件标识矛盾;左侧窗口的topiostat输出更接近Linux风格而非Solaris。此外,backdoor账户与root共享UID(用户ID),以及/proc/meminfo的存在进一步暴露了系统不一致性。作者最终对制作方的细节努力表示赞赏,尽管存在这些“吹毛求疵”的发现。


16. Rust 1.96 稳定版发布:新增可复制范围类型与断言宏

🔗 blog.rust-lang.org: Announcing Rust 1.96

🔥🔥: 105 | 💬: 12 | 🗓️ 2026-05-28


Rust 1.96.0 正式发布,主要亮点包括:引入新的 Range 类型(如 core::range::Range),它们实现 IntoIterator 而非 Iterator,因此支持 Copy 特性,方便存储切片访问器;新增 assert_matches!debug_assert_matches!,用于模式匹配断言并打印失败值;WebAssembly 目标默认不再传递 --allow-undefined,未定义符号将导致链接错误。此外,该版本修复了两个关于第三方注册表的安全漏洞,并稳定了多项 API。


17. 《阻止警方车牌识别系统的法案被悄然否决》

🔗 ipvm.com: Legislation Killed Would Have Effectively Blocked Police LPR, Including Flock

🔥: 97 | 💬: 60 | 🗓️ 2026-05-28


一项由两党议员共同提出的修正案(221号)在众议院委员会中被否决,该修正案本可通过切断联邦高速公路资金,有效禁止全国警方使用车牌识别系统(LPR),对Flock公司的核心执法业务构成生存威胁。尽管修正案已列入议程,但在长达14小时的听证会上未获任何实质讨论即被投票否决。值得注意的是,修正案的民主党共同提案人加西亚的前幕僚长目前正是Flock的注册说客,而加西亚本人未在听证会上为该修正案发言。此举暴露了Flock迅速扩张的游说影响力,但反对LPR的政治力量已上升至更高层面。


18. 开源孤岛:一位开发者与匿名文化、偏见和体制的缠斗

🔗 justine.lol: Social Animus

🔥: 76 | 💬: 33 | 🗓️ 2026-05-28


作者在开源社区因缺乏筛选机制而遭遇匿名攻击抄袭指控,甚至引发健康问题。他通过Cosmopolitan Libcllamafile项目取得技术成功,却因跨性别身份被谷歌解雇,并持续面临税务与社区排斥。最终,他反思技术赋权与知识传播的永恒代价。


19. Zig日活动应限制大语言模型讨论与使用

🔗 kristoff.it: About LLMs at Zig Days

🔥: 68 | 💬: 63 | 🗓️ 2026-05-28


Zig Day是以协作编程为核心的社区活动,旨在培养系统思维与对软件工程的热爱。作者建议主动限制关于大语言模型的讨论,因为这类话题常占据过多时间,挤占了交流数据结构、算法等宝贵内容的机会。同时,鼓励手动编码,优先向现场同伴求助而非依赖AI,以免失去学习机会与人际互动。组织者应在活动开始时明确这一导向,但不必极端禁止,以保护Zig Day独特的社群价值。


20. 谷歌恨你

🔗 sfgate.com: Google Hates You

🔥: 67 | 💬: 40 | 🗓️ 2026-05-28


这篇文章控诉谷歌搜索质量下滑,并批评其2026年转向AI优先的策略。作者认为,谷歌用AI摘要取代传统链接,扼杀了外部网站的流量,威胁到新闻业和小企业的生存。他呼吁将谷歌分拆,并指出用户正转向DuckDuckGo等更纯粹的搜索工具。


21. Creusot:用形式化方法验证 Rust 代码正确性

🔗 github.com: Creusot helps you prove your Rust code is correct

🔥: 66 | 💬: 8 | 🗓️ 2026-05-28


Creusot 是一款演绎验证器,可确保 Rust 代码无恐慌、无溢出及断言失败。通过添加注解,用户能进一步验证代码行为是否符合预期。它先将 Rust 代码翻译为 Why3 平台的中间语言 Coma,再借助 Why3 自动验证条件。项目基于 LGPL-2.1 许可,提供安装指南与开发文档,并附有示例(如二分查找、向量排序)及大型验证项目 CreuSAT。


22. Endive:JVM原生WebAssembly运行时

🔗 github.com: Endive: A JVM native WebAssembly runtime

🔥: 56 | 💬: 15 | 🗓️ 2026-05-28


Endive是一个纯Java实现的WebAssembly运行时,无需任何原生依赖或JNI,可在任何支持JVM的环境中运行Wasm程序。它源于Chicory项目,专注于安全性和简洁性,旨在成为JVM上Wasm的默认运行时。核心优势在于解决了原生运行时在分发运行时安全上的痛点,让Java库无需捆绑多平台原生代码,同时保留JVM的内存与安全保证。项目已支持核心Wasm规范、SIMD、异常处理等多项特性,并持续优化性能与WASIp2支持。


23. ktx:面向数据代理的开源上下文层

🔗 github.com: Show HN: Ktx – Open-source executable context layer for data agents

🔥: 52 | 💬: 12 | 🗓️ 2026-05-28


ktx是一个自改进的上下文层,它能自动学习公司知识、映射数据栈并构建语义层,让代理(如Claude Code)使用已批准的指标定义准确查询数据仓库。它解决了通用代理在数据任务中重新探索仓库、发明指标逻辑的问题,也避免了传统语义层需要手动维护的缺陷。ktx支持PostgreSQL、Snowflake等数据库,集成dbt、Notion等工具,通过CLI和MCP工具提供服务,且设计为只读模式保障数据安全。


24. 机器人公司租用Airbnb测试原型机,却把房子搞得一团糟

🔗 sfstandard.com: Bot Company allegedly trashing Airbnb rentals with their prototype robots

🔥: 47 | 💬: 8 | 🗓️ 2026-05-28


旧金山一家名为Bot Company的初创公司被指控秘密租用Airbnb房源,用于测试其家用机器人原型,结果导致多处房产严重受损。房主Sean Donovan发现,租客搬入大型黑箱后,屋内出现划痕、物品丢失,甚至安全系统被关闭。他起诉该公司索赔1.2万美元,并指出至少12位其他房东也遭遇类似破坏,包括橱柜刮伤、家具损坏等。该公司由特斯拉和Cruise前员工创立,估值20亿美元,但尚未公开回应。房主们表示,若公司坦诚租赁目的,他们本可同意,但“欺骗行为”令人愤怒。


25. AI自动化所有认知劳动的时间线预测

🔗 futuresearch.ai: How long until AI automates all cognitive labor?

🔥: 45 | 💬: 78 | 🗓️ 2026-05-28


该文追踪了多位AI研究者对AGI(通用人工智能)实现时间的预测变化。从2023年到2025年,多数人认为AGI会更快到来;但在2025年至2026年初,包括Metaculus社区和Dario Amodei在内的预测者将时间线推后。然而,从2026年1月到4月,所有更新预测的人都再次将时间线提前。作者总结为“ChatGPT时代”人们认为AI更快,“xAI、Meta、Gemini时代”认为更晚,而“Anthropic时代”又认为更快。核心定义是“大多数纯认知劳动能以优于人类的质量、速度和成本实现自动化”。


Image

勒西科技日报

这是一份给聪明人的科技日报,每天推送一篇。内容来自各大英文网站,提供中文摘要。

Back to Overview