勒西科技日报

Claude 4重磅发布：新一代AI模型与开发者工具升级；
Mozilla将于2025年7月8日关闭Pocket服务；
特朗普政府暂停哈佛大学招收国际学生资格；
墙上挂了12年的分形图案；
行星着陆：从游戏地图到虚构星球的制图之旅；

以上是今天的前五条黑科技新闻标题。

总共25条，具体内容您往下读…

1. Claude 4重磅发布：新一代AI模型与开发者工具升级

🔥🔥: 1627 | 💬: 914 | 🗓️ 2025-05-22

Anthropic推出Claude Opus 4和Claude Sonnet 4，前者成为全球最强编程模型，支持长达数小时的复杂任务；后者显著提升代码与推理能力。新增扩展思考工具（Beta版），支持并行工具调用与本地文件记忆功能。Claude Code正式开放，集成VS Code/JetBrains，新增API支持代码执行与缓存。定价不变，Opus 4（$15/$75/百万token）和Sonnet 4（$3/$15）已登陆多平台。模型在SWE-bench等基准测试中领先，并优化了任务连贯性与安全性。

2. Mozilla将于2025年7月8日关闭Pocket服务

🔗 support.mozilla.org: Mozilla to shut down Pocket and Fakespot

🔥🔥: 887 | 💬: 554 | 🗓️ 2025-05-22

Mozilla宣布将于2025年7月8日正式关闭Pocket服务，用户可在此日期前继续使用应用和浏览器插件。10月8日前可导出保存内容，之后所有数据将被永久删除。Premium订阅用户将按比例自动退款。Pocket的API功能也将停止，相关产品需提前迁移数据。其精选内容服务将更名为“Ten Tabs”，由Firefox团队继续运营。关键时间点包括5月22日下架应用、7月8日服务终止及10月8日数据清除。

3. 特朗普政府暂停哈佛大学招收国际学生资格

🔗 nytimes.com: Trump administration halts Harvard’s ability to enroll international students

🔥🔥: 694 | 💬: 732 | 🗓️ 2025-05-22

美国特朗普政府7日宣布立即撤销哈佛大学的“学生与交流访问者计划”认证，禁止其招收或留用国际学生，此举旨在施压该校配合总统政策。哈佛约6800名国际生（占学生总数27%）可能面临转学或失去合法身份。该校此前已因课程和招生政策起诉政府，预计将再次发起法律挑战。国土安全部称此举与调查相关，但未透露细节。国际学生通常承担更高学费，此举或重创哈佛财政。事件仍在发展中。

4. 墙上挂了12年的分形图案

🔗 chriskw.xyz: That fractal that’s been up on my wall for years

🔥🔥: 356 | 💬: 26 | 🗓️ 2025-05-22

作者在中学时通过重复组合正方形的方式偶然发现了一种分形图案，并将其命名为“墙花”。该图案通过两种方法生成：一种是拖放复制法，另一种是L系统规则。研究发现，两种方法生成的图案因矩阵基不同而存在差异：拖放法使用负行列式矩阵（导致空间翻转），而L系统使用正行列式矩阵（保持连续旋转）。这一发现揭示了分形结构与线性代数的深层联系，并通过基数5的向量编码实现了空间填充。最终，作者通过数学推导解开了12年的谜题。

5. 行星着陆：从游戏地图到虚构星球的制图之旅

🔗 somethingaboutmaps.wordpress.com: Planetfall

🔥🔥: 322 | 💬: 89 | 🗓️ 2025-05-22

作者Daniel Huffman耗时三年，将1999年游戏《半人马座阿尔法星》中的像素化地图转化为高精度虚构星球地图。通过手动采集8192个格点的高程数据，结合降雨、岩石等属性，运用三角网插值和随机扰动技术生成逼真地形。项目揭示了虚构地图与真实制图的差异——前者需要”创造数据”而非仅处理现有数据。最终成果通过投影转换（圆柱等积投影）和人工修正（如环形山圆整化），呈现出比原游戏更细腻的Chiron星地表形态。

6. 提升rav1d视频解码器性能的探索

🔗 ohadravid.github.io: Improving performance of rav1d video decoder

🔥🔥: 265 | 💬: 91 | 🗓️ 2025-05-22

作者通过优化Rust版AV1解码器rav1d，使其在M3芯片的macOS上性能提升约1%。关键改进包括使用MaybeUninit避免不必要的缓冲区清零操作，以及调整内存分配策略。通过对比C语言原版dav1d的性能分析，作者发现零初始化是主要性能瓶颈之一。优化后，解码时间从73.9秒降至72.6秒，缩小了与C版本的差距。后续还可能针对add_temporal_candidate等函数进一步优化。

7. Defuddle：一款替代Readability的HTML转Markdown工具

🔗 github.com: Show HN: Defuddle, an HTML-to-Markdown alternative to Readability

🔥🔥: 205 | 💬: 38 | 🗓️ 2025-05-22

Defuddle 是一个用于提取网页主要内容的工具，能自动清除评论、侧边栏、页眉页脚等冗余元素，输出简洁的HTML或Markdown。专为Obsidian Web Clipper设计，支持数学公式解析和结构化元数据提取（如作者、发布时间等）。提供浏览器与Node.js版本，核心功能轻量且可扩展，适合需要高效内容抓取的场景。目前仍在开发中，但已获449星关注。

项目地址：kepano.github.io/defuddle/

8. Ruby 3.5 对象分配性能大幅提升

🔗 railsatscale.com: Fast Allocations in Ruby 3.5

🔥🔥: 200 | 💬: 45 | 🗓️ 2025-05-22

Ruby 3.5 通过内联 Class#new 方法显著加快了对象分配速度，最高可达 6.5 倍。优化核心在于用 opt_new 指令替代传统方法调用，消除参数复制和减少栈帧操作。测试显示，关键字参数的提速效果尤为明显，参数越多性能提升越显著。该改进同时优化了内联缓存命中率，避免了纯 Ruby 实现的高缓存失效问题。

9. 我为何亲手打造了一款音乐播放器

🔗 nexo.sh: I Built My Own Audio Player

🔥🔥: 198 | 💬: 101 | 🗓️ 2025-05-22

由于iPhone原生音乐应用功能受限且iCloud同步需付费，作者决定开发一款本地优先的播放器。采用SwiftUI+SQLite架构，实现了全文本搜索、iCloud文件夹扫描及元数据解析，避开了订阅模式与第三方依赖。开发中面临iOS沙盒限制，最终通过文件复制方案解决外置存储访问难题。该项目揭示了苹果生态对自主开发者的不友好，也证明了移动设备仍具备高度可定制性。

10. Flatpak的未来：机遇与挑战并存

🔗 lwn.net: The Future of Flatpak

🔥🔥: 194 | 💬: 89 | 🗓️ 2025-05-22

在2025年Linux应用峰会上，Sebastian Wick指出Flatpak虽在开发者与用户中广受欢迎，但项目开发已陷入停滞。核心开发者流失导致新功能审核缓慢，例如OCI镜像支持、权限细化（如--device=input）等改进长期搁置。此外，沙箱隔离存在缺陷（如嵌套沙箱不支持、网络命名空间安全隐患），且NVIDIA驱动兼容性问题加重用户负担。Wick呼吁社区关注门户（Portals）优化与驱动共享方案，以提升生态可持续性。尽管Flatpak功能稳定，但缺乏活跃开发恐阻碍其长期发展。

11. 副驾驶的幻觉

🔗 deplet.ing: The copilot delusion

🔥🔥: 192 | 💬: 144 | 🗓️ 2025-05-22

作者以辛辣的笔触批判AI编程助手（如GitHub Copilot）的局限性：看似高效实则危险，如同一个不读需求、乱改全局状态的菜鸟同事。它能快速生成语法正确的代码，却缺乏对系统、性能或边缘case的理解，像“高功能实习生”需要严格监督。开发者若过度依赖这类工具，将丧失对底层硬件的掌控力，代码质量退化。真正的编程应直面机器本质——缓存、内存、分支预测等细节才是性能关键，而AI无法理解这些。工具可用作脚手架，但绝不能替代思考。

12. SQLite JavaScript扩展：用JavaScript增强数据库功能

🔗 github.com: Show HN: SQLite JavaScript - extend your database with JavaScript

🔥🔥: 156 | 💬: 45 | 🗓️ 2025-05-22

这是一个名为SQLite-JS的开源扩展，允许开发者用JavaScript创建自定义SQLite函数，包括标量函数、聚合函数、窗口函数和排序规则。该工具支持跨平台（Linux/macOS/Windows/移动端），通过预编译二进制或源码集成，能直接在SQL查询中执行JavaScript代码。核心功能包括：动态计算字段（如年龄计算）、高级统计分析（如中位数/标准差），以及自定义文本排序。特别适合需要复杂业务逻辑处理的场景，所有函数可通过js_create_*系列命令快速注册，并支持在SQLite Cloud集群中自动同步。

13. MCP协议：简化AI应用集成的关键工具

🔗 blog.nilenso.com: MCP explained without hype or fluff

🔥🔥: 138 | 💬: 65 | 🗓️ 2025-05-22

MCP协议通过将复杂的M×N集成问题转化为M+N问题，降低AI应用与外部平台对接的难度。它包含MCP服务器（连接数据源并提供工具）和MCP客户端（集成到AI应用中），支持工具调用、提示模板、资源URI和采样等功能。作者以CKAN开放数据为例，演示如何快速构建MCP服务器，使Claude等客户端能直接访问和分析数据。虽然协议尚不成熟，但已有广泛采用，适合需要解耦的场景，但需权衡性能与灵活性成本。

14. 美国间谍机构打造“一站式”个人数据采购平台

🔗 theintercept.com: U.S. Spy Agencies–One-Stop Shop to Buy Your Personal Data

🔥🔥: 128 | 💬: 62 | 🗓️ 2025-05-22

美国情报机构正通过商业可用信息（CAI）绕过宪法第四修正案，大量购买原本需法庭令才能获取的敏感数据。为解决数据来源分散的问题，国家情报总监办公室（ODNI）计划建立名为“情报界数据联盟”（ICDC）的中央门户，整合手机广告定位、社交媒体内容等高敏感数据，并提供AI分析工具。批评者警告，此举将加剧隐私风险，尤其可能被移民执法等非情报机构滥用。尽管ODNI声称会保障公民自由，但文件显示其仍遵循“先收集再处理”原则，且允许私营供应商自行判定数据敏感性，削弱监管效力。此前解密报告承认，CAI已使政府能无限制获取曾需定向监控才能获得的信息。

15. 《AI 2027》场景：是危言耸听还是未来预言？

🔗 garymarcus.substack.com: The “AI 2027” Scenario: How realistic is it?

🔥🔥: 109 | 💬: 186 | 🗓️ 2025-05-22

Gary Marcus对《AI 2027》这份引发热议的“科幻式报告”提出质疑。该报告以惊悚叙事描绘了AI在2027年失控的末日场景，但缺乏科学依据。作者指出，其核心假设——如超级智能AI在三年内崛起——纯属臆测，未考虑技术瓶颈（如幻觉问题）和历史教训（如自动驾驶的延迟）。报告通过生动叙事制造恐慌，但概率计算显示其预测可能性微乎其微。Marcus认为，过度渲染恐惧可能适得其反，反而不利于AI安全治理的理性讨论。

16. 用模型上下文协议探索符号代数的奇妙之旅

🔗 stephendiehl.com: Adventures in Symbolic Algebra with Model Context Protocol

🔥: 99 | 💬: 24 | 🗓️ 2025-05-22

作者尝试通过模型上下文协议（MCP）将语言模型与专业数学工具（如SymPy）结合，解决LLM在复杂数学运算（如张量微积分）中的严重错误问题。MCP允许模型调用本地工具，但存在安全隐患。实验成功演示了用SymPy精确求解阻尼谐振子微分方程，避免了LLM的幻觉答案。尽管技术尚不成熟，这种结合自然语言理解与符号计算的方式展现了巨大潜力，但需警惕生态系统的早期混乱与安全风险。

17. 如何在《卡坦岛》游戏中通过灌铅骰子作弊（2017年）

🔗 izbicki.me: How to cheat at settlers by loading the dice (2017)

🔥: 98 | 💬: 85 | 🗓️ 2025-05-22

这篇2017年的文章详细介绍了如何通过灌铅骰子在《卡坦岛》中获取额外资源。作者将骰子浸水，使6点面因吸水增重而更易朝上。通过4310次投掷实验，证实6点出现概率显著提高（19.6% vs 理论值16.6%）。

在游戏中，利用这一偏差可将资源获取率提升5-15张，但科学检测因样本量不足（单局仅60次投掷）难以发现作弊。文章同时批判了p值检验的局限性，指出其无法整合先验证据（如骰子变色）且易产生假阳性，并建议采用更复杂的贝叶斯因子分析。

最后，作者幽默承认数据统计错误，并强调同行评审的重要性。

18. Glitch将终止应用托管服务

🔗 blog.glitch.com: We’ll be ending web hosting for your apps on Glitch

🔥: 93 | 💬: 47 | 🗓️ 2025-05-22

Glitch宣布将于2025年7月8日停止项目托管和用户档案服务，但用户可通过仪表盘下载代码并设置子域名重定向至2025年底。此举源于运营成本上升及新兴开发平台（如Fly.io、Deno等）的竞争，Glitch认为其架构已无法提供独特价值。现有Pro会员订阅将退款，团队将提供迁移指南并持续更新支持。创始人Anil强调这是生态演变的必然选择，并邀请社区通过论坛或邮件反馈意见。

19. 如何高效加载大型JSON文件到Pydantic模型而不耗尽内存

🔗 pythonspeed.com: Loading Pydantic models from JSON without running out of memory

🔥: 90 | 💬: 31 | 🗓️ 2025-05-22

文章探讨了使用Pydantic加载大型JSON文件时内存消耗过高的问题。默认方法会导致20倍内存膨胀（100MB文件占用2GB）。解决方案分两步：首先采用ijson流式解析器降低解析内存至1.2GB；其次改用带slots的Pydantic数据类，进一步将内存压缩到450MB。虽然速度有所牺牲，但这种方法显著提升了内存效率，为处理超大规模JSON数据提供了可行路径。

20. 抱歉，应届生：初级科技岗位正在消失

🔗 sfstandard.com: Sorry, grads: Entry-level tech jobs are getting wiped out

🔥: 81 | 💬: 163 | 🗓️ 2025-05-22

2025届毕业生面临严峻的就业市场，大型科技公司的应届生招聘比2019年减少超50%，而中高级岗位需求回升。AI自动化和公司缩减成本导致初级岗位锐减，许多毕业生转向读研或实习积累经验。国际学生和文科生尤其受冲击，即使名校背景也难保工作。专家警告，AI迭代速度可能很快超越学历提升的价值，呼吁政策应对潜在失业危机。

21. 《秘密商场公寓：一场关于空间的抗议》

🔗 modernagejournal.com: “Secret Mall Apartment,” a Protest for Place

🔥: 80 | 💬: 47 | 🗓️ 2025-05-22

2003年，罗德岛州八名艺术家在普罗维登斯购物中心内秘密建造了一间公寓，并断断续续居住了四年。这一行为既是抗议城市商业化对本地文化的侵蚀，也是对无灵魂消费主义的嘲讽。他们利用废弃空间，用二手家具打造生活区，甚至建起水泥墙隐藏入口。纪录片通过模糊的老式手机影像和现代访谈，展现了这群艺术家如何以荒诞方式对抗城市开发，最终因意外暴露而终结。迈克尔·汤森作为主导者，至今被禁止踏入该商场。影片既幽默又深刻，揭示了人们对归属感的渴望与现代都市疏离感的矛盾。

22. JEP 519：对象头压缩技术正式发布

🔗 openjdk.org: JEP 519: Compact Object Headers

🔥: 70 | 💬: 10 | 🗓️ 2025-05-22

JEP 519 将 对象头压缩布局 从实验性功能升级为正式功能。该技术最初通过 JEP 450 在 JDK 24 引入，经过大规模测试（包括 Oracle 的完整测试套件和亚马逊生产环境验证），证明其能显著提升性能：堆内存占用减少 22%，CPU 时间降低 8%，且垃圾回收次数减少 15%。未来若需更多头字段空间，可通过调整压缩指针等技术实现。启用命令将简化，不再需要实验性参数。

23. 改变微处理器设计的32位芯片

🔗 spectrum.ieee.org: 32 bits that changed microprocessor design

🔥: 63 | 💬: 12 | 🗓️ 2025-05-22

贝尔实验室1982年研发的Bellmac-32微处理器，为现代智能手机芯片奠定了基础。这款芯片采用32位架构，显著提升了计算性能，其设计团队甚至在实验室地板上铺满了电路示意图以完成开发。IEEE Spectrum撰稿人Willie D. Jones指出，这一创新标志着微处理器从8/16位时代向更高性能的跨越，影响了后续数十年的芯片技术发展。

24. 古老法规要求查令十字铁路桥悬挂稻草捆

🔗 ianvisits.co.uk: Ancient law requires a bale of straw to hang from Charing Cross rail bridge

🔥: 62 | 💬: 57 | 🗓️ 2025-05-22

由于《伦敦泰晤士河港口条例》第36.2条规定，当桥梁拱洞高度临时降低时，需悬挂稻草捆警示船只。目前查令十字桥因维护工程架设脚手架，触发这一中世纪遗留法规，施工方在两侧人行桥各挂一捆稻草。夜间还会点亮警示灯。尽管稻草的原始用途已不可考，但法规至今未被废除。未来几年，随着工程推进，稻草捆将随脚手架位置移动。

25. 扩散语言模型的优势与局限

🔗 seangoedecke.com: Strengths and limitations of diffusion language models

🔥: 58 | 💬: 7 | 🗓️ 2025-05-22

谷歌发布的Gemini Diffusion因生成速度惊艳众人。扩散模型与自回归模型（如GPT-4、Claude）的核心差异在于：扩散模型并行生成完整输出，通过多轮去噪逐步修正，而非逐词生成。其优势包括速度更快（支持部分结果并行输出）和可调节质量（减少去噪轮次以提速），但固定输出长度可能导致短文本效率更低。此外，扩散模型处理长上下文时因无法缓存注意力计算而更耗资源，且推理能力尚不明确——自回归模型的“链式思考”机制可能难以适配块生成逻辑。尽管扩散模型内部可能使用Transformer，但其架构特性仍主导行为差异。

勒西科技日报 - 2025年05月22日