1. Claude 4重磅发布:新一代AI模型与开发者工具升级;
  2. Mozilla将于2025年7月8日关闭Pocket服务;
  3. 特朗普政府暂停哈佛大学招收国际学生资格;
  4. 墙上挂了12年的分形图案;
  5. 行星着陆:从游戏地图到虚构星球的制图之旅;

以上是今天的前五条黑科技新闻标题。

总共25条,具体内容您往下读…

1. Claude 4重磅发布:新一代AI模型与开发者工具升级

🔗 anthropic.com: Claude 4

🔥🔥: 1627 | 💬: 914 | 🗓️ 2025-05-22


Anthropic推出Claude Opus 4Claude Sonnet 4,前者成为全球最强编程模型,支持长达数小时的复杂任务;后者显著提升代码与推理能力。新增扩展思考工具(Beta版),支持并行工具调用与本地文件记忆功能。Claude Code正式开放,集成VS Code/JetBrains,新增API支持代码执行与缓存。定价不变,Opus 4($15/$75/百万token)和Sonnet 4($3/$15)已登陆多平台。模型在SWE-bench等基准测试中领先,并优化了任务连贯性与安全性。


2. Mozilla将于2025年7月8日关闭Pocket服务

🔗 support.mozilla.org: Mozilla to shut down Pocket and Fakespot

🔥🔥: 887 | 💬: 554 | 🗓️ 2025-05-22


Mozilla宣布将于2025年7月8日正式关闭Pocket服务,用户可在此日期前继续使用应用和浏览器插件。10月8日前可导出保存内容,之后所有数据将被永久删除。Premium订阅用户将按比例自动退款。Pocket的API功能也将停止,相关产品需提前迁移数据。其精选内容服务将更名为“Ten Tabs”,由Firefox团队继续运营。关键时间点包括5月22日下架应用、7月8日服务终止及10月8日数据清除。


3. 特朗普政府暂停哈佛大学招收国际学生资格

🔗 nytimes.com: Trump administration halts Harvard’s ability to enroll international students

🔥🔥: 694 | 💬: 732 | 🗓️ 2025-05-22


美国特朗普政府7日宣布立即撤销哈佛大学的“学生与交流访问者计划”认证,禁止其招收或留用国际学生,此举旨在施压该校配合总统政策。哈佛约6800名国际生(占学生总数27%)可能面临转学或失去合法身份。该校此前已因课程和招生政策起诉政府,预计将再次发起法律挑战。国土安全部称此举与调查相关,但未透露细节。国际学生通常承担更高学费,此举或重创哈佛财政。事件仍在发展中。


4. 墙上挂了12年的分形图案

🔗 chriskw.xyz: That fractal that’s been up on my wall for years

🔥🔥: 356 | 💬: 26 | 🗓️ 2025-05-22


作者在中学时通过重复组合正方形的方式偶然发现了一种分形图案,并将其命名为“墙花”。该图案通过两种方法生成:一种是拖放复制法,另一种是L系统规则。研究发现,两种方法生成的图案因矩阵基不同而存在差异:拖放法使用负行列式矩阵(导致空间翻转),而L系统使用正行列式矩阵(保持连续旋转)。这一发现揭示了分形结构与线性代数的深层联系,并通过基数5的向量编码实现了空间填充。最终,作者通过数学推导解开了12年的谜题。


5. 行星着陆:从游戏地图到虚构星球的制图之旅

🔗 somethingaboutmaps.wordpress.com: Planetfall

🔥🔥: 322 | 💬: 89 | 🗓️ 2025-05-22


作者Daniel Huffman耗时三年,将1999年游戏《半人马座阿尔法星》中的像素化地图转化为高精度虚构星球地图。通过手动采集8192个格点的高程数据,结合降雨、岩石等属性,运用三角网插值和随机扰动技术生成逼真地形。项目揭示了虚构地图与真实制图的差异——前者需要”创造数据”而非仅处理现有数据。最终成果通过投影转换(圆柱等积投影)和人工修正(如环形山圆整化),呈现出比原游戏更细腻的Chiron星地表形态。


6. 提升rav1d视频解码器性能的探索

🔗 ohadravid.github.io: Improving performance of rav1d video decoder

🔥🔥: 265 | 💬: 91 | 🗓️ 2025-05-22


作者通过优化Rust版AV1解码器rav1d,使其在M3芯片的macOS上性能提升约1%。关键改进包括使用MaybeUninit避免不必要的缓冲区清零操作,以及调整内存分配策略。通过对比C语言原版dav1d的性能分析,作者发现零初始化是主要性能瓶颈之一。优化后,解码时间从73.9秒降至72.6秒,缩小了与C版本的差距。后续还可能针对add_temporal_candidate等函数进一步优化。


7. Defuddle:一款替代Readability的HTML转Markdown工具

🔗 github.com: Show HN: Defuddle, an HTML-to-Markdown alternative to Readability

🔥🔥: 205 | 💬: 38 | 🗓️ 2025-05-22


Defuddle 是一个用于提取网页主要内容的工具,能自动清除评论、侧边栏、页眉页脚等冗余元素,输出简洁的HTML或Markdown。专为Obsidian Web Clipper设计,支持数学公式解析结构化元数据提取(如作者、发布时间等)。提供浏览器与Node.js版本,核心功能轻量且可扩展,适合需要高效内容抓取的场景。目前仍在开发中,但已获449星关注。

项目地址:kepano.github.io/defuddle/


8. Ruby 3.5 对象分配性能大幅提升

🔗 railsatscale.com: Fast Allocations in Ruby 3.5

🔥🔥: 200 | 💬: 45 | 🗓️ 2025-05-22


Ruby 3.5 通过内联 Class#new 方法显著加快了对象分配速度,最高可达 6.5 倍。优化核心在于用 opt_new 指令替代传统方法调用,消除参数复制减少栈帧操作。测试显示,关键字参数的提速效果尤为明显,参数越多性能提升越显著。该改进同时优化了内联缓存命中率,避免了纯 Ruby 实现的高缓存失效问题。


9. 我为何亲手打造了一款音乐播放器

🔗 nexo.sh: I Built My Own Audio Player

🔥🔥: 198 | 💬: 101 | 🗓️ 2025-05-22


由于iPhone原生音乐应用功能受限且iCloud同步需付费,作者决定开发一款本地优先的播放器。采用SwiftUI+SQLite架构,实现了全文本搜索、iCloud文件夹扫描及元数据解析,避开了订阅模式与第三方依赖。开发中面临iOS沙盒限制,最终通过文件复制方案解决外置存储访问难题。该项目揭示了苹果生态对自主开发者的不友好,也证明了移动设备仍具备高度可定制性。


10. Flatpak的未来:机遇与挑战并存

🔗 lwn.net: The Future of Flatpak

🔥🔥: 194 | 💬: 89 | 🗓️ 2025-05-22


在2025年Linux应用峰会上,Sebastian Wick指出Flatpak虽在开发者与用户中广受欢迎,但项目开发已陷入停滞。核心开发者流失导致新功能审核缓慢,例如OCI镜像支持、权限细化(如--device=input)等改进长期搁置。此外,沙箱隔离存在缺陷(如嵌套沙箱不支持、网络命名空间安全隐患),且NVIDIA驱动兼容性问题加重用户负担。Wick呼吁社区关注门户(Portals)优化与驱动共享方案,以提升生态可持续性。尽管Flatpak功能稳定,但缺乏活跃开发恐阻碍其长期发展。


11. 副驾驶的幻觉

🔗 deplet.ing: The copilot delusion

🔥🔥: 192 | 💬: 144 | 🗓️ 2025-05-22


作者以辛辣的笔触批判AI编程助手(如GitHub Copilot)的局限性:看似高效实则危险,如同一个不读需求、乱改全局状态的菜鸟同事。它能快速生成语法正确的代码,却缺乏对系统、性能或边缘case的理解,像“高功能实习生”需要严格监督。开发者若过度依赖这类工具,将丧失对底层硬件的掌控力,代码质量退化。真正的编程应直面机器本质——缓存、内存、分支预测等细节才是性能关键,而AI无法理解这些。工具可用作脚手架,但绝不能替代思考。


12. SQLite JavaScript扩展:用JavaScript增强数据库功能

🔗 github.com: Show HN: SQLite JavaScript - extend your database with JavaScript

🔥🔥: 156 | 💬: 45 | 🗓️ 2025-05-22


这是一个名为SQLite-JS的开源扩展,允许开发者用JavaScript创建自定义SQLite函数,包括标量函数、聚合函数、窗口函数和排序规则。该工具支持跨平台(Linux/macOS/Windows/移动端),通过预编译二进制或源码集成,能直接在SQL查询中执行JavaScript代码。核心功能包括:动态计算字段(如年龄计算)、高级统计分析(如中位数/标准差),以及自定义文本排序。特别适合需要复杂业务逻辑处理的场景,所有函数可通过js_create_*系列命令快速注册,并支持在SQLite Cloud集群中自动同步。


13. MCP协议:简化AI应用集成的关键工具

🔗 blog.nilenso.com: MCP explained without hype or fluff

🔥🔥: 138 | 💬: 65 | 🗓️ 2025-05-22


MCP协议通过将复杂的M×N集成问题转化为M+N问题,降低AI应用与外部平台对接的难度。它包含MCP服务器(连接数据源并提供工具)和MCP客户端(集成到AI应用中),支持工具调用、提示模板、资源URI和采样等功能。作者以CKAN开放数据为例,演示如何快速构建MCP服务器,使Claude等客户端能直接访问和分析数据。虽然协议尚不成熟,但已有广泛采用,适合需要解耦的场景,但需权衡性能与灵活性成本。


14. 美国间谍机构打造“一站式”个人数据采购平台

🔗 theintercept.com: U.S. Spy Agencies–One-Stop Shop to Buy Your Personal Data

🔥🔥: 128 | 💬: 62 | 🗓️ 2025-05-22


美国情报机构正通过商业可用信息(CAI)绕过宪法第四修正案,大量购买原本需法庭令才能获取的敏感数据。为解决数据来源分散的问题,国家情报总监办公室(ODNI)计划建立名为“情报界数据联盟”(ICDC)的中央门户,整合手机广告定位、社交媒体内容等高敏感数据,并提供AI分析工具。批评者警告,此举将加剧隐私风险,尤其可能被移民执法等非情报机构滥用。尽管ODNI声称会保障公民自由,但文件显示其仍遵循“先收集再处理”原则,且允许私营供应商自行判定数据敏感性,削弱监管效力。此前解密报告承认,CAI已使政府能无限制获取曾需定向监控才能获得的信息。


15. 《AI 2027》场景:是危言耸听还是未来预言?

🔗 garymarcus.substack.com: The “AI 2027” Scenario: How realistic is it?

🔥🔥: 109 | 💬: 186 | 🗓️ 2025-05-22


Gary Marcus对《AI 2027》这份引发热议的“科幻式报告”提出质疑。该报告以惊悚叙事描绘了AI在2027年失控的末日场景,但缺乏科学依据。作者指出,其核心假设——如超级智能AI在三年内崛起——纯属臆测,未考虑技术瓶颈(如幻觉问题)和历史教训(如自动驾驶的延迟)。报告通过生动叙事制造恐慌,但概率计算显示其预测可能性微乎其微。Marcus认为,过度渲染恐惧可能适得其反,反而不利于AI安全治理的理性讨论。


16. 用模型上下文协议探索符号代数的奇妙之旅

🔗 stephendiehl.com: Adventures in Symbolic Algebra with Model Context Protocol

🔥: 99 | 💬: 24 | 🗓️ 2025-05-22


作者尝试通过模型上下文协议(MCP)将语言模型与专业数学工具(如SymPy)结合,解决LLM在复杂数学运算(如张量微积分)中的严重错误问题。MCP允许模型调用本地工具,但存在安全隐患。实验成功演示了用SymPy精确求解阻尼谐振子微分方程,避免了LLM的幻觉答案。尽管技术尚不成熟,这种结合自然语言理解符号计算的方式展现了巨大潜力,但需警惕生态系统的早期混乱与安全风险。


17. 如何在《卡坦岛》游戏中通过灌铅骰子作弊(2017年)

🔗 izbicki.me: How to cheat at settlers by loading the dice (2017)

🔥: 98 | 💬: 85 | 🗓️ 2025-05-22


这篇2017年的文章详细介绍了如何通过灌铅骰子在《卡坦岛》中获取额外资源。作者将骰子浸水,使6点面因吸水增重而更易朝上。通过4310次投掷实验,证实6点出现概率显著提高(19.6% vs 理论值16.6%)。

在游戏中,利用这一偏差可将资源获取率提升5-15张,但科学检测因样本量不足(单局仅60次投掷)难以发现作弊。文章同时批判了p值检验的局限性,指出其无法整合先验证据(如骰子变色)且易产生假阳性,并建议采用更复杂的贝叶斯因子分析。

最后,作者幽默承认数据统计错误,并强调同行评审的重要性。


18. Glitch将终止应用托管服务

🔗 blog.glitch.com: We’ll be ending web hosting for your apps on Glitch

🔥: 93 | 💬: 47 | 🗓️ 2025-05-22


Glitch宣布将于2025年7月8日停止项目托管和用户档案服务,但用户可通过仪表盘下载代码并设置子域名重定向至2025年底。此举源于运营成本上升及新兴开发平台(如Fly.io、Deno等)的竞争,Glitch认为其架构已无法提供独特价值。现有Pro会员订阅将退款,团队将提供迁移指南并持续更新支持。创始人Anil强调这是生态演变的必然选择,并邀请社区通过论坛或邮件反馈意见。


19. 如何高效加载大型JSON文件到Pydantic模型而不耗尽内存

🔗 pythonspeed.com: Loading Pydantic models from JSON without running out of memory

🔥: 90 | 💬: 31 | 🗓️ 2025-05-22


文章探讨了使用Pydantic加载大型JSON文件时内存消耗过高的问题。默认方法会导致20倍内存膨胀(100MB文件占用2GB)。解决方案分两步:首先采用ijson流式解析器降低解析内存至1.2GB;其次改用带slots的Pydantic数据类,进一步将内存压缩到450MB。虽然速度有所牺牲,但这种方法显著提升了内存效率,为处理超大规模JSON数据提供了可行路径。


20. 抱歉,应届生:初级科技岗位正在消失

🔗 sfstandard.com: Sorry, grads: Entry-level tech jobs are getting wiped out

🔥: 81 | 💬: 163 | 🗓️ 2025-05-22


2025届毕业生面临严峻的就业市场,大型科技公司的应届生招聘比2019年减少超50%,而中高级岗位需求回升。AI自动化和公司缩减成本导致初级岗位锐减,许多毕业生转向读研或实习积累经验。国际学生和文科生尤其受冲击,即使名校背景也难保工作。专家警告,AI迭代速度可能很快超越学历提升的价值,呼吁政策应对潜在失业危机。


21. 《秘密商场公寓:一场关于空间的抗议》

🔗 modernagejournal.com: “Secret Mall Apartment,” a Protest for Place

🔥: 80 | 💬: 47 | 🗓️ 2025-05-22


2003年,罗德岛州八名艺术家在普罗维登斯购物中心内秘密建造了一间公寓,并断断续续居住了四年。这一行为既是抗议城市商业化对本地文化的侵蚀,也是对无灵魂消费主义的嘲讽。他们利用废弃空间,用二手家具打造生活区,甚至建起水泥墙隐藏入口。纪录片通过模糊的老式手机影像和现代访谈,展现了这群艺术家如何以荒诞方式对抗城市开发,最终因意外暴露而终结。迈克尔·汤森作为主导者,至今被禁止踏入该商场。影片既幽默又深刻,揭示了人们对归属感的渴望与现代都市疏离感的矛盾。


22. JEP 519:对象头压缩技术正式发布

🔗 openjdk.org: JEP 519: Compact Object Headers

🔥: 70 | 💬: 10 | 🗓️ 2025-05-22


JEP 519 将 对象头压缩布局 从实验性功能升级为正式功能。该技术最初通过 JEP 450 在 JDK 24 引入,经过大规模测试(包括 Oracle 的完整测试套件和亚马逊生产环境验证),证明其能显著提升性能:堆内存占用减少 22%CPU 时间降低 8%,且垃圾回收次数减少 15%。未来若需更多头字段空间,可通过调整压缩指针等技术实现。启用命令将简化,不再需要实验性参数。


23. 改变微处理器设计的32位芯片

🔗 spectrum.ieee.org: 32 bits that changed microprocessor design

🔥: 63 | 💬: 12 | 🗓️ 2025-05-22


贝尔实验室1982年研发的Bellmac-32微处理器,为现代智能手机芯片奠定了基础。这款芯片采用32位架构,显著提升了计算性能,其设计团队甚至在实验室地板上铺满了电路示意图以完成开发。IEEE Spectrum撰稿人Willie D. Jones指出,这一创新标志着微处理器从8/16位时代向更高性能的跨越,影响了后续数十年的芯片技术发展。


24. 古老法规要求查令十字铁路桥悬挂稻草捆

🔗 ianvisits.co.uk: Ancient law requires a bale of straw to hang from Charing Cross rail bridge

🔥: 62 | 💬: 57 | 🗓️ 2025-05-22


由于《伦敦泰晤士河港口条例》第36.2条规定,当桥梁拱洞高度临时降低时,需悬挂稻草捆警示船只。目前查令十字桥因维护工程架设脚手架,触发这一中世纪遗留法规,施工方在两侧人行桥各挂一捆稻草。夜间还会点亮警示灯。尽管稻草的原始用途已不可考,但法规至今未被废除。未来几年,随着工程推进,稻草捆将随脚手架位置移动。


25. 扩散语言模型的优势与局限

🔗 seangoedecke.com: Strengths and limitations of diffusion language models

🔥: 58 | 💬: 7 | 🗓️ 2025-05-22


谷歌发布的Gemini Diffusion因生成速度惊艳众人。扩散模型自回归模型(如GPT-4、Claude)的核心差异在于:扩散模型并行生成完整输出,通过多轮去噪逐步修正,而非逐词生成。其优势包括速度更快(支持部分结果并行输出)和可调节质量(减少去噪轮次以提速),但固定输出长度可能导致短文本效率更低。此外,扩散模型处理长上下文时因无法缓存注意力计算而更耗资源,且推理能力尚不明确——自回归模型的“链式思考”机制可能难以适配块生成逻辑。尽管扩散模型内部可能使用Transformer,但其架构特性仍主导行为差异。


Image

勒西科技日报

这是一份给聪明人的科技日报,每天推送一篇。内容来自各大英文网站,提供中文摘要。

Back to Overview