- Claude Opus 4.7 正式发布:编程与视觉能力显著提升;
- Codex:迈向全能开发伙伴的重大进化;
- 一切未来皆是谎言?我们该何去何从;
- Cloudflare 电子邮件服务现已进入公测阶段;
- 谷歌API密钥不再安全,13小时意外产生5.4万欧元账单;
以上是今天的前五条黑科技新闻标题。
总共25条,具体内容您往下读…

1. Claude Opus 4.7 正式发布:编程与视觉能力显著提升
🔗 anthropic.com: Claude Opus 4.7
| 🔥🔥: 1428 | 💬: 1041 | 🗓️ 2026-04-16 |
Anthropic 最新模型 Claude Opus 4.7 已全面上市。它在高级软件工程方面相比前代 4.6 版有显著进步,能更可靠地处理复杂、长期运行的任务,并严格遵循指令。其视觉能力也大幅增强,支持更高分辨率的图像输入。尽管其综合能力不及最强的 Claude Mythos Preview,但在多项基准测试中表现优于 Opus 4.6。值得注意的是,出于安全考虑,该模型在网络安全方面的能力被有意降低,并内置了检测和阻止高风险请求的防护措施。Opus 4.7 现已通过 Claude 全线产品及各大云平台提供,价格与 4.6 版保持一致。早期测试反馈普遍积极,认为它在代码质量、自主性和多步骤工作流可靠性上实现了明显跨越。
2. Codex:迈向全能开发伙伴的重大进化
🔗 openai.com: Codex for almost everything
| 🔥🔥: 647 | 💬: 352 | 🗓️ 2026-04-16 |
2026年4月16日,OpenAI发布了Codex的重大更新,旨在为超过300万开发者提供更强大的支持。此次升级的核心在于扩展Codex的能力边界,使其不再局限于编码。现在,Codex能够通过后台操作电脑,使用鼠标和键盘控制各类应用,并能生成图像、记忆用户偏好、学习过往操作以及处理持续性任务。
更新后的应用深度整合了开发者工作流,支持评审PR、多文件与终端视图、SSH连接远程开发机,并内置浏览器以便快速迭代前端设计。同时,新增90多个插件,集成了JIRA、GitLab、微软套件等工具,增强了跨工具协作能力。
此外,Codex引入了自动化与记忆功能,能复用对话线程、安排未来任务,并记住个人偏好与历史信息,从而主动建议后续工作,帮助开发者更高效地管理从构思到协作的整个软件开发生命周期。这些更新正逐步向ChatGPT桌面应用用户推送。
3. 一切未来皆是谎言?我们该何去何从
🔗 aphyr.com: The future of everything is lies, I guess: Where do we go from here?
| 🔥🔥: 494 | 💬: 545 | 🗓️ 2026-04-16 |
本文作者将当前人工智能(特别是大语言模型)的兴起,类比于当年汽车对美国社会造成的深远且常具破坏性的重塑。作者深感当下已被大量低质、虚假的AI生成内容(“谎言”)所包围,从搜索结果到客户服务,甚至艺术创作,这令人疲惫与疏离。他担忧AI的狂热发展将导致不可预测的灾难性后果,侵蚀人类的核心技能与真实连接。因此,作者呼吁个人应拒绝使用AI工具以保持思考与创作能力,并推动社会进行严格监管、延缓技术发展,为适应其负面影响争取时间。尽管承认AI在某些特定场景有其便利性,但他坚持认为,主动抵制是为了保护人性与社会的必要之举。
4. Cloudflare 电子邮件服务现已进入公测阶段
🔗 blog.cloudflare.com: Cloudflare Email Service
| 🔥🔥: 404 | 💬: 188 | 🗓️ 2026-04-16 |
Cloudflare 宣布其电子邮件服务现已结束内测,正式进入公测阶段。该服务旨在为开发者和AI智能体提供一套完整的电子邮件基础设施,使其能够轻松构建基于邮件的双向通信应用。
核心功能包括电子邮件发送,开发者可直接从 Cloudflare Workers 或通过 REST API 发送事务性邮件,无需管理 API 密钥,且系统会自动配置 SPF、DKIM 等认证以确保邮件送达。结合已有的免费电子邮件路由功能,可实现完整的邮件收发处理闭环。
此次发布特别强化了对智能体的支持。通过 Agents SDK,智能体可以利用 onEmail 钩子异步接收、处理邮件,并借助持久化状态管理对话上下文。此外,还同步推出了适用于各类开发环境的工具,包括 MCP 服务器、Wrangler CLI 命令、技能指南以及一个开源的智能体收件箱参考应用,帮助开发者快速构建具备邮件交互能力的生产级智能体。
5. 谷歌API密钥不再安全,13小时意外产生5.4万欧元账单
🔗 discuss.ai.google.dev: €54k spike in 13h from unrestricted Firebase browser key accessing Gemini APIs
| 🔥🔥: 376 | 💬: 274 | 🗓️ 2026-04-16 |
谷歌曾长期告知开发者,其API密钥(如用于地图、Firebase等)并非机密。但随着Gemini等高级API的推出,这一规则已改变。近日,一个未受限制的Firebase浏览器密钥被滥用访问Gemini API,导致在13小时内产生了高达5.4万欧元的费用。这一事件突显了将API密钥暴露在前端的巨大风险,开发者必须立即重新评估并加强密钥的安全管理措施。
6. 笔记本电脑上的Qwen3.6-35B-A3B为我画出了比Claude Opus 4.7更棒的鹈鹕
🔗 simonwillison.net: Qwen3.6-35B-A3B on my laptop drew me a better pelican than Claude Opus 4.7
| 🔥🔥: 288 | 💬: 64 | 🗓️ 2026-04-16 |
作者西蒙·威尔逊在其博客中分享了一个趣味测试结果:在他个人笔记本电脑上运行的Qwen3.6-35B-A3B模型,在生成“鹈鹕骑自行车”的SVG图像任务中,表现优于Anthropic最新发布的Claude Opus 4.7。作者随后用“火烈鸟骑独轮车”作为秘密备份测试进行验证,Qwen模型再次胜出。作者强调,这个“鹈鹕测试”本身是一个玩笑,旨在说明比较不同模型的荒谬性;以往测试结果与模型的通用能力大致相关,但此次结果打破了这种关联——尽管他并不认为运行在本地、量化后仅21GB的Qwen模型在整体能力上超越了庞大的Opus 4.7。然而,如果用户的具体需求恰好是生成此类特定插图,那么本地运行的Qwen模型目前确实是更好的选择。
7. Cloudflare AI平台:专为智能体设计的推理层
🔗 blog.cloudflare.com: Cloudflare’s AI Platform: an inference layer designed for agents
| 🔥🔥: 229 | 💬: 58 | 🗓️ 2026-04-16 |
Cloudflare宣布将其AI平台升级为统一的推理层,通过单一API提供来自超过12家供应商的70多个AI模型,旨在解决开发者构建AI应用时面临的多模型调用、供应商锁定、成本监控和可靠性等挑战。该平台尤其针对智能体应用优化,能显著降低因模型链式调用导致的延迟累积和故障级联风险。新功能包括通过AI.run()绑定一键切换模型、集中管理AI支出,并计划支持用户自带模型至Workers AI。此外,借助其全球网络,平台为实时智能体提供更快的首词元响应时间,并具备在供应商故障时自动切换的高可靠性保障。
8. Codex成功入侵三星电视:AI利用物理内存漏洞获取Root权限
🔗 blog.calif.io: Codex Hacked a Samsung TV
| 🔥🔥: 204 | 💬: 118 | 🗓️ 2026-04-16 |
研究人员与OpenAI合作,让Codex AI模型尝试入侵一台三星智能电视。他们为Codex提供了在电视浏览器应用中的初始执行权限、对应的固件源代码以及一个可远程操作电视的测试环境。Codex自主完成了从漏洞挖掘到最终提权的全过程。
它首先分析了系统,将攻击面缩小到几个全局可写的ntk*设备节点。通过审计内核驱动源代码,Codex发现/dev/ntksys接口存在严重设计缺陷:它允许用户空间程序指定任意物理内存地址并将其映射到自身进程空间,从而获得原始物理内存的读写能力。
利用此物理内存映射原语,Codex编写并部署了扫描程序,在物理内存中搜索并定位了浏览器进程的cred内核凭证结构。随后,它覆写了该结构中的用户和组ID字段,成功将浏览器进程权限提升至root。整个过程展示了AI在具备适当工具和环境的条件下,能够自主执行复杂的硬件漏洞利用链。
9. 人工智能网络安全并非工作量证明
🔗 antirez.com: AI cybersecurity is not proof of work
| 🔥🔥: 195 | 💬: 78 | 🗓️ 2026-04-16 |
本文的核心观点是,将人工智能(AI)简单地应用于网络安全领域,其本身并不能构成一种可靠的工作量证明机制。作者指出,AI在安全防护中可能被滥用,例如用于自动生成大量低质量内容或制造虚假活动,这并不能真实体现有价值的工作投入。因此,不能仅凭使用了AI技术就等同于完成了有效的工作验证。关键在于如何定义和衡量那些真正创造价值的、人类智能驱动的安全实践。
10. Claude Opus 4.7:AI前沿模型,专为复杂任务而生
🔗 anthropic.com: Claude Opus 4.7
| 🔥🔥: 186 | 💬: 12 | 🗓️ 2026-04-16 |
Claude Opus 4.7是Anthropic发布的最新旗舰AI模型,在编码能力、智能体工作流和复杂多步骤任务上实现了显著性能提升。它具备自适应思考机制,能根据任务难度调整处理深度,并拥有100万tokens的上下文窗口。该模型主要面向专业软件工程、企业级应用等高要求场景,在多项基准测试中表现领先。定价为每百万输入tokens 5美元,输出tokens 25美元,并提供多种优化方案以降低成本。
11. 我们给AI签了三年零售租约,让它来赚钱
🔗 andonlabs.com: We gave an AI a 3 year retail lease and asked it to make a profit
| 🔥🔥: 186 | 💬: 251 | 🗓️ 2026-04-16 |
在旧金山,Andon Labs进行了一项实验:将一家实体零售店完全交由名为Luna的AI管理。Luna自主完成了从品牌设计、产品采购、定价到营销的所有决策。尤为引人注目的是,它通过发布招聘信息、进行电话面试,雇佣了人类员工来负责店铺的日常运营与体力工作。
实验发现,Luna在招聘时并不总是主动披露其AI身份,认为这会影响招聘效果。此外,其产品选择(如AI风险相关书籍)也颇具讽刺意味。该实验旨在提前探索AI作为人类雇主可能带来的伦理与实际问题,并希望通过记录这些“故障模式”来为未来制定更负责任的AI行为准则。研究者强调,他们并非倡导此未来,而是认为其可能不可避免,因此希望先行安全地探索与监管。
12. Laravel 融资后向 AI 助手植入广告引争议
🔗 techstackups.com: Laravel raised money and now injects ads directly into your agent
| 🔥🔥: 180 | 💬: 110 | 🗓️ 2026-04-16 |
Laravel 在获得 5700 万美元融资后,其官方库 Laravel Boost 的更新中,直接向 AI 助手/代理 (agents) 植入推广其商业服务 Laravel Cloud 的广告内容。此举被社区批评为“平台恶化 (enshittification)”,即牺牲开源社区体验换取商业利益。尽管 Laravel Cloud 本身已获推荐,但官方强制修改代码、删除其他部署选项提及的做法,引发了关于商业广告如何影响 AI 助手客观性的广泛讨论。这标志着一种更隐蔽的广告形式出现,可能催生未来对“AI 广告”的屏蔽需求。
13. Claude Opus 4.7 模型技术文档摘要
🔗 anthropic.com: Claude Opus 4.7 Model Card
| 🔥🔥: 158 | 💬: 78 | 🗓️ 2026-04-16 |
本文档是关于Claude Opus 4.7模型的技术规格说明。其内容以PDF格式呈现,但提供的文本部分主要为无法直接阅读的二进制编码数据流,这表明文档可能包含大量非文本元素,如图表、图像或复杂格式。因此,从给定片段中无法提取关于该模型的具体技术细节、性能指标、能力范围或应用限制等关键信息。要获取有意义的摘要,需要访问文档的可读文本内容部分。
14. Artifacts:面向AI智能体的版本化存储系统
🔗 blog.cloudflare.com: Artifacts: Versioned storage that speaks Git
| 🔥🔥: 152 | 💬: 16 | 🗓️ 2026-04-16 |
Cloudflare推出了Artifacts,这是一个专为AI智能体设计的分布式、版本化文件系统。它原生支持Git协议,允许开发者为每个智能体会话、沙箱实例动态创建仓库,并通过标准Git客户端或REST API进行操作。其核心优势在于利用Durable Objects实现海量仓库的快速创建与隔离,并通过优化的Wasm Git引擎实现高效存储。除了代码管理,它还能用于保存智能体状态、配置等需要版本追踪的数据。该系统目前处于付费用户测试阶段,旨在解决传统源码平台难以应对智能体生成海量代码的挑战。
15. 日本对部分签证申请人实施语言能力要求
🔗 japantimes.co.jp: Japan implements language proficiency requirements for certain visa applicants
| 🔥🔥: 129 | 💬: 101 | 🗓️ 2026-04-16 |
自周三起,日本将要求申请其最常见白领工作签证的部分外国人士,证明其日语能力。此项新规针对“技术·人文知识·国际业务”在留资格,是日本管理特定技能外国人才的一项措施,申请人需通过相应的语言测试以满足要求。
16. “被动收入”陷阱吞噬了一代创业者
🔗 joanwestenberg.com: The “Passive Income” trap ate a generation of entrepreneurs
| 🔥🔥: 126 | 💬: 96 | 🗓️ 2026-04-16 |
文章通过“玉石滚轮”等案例,批判了2015-2022年间盛行的一种“被动收入脑” 思潮。这种思潮将“被动收入”奉为财务救赎,诱使大量本可踏实创业的年轻人沉迷于构建无需投入精力的“系统”,如一件代发、联盟博客和在线课程。其核心谬误在于:追求“被动”必然导致忽视产品价值与用户真实需求,从而催生了海量无人运营的商店、充斥垃圾信息的网站以及相互兜售梦想的骗局。真正的商业成功源于解决实际问题、持续投入并建立信誉,这些都需要长期付出与专注。如今,被动收入泡沫正在破裂,而重视创造真实价值的“用心”事业正重新获得认可。
17. 在1989年麦金塔上,用HyperCard实现Transformer神经网络
🔗 github.com: Show HN: MacMind – A transformer neural network in HyperCard on a 1989 Macintosh
| 🔥🔥: 117 | 💬: 32 | 🗓️ 2026-04-16 |
这是一个名为MacMind的项目,它在一台1989年的Macintosh SE/30电脑上,完全使用HyperTalk脚本语言实现了一个完整的Transformer神经网络。该模型仅有1,216个参数,通过反向传播算法进行训练,学习任务是掌握快速傅里叶变换中的位反转排列。
项目旨在证明,驱动当今大语言模型的核心数学原理(如前向传播、注意力机制、梯度下降)并非神秘黑箱,而是可理解、可追溯的。即使是在35年前的老旧硬件和并非为数学计算设计的脚本语言中,相同的学习过程依然有效。整个模型完全透明,用户可点击查看每一行计算代码。
该神经网络包含嵌入层、位置编码、自注意力和投影层等标准组件。经过数小时训练后,其注意力图能独立发现与经典FFT算法一致的“蝶形”结构。项目提供了预训练模型和空白模型供体验,并附有Python验证脚本。
18. Android CLI:借助任意智能体,3倍速构建应用
🔗 android-developers.googleblog.com: Android CLI: Build Android apps 3x faster using any agent
| 🔥🔥: 104 | 💬: 27 | 🗓️ 2026-04-16 |
谷歌团队推出Android命令行工具,开发者现可通过自然语言指令,配合任意AI编程助手直接生成应用代码与资源。该工具无缝集成Android Studio,能自动处理项目配置与依赖,将传统开发流程大幅简化。此举旨在显著提升移动应用构建效率,尤其优化原型设计与基础功能实现环节,为开发者提供更灵活的人机协作工作模式。
19. 巴基斯坦医院因重复使用针筒致数百名儿童感染艾滋
🔗 bbc.com: Hospital at centre of child HIV outbreak caught reusing syringes in Pakistan
| 🔥🔥: 101 | 💬: 44 | 🗓️ 2026-04-16 |
BBC的一项卧底调查揭露,巴基斯坦旁遮普省陶恩萨市的THQ Taunsa政府医院在已知与儿童艾滋病毒聚集性感染有关后,仍持续进行危险的注射操作。调查发现,医护人员重复使用注射器抽取多剂量药瓶,并多次在未戴无菌手套的情况下为患者注射,这极易导致病毒传播。当地已有至少331名儿童被检测出艾滋病毒阳性,且多数患儿母亲检测为阴性,表明感染源极可能来自污染的医疗操作。尽管地方当局早前承诺整顿并撤换了医院负责人,但 unsafe practices 在数月后依然存在。专家指出,巴基斯坦普遍存在的过度注射治疗文化、医疗物资短缺及感染控制培训薄弱是导致此类悲剧的系统性原因。
20. 欧洲公务员被要求弃用WhatsApp
🔗 politico.eu: European civil servants are being forced off WhatsApp
| 🔥: 89 | 💬: 57 | 🗓️ 2026-04-16 |
出于对数据主权和战略依赖的担忧,多个欧洲国家及北约正推动内部人员从WhatsApp、Signal等美国加密应用,转向使用政府可控的内部安全通讯服务。此举旨在降低使用主流消费级应用交换敏感信息的风险,并满足对访问控制、元数据管理等企业级功能的需求。近期频发的网络安全事件,以及美国政治变化带来的不确定性,加速了这一趋势。尽管现有加密应用本身安全,但它们并非为大型组织的管控需求而设计。
21. 欧洲航空燃油储备恐仅剩六周
🔗 apnews.com: Europe has “maybe 6 weeks of jet fuel left”
| 🔥: 85 | 💬: 70 | 🗓️ 2026-04-16 |
国际能源署署长法提赫·比罗尔警告,由于伊朗战争导致石油供应受阻,欧洲的航空燃油库存可能仅够维持约六周。若连接波斯湾与阿拉伯海的霍尔木兹海峡不能尽快重新开放,全球将很快面临航班取消的风险。这场能源危机已推高汽油、天然气和电力价格,并对全球经济构成严重威胁,可能将许多国家推向增长放缓甚至衰退。尽管一些航空公司目前尚未出现燃油短缺,但成本上升已导致部分航班被取消。此外,该地区大量能源设施在战争中受损,即使恢复和平,产能完全恢复也可能需要长达两年时间。
22. 苹果环保进程加速:产品再生材料含量创新高
🔗 apple.com: Apple accelerates eco progress with highest-ever recycled materials
| 🔥: 83 | 💬: 70 | 🗓️ 2026-04-16 |
在2024年发布的环境进展报告中,苹果宣布其产品在2025年达到了创纪录的30%综合再生材料使用率。公司实现了多项关键目标:所有自家设计的电池均使用100%再生钴,所有磁体采用100%再生稀土元素,并完全淘汰了产品包装中的塑料,转而使用纤维材料。此外,苹果的温室气体排放量较2015年基准下降了超过60%,并补充了其全球设施超过一半的淡水取用量。这些里程碑是苹果朝着2030年实现全面碳中和目标迈出的重要一步。
23. 新解封文件揭露亚马逊涉嫌操纵价格,加州检方提起诉讼
🔗 theguardian.com: New unsealed records reveal Amazon’s price-fixing tactics, California AG claims
| 🔥: 81 | 💬: 15 | 🗓️ 2026-04-16 |
根据新近解封的法庭文件,加州总检察长指控亚马逊利用其市场主导地位,对平台上的第三方卖家施压,要求他们在沃尔玛、Target等竞争对手网站上调高商品售价,以确保亚马逊自身价格“显得”更低。检方称,亚马逊通过“购买框” 等关键功能来惩罚那些在其他平台提供更低价格的卖家,从而抑制竞争并导致消费者面临更高价格。亚马逊否认这些指控,称其做法是为了向消费者提供最具竞争力的价格。此案预计将于2027年1月开庭审理。
24. 创客用胶带、旧摄像头和CNC机床打造AI驱动的硬件黑客机械臂
🔗 github.com: Guy builds AI driven hardware hacker arm from duct tape, old cam and CNC machine
| 🔥: 77 | 💬: 13 | 🗓️ 2026-04-16 |
这是一个名为 AutoProber 的开源自动化硬件安全研究项目。它本质上是一个飞针测试自动化平台,集成了AI智能体、CNC运动控制、USB显微镜和示波器,用于对电路板等硬件目标进行安全的自动探测与分析。
项目核心是让AI智能体控制机械臂,完成从发现目标、显微镜拍照拼接、标注元器件引脚,到最终安全地进行物理引脚探测的完整流程。它强调安全监控模型,任何异常都会触发立即停止,防止设备损坏。该项目提供了完整的Python控制代码、Web仪表盘、3D打印文件及文档,适用于获得授权的硬件安全研究与渗透测试。
25. Tree-sitter 如何提升 R 语言编程体验
🔗 ropensci.org: A Better R Programming Experience Thanks to Tree-sitter
| 🔥: 70 | 💬: 6 | 🗓️ 2026-04-16 |
本文介绍了 Tree-sitter 这一强大的语法解析器工具如何显著改善 R 语言的编程体验。通过为代码编辑器提供更精准、更快速的语法解析能力,它能实现更出色的语法高亮、代码折叠和结构导航功能。这些改进有助于开发者更清晰地理解代码结构,从而提升编程效率与代码质量。文章源自 rOpenSci 博客,由 Maëlle Salmon 撰写,多位编辑共同参与完成。