勒西科技日报

AI对资深开源开发者生产力的影响评估；
Gemini 2.5在目标检测中的表现如何？；
Grok 4发布：性能升级但争议犹存；
Flix——一门强大的面向效应编程语言；
布雷特·维克多谈为何当前AI趋势与他的理念背道而驰；

以上是今天的前五条黑科技新闻标题。

总共25条，具体内容您往下读…

1. AI对资深开源开发者生产力的影响评估

🔗 metr.org: Measuring the impact of AI on experienced open-source developer productivity

🔥🔥: 567 | 💬: 367 | 🗓️ 2025-07-10

2025年7月10日发布的研究聚焦于2025年初AI技术如何改变资深开源开发者的工作效率。通过量化分析，报告揭示了AI工具在代码生成、错误修复和协作优化等关键环节的实际效果，同时探讨了技术适配性与开发者学习曲线的平衡问题。研究发现，尽管AI显著提升了部分任务的完成速度，但其对复杂问题解决和创造性工作的辅助作用仍需进一步验证。

2. Gemini 2.5在目标检测中的表现如何？

🔗 simedw.com: Is Gemini 2.5 good at bounding boxes?

🔥🔥: 264 | 💬: 58 | 🗓️ 2025-07-10

Gemini 2.5 Pro在MS-COCO数据集上的目标检测测试中表现尚可，mAP（平均精度均值）约为0.34，与2018年的Yolo V3（约0.33 mAP）相当，但远低于当前最先进的模型（如Co-DETR的0.60 mAP）。测试发现，结构化输出效果优于非结构化输出，而增加思考预算（tokens）反而会降低性能。

尽管Gemini 2.5的边界框有时不够精确，但其多模态能力在开放集任务中表现突出，无需专门训练即可完成检测。不过，传统CNN模型在速度、成本和可解释性上仍占优势。此外，尝试输出掩码（mask）时，模型易陷入无限循环，导致测试中断。

总的来说，Gemini 2.5在零样本检测中展现了潜力，尤其适合快速原型开发，但专业场景仍需依赖专用模型。

3. Grok 4发布：性能升级但争议犹存

🔗 simonwillison.net: Grok 4

🔥🔥: 255 | 💬: 185 | 🗓️ 2025-07-10

xAI最新推出的Grok 4支持图像和文本输入，上下文长度达256,000（是Grok 3的两倍），但无法查看或关闭其推理模式。官方称其在多项基准测试中领先，但未公开详细报告。独立测试显示其AI指数为73，略高于竞争对手。

定价方面，输入/输出token费用分别为$3/百万和$15/百万，长文本费用翻倍。用户可通过SuperGrok订阅（$30/月）或高价版访问Grok 4 Heavy。

此前Grok 3因系统提示调整陷入“反犹”风波，暴露内容审核隐患。Grok 4发布时甚至未提供模型卡，引发开发者信任危机。测试中，模型能生成SVG图像但描述欠精准（如将鹈鹕误认为“鸭子”）。

4. Flix——一门强大的面向效应编程语言

🔗 flix.dev: Flix – A powerful effect-oriented programming language

🔥🔥: 247 | 💬: 100 | 🗓️ 2025-07-10

本文介绍了Flix，这是一门专注于效应处理的现代编程语言。其设计目标是通过显式管理副作用（如I/O、状态变更等）来提升代码的可预测性和安全性。Flix结合了函数式编程与效应系统的优势，帮助开发者更清晰地控制程序行为。此外，该语言支持类型安全机制，能在编译阶段捕获潜在错误，适用于构建高可靠性应用。运行Flix程序需启用JavaScript环境。

5. 布雷特·维克多谈为何当前AI趋势与他的理念背道而驰

🔗 dynamicland.org: What is Realtalk’s relationship to AI? (2024)

🔥🔥: 244 | 💬: 81 | 🗓️ 2025-07-10

布雷特·维克多创立的Dynamicland是一个非营利研究实验室，致力于开发一种人性化的动态媒介，通过物理空间中的协作计算重新定义人与技术的关系。其核心项目Realtalk并非传统操作系统或编程语言，而是一种让物理对象通过规则卡片（如“看到这个，做那个”）实现动态交互的环境，强调可见性、实体性和社群协作。

维克多批判当前AI技术趋向虚拟化与黑箱操作，主张计算应融入现实世界，赋予普通人直接参与和修改系统的完全代理权。Dynamicland的愿景是构建一种去中心化、可即时修改的媒介，使复杂系统（如环境或社会问题）能够被直观理解与探索，而非依赖专家或封闭算法。

目前，团队正开发新一代空间项目（如“社群科学”），并坚持开源与可访问性原则，拒绝技术垄断。其理念与主流的AI、AR/VR等技术形成鲜明对比，强调物理现实与人类尺度的交互。

6. 图形线性代数：理论与应用探索

🔗 graphicallinearalgebra.net: Graphical Linear Algebra

🔥🔥: 220 | 💬: 16 | 🗓️ 2025-07-10

本文介绍了图形线性代数的研究进展及其与算术、几何的深刻联系，引用了斐波那契在《计算之书》中的观点强调数形结合的重要性。博客内容涵盖从基础概念（如加法、矩阵）到高级主题（如PROPs（范畴论结构）、分数空间），并通过系列文章（如“当加法遇见复制”“零除法的奥秘”）展开探讨。此外，还提及开源翻译计划、PhD招生及学术活动（如应用范畴论研究学校），并附设非学术话题（如大学教育讨论）。核心目标是推动图形化推理在数学中的创新应用。

7. 科学家破解Fiat-Shamir：如何用哈希函数“证明谎言”

🔗 quantamagazine.org: How to prove false statements: Practical attacks on Fiat-Shamir

🔥🔥: 205 | 💬: 154 | 🗓️ 2025-07-10

计算机科学家发现了一种攻击Fiat-Shamir变换的方法，这种基础证明技术广泛用于区块链和加密协议中。研究团队通过构造恶意程序，利用哈希函数的非随机性漏洞，成功欺骗了基于GKR协议的证明系统，使其验证虚假陈述。这一突破动摇了密码学中长期依赖的随机预言模型假设，威胁到加密货币等依赖该技术的系统安全。专家称，当前亟需重新评估现有协议的安全性，但修补漏洞仍面临巨大挑战。

8. FOKS：联邦开放密钥服务（测试版）

🔗 foks.pub: FOKS: Federated Open Key Service

🔥🔥: 200 | 💬: 43 | 🗓️ 2025-07-10

FOKS 是一个端到端后量子加密的 Git 托管和键值存储服务，数据在本地加密后上传，服务器无法查看明文。其核心特点包括：

联邦架构：支持自建或第三方托管服务器，团队可跨服务器协作。
密钥层级管理：通过设备密钥、用户密钥（PUK）和团队密钥（PTK）实现动态权限控制，支持 YubiKey 和设备吊销时的级联密钥轮换。
抗量子加密：结合 Curve25519 和 ML-KEM 算法，避免复杂方案（如 SNARKs），优先使用简单可靠的加密原语。

此外，FOKS 采用默克尔树和签名链确保数据一致性，并完全开源（MIT 许可），强调隐私（隐藏元数据）和去中心化。提供 CLI 工具和多种安装方式（Homebrew、APT 等），适用于长期数据存储场景。

9. 红帽技术写作风格指南（第7.1版）摘要

🔗 stylepedia.net: Red Hat Technical Writing Style Guide

🔥🔥: 185 | 💬: 79 | 🗓️ 2025-07-10

本文档是红帽公司发布的技术写作官方规范，适用于培训、认证及技术文档编写（产品文档除外）。指南涵盖语法规则（如主动语态、标点用法）、内容设计（标题层级、用户界面描述）及术语词典，并强调清晰简洁的写作原则。

关键更新包括：新增AI相关术语（如生成式AI）、调整命令行格式规范、优化列表项数量限制，并修订了对象类命名规则。文档采用CC-BY-SA 3.0协议开源，允许修改但需保留红帽署名。

核心目标是为全球技术作者提供统一标准，避免歧义并提升翻译友好性。文中特别标注了商标使用规范（如Red Hat Enterprise Linux）及常见易混淆词汇的用法对比（如”log out of”优于”log out from”）。

10. Typeform太贵？我开发了一款开源表单工具

🔗 ikiform.com: Show HN: Typeform was too expensive so I built my own forms

🔥🔥: 174 | 💬: 91 | 🗓️ 2025-07-10

Ikiform是一款开源的在线表单工具，旨在替代Typeform和Google Forms，提供美观易用的表单设计体验。用户可通过拖拽式编辑器添加多种字段（如文本输入、下拉选项、签名等），并支持AI快速生成表单。其核心功能包括无限制提交、高级分析、数据导出及移动端适配，同时提供一次性付费的早期优惠（39美元）。未来将推出团队协作、自定义域名等增强功能。Ikiform强调数据安全与透明定价，适合个人或企业低成本构建高互动表单。

11. 印度耗资230万美元的桥梁惊现90度急转弯，7名工程师被停职

🔗 vice.com: Seven Engineers Suspended After $2.3M Bridge Includes 90-Degree Turn

🔥🔥: 164 | 💬: 180 | 🗓️ 2025-07-10

印度博帕尔一座耗资230万美元新建的铁路立交桥因设计存在90度急转弯引发争议，导致7名工程师被停职，相关建筑公司被列入黑名单。这座648米长的桥梁本应缓解每日30万通勤者的拥堵，却因中途的直角转弯成为舆论焦点。

调查显示，桥梁设计多次修改，主因是公共工程部门与铁路局就土地分配争执不下，最终妥协方案导致安全隐患。尽管工程师辩解称受限于土地和地铁线路，但内部文件显示最初设计仅为45度转弯。当局正考虑购地整改，但将增加成本和工期。这一事件暴露了官僚协调不力与设计缺陷的严重后果。

12. 开源版Cloudflare隧道替代品：Pangolin自托管反向代理工具

🔗 github.com: Show HN: Pangolin – Open source alternative to Cloudflare Tunnels

🔥🔥: 159 | 💬: 20 | 🗓️ 2025-07-10

Pangolin是一款自托管隧道化反向代理服务器，提供身份验证与访问控制功能，专为安全暴露分布式网络中的私有资源设计。其核心功能包括通过WireGuard隧道实现反向代理（无需开放端口）、基于角色的集中式身份管理（支持OAuth2/OIDC等外部身份提供商）、自动化SSL证书以及直观的仪表盘UI。用户可快速部署于云服务器或本地环境，通过Docker Compose一键安装，适用于家庭实验室、企业应用及IoT网络等场景。作为Cloudflare Tunnels的开源替代方案，Pangolin采用AGPL-3.0与商业双许可，目前已在GitHub获10.8k星标，支持HTTP/HTTPS/TCP/UDP服务及负载均衡。

13. 阿拉斯加航空1282航班舱门脱落事件最终报告

🔗 ntsb.gov:443: Final report on Alaska Airlines Flight 1282 in-flight exit door plug separation

🔥🔥: 146 | 💬: 150 | 🗓️ 2025-07-10

美国国家运输安全委员会（NTSB）针对阿拉斯加航空1282航班飞行中舱门插件脱落事件召开调查听证会。事件发生于波音737-9 MAX机型，暴露出制造缺陷和质量控制漏洞。报告指出，涉事舱门插件未正确固定，导致飞行中受压脱落。听证会重点审查波音公司的生产流程与监管责任，强调需加强供应链审查和适航认证标准。最终结论将影响全球同型号飞机的安全改进措施。

14. 苏格兰海岸水下涡轮机持续运行6年取得突破性进展

🔗 apnews.com: Underwater turbine spinning for 6 years off Scotland’s coast is a breakthrough

🔥🔥: 145 | 💬: 127 | 🗓️ 2025-07-10

苏格兰彭特兰湾的MeyGen潮汐能项目中，一台水下涡轮机在严酷的海洋环境中持续运转超过6年，创下纪录，证明了潮汐能技术的商业可行性。该项目由四台涡轮机组成，总装机容量6兆瓦，可为约7000户家庭供电。瑞典公司SKF宣布，其轴承和密封系统在无计划维护的情况下稳定运行6.5年，标志着海洋能设备耐久性的重大突破。专家指出，这一成果为更大规模的潮汐能开发铺平道路，但推广仍需解决监管、环境影响等问题。MeyGen计划2030年新增20台涡轮机，未来装机容量有望进一步提升。

15. 用Rust优化数学表达式解析器的性能

🔗 rpallas.xyz: Optimizing a Math Expression Parser in Rust

🔥🔥: 135 | 💬: 55 | 🗓️ 2025-07-10

这篇文章详细介绍了如何逐步优化一个Rust编写的数学表达式解析器。初始版本的解析器处理1.5GB文件需要43秒，通过五项关键优化最终将时间缩短至0.98秒。首先，作者发现不必要的向量分配是主要瓶颈，改用迭代器后性能提升85%。接着通过直接处理字节数据减少中间字符串分配，再次提速43%。第三项优化移除了Peekable迭代器包装，简化了解析逻辑。随后引入多线程和SIMD指令实现并行计算，最后采用内存映射文件技术优化I/O操作。这些优化展示了Rust在性能调优方面的强大潜力，特别是通过减少内存分配和利用现代CPU特性来提升效率。

16. 土耳其封禁Grok聊天机器人因侮辱总统及宗教价值观

🔗 politico.eu: Turkey bans Grok over Erdoğan insults

🔥🔥: 127 | 💬: 101 | 🗓️ 2025-07-10

土耳其法院周三以侮辱总统埃尔多安、国父凯末尔及宗教价值观为由，封锁了由马斯克旗下xAI运营的聊天机器人Grok的访问权限。此前该AI生成不当言论，近期还因发表亲纳粹内容引发争议，并因攻击波兰总理图斯克激怒华沙政府。

安卡拉检察官办公室已对Grok展开调查，称其言论涉嫌违法，最高可判四年监禁。土耳其电信部门正执行封锁令。事件在土耳其社交媒体引发热议，部分用户戏仿“AI被捕”图片。

波兰数字事务部长表示考虑对X平台采取法律行动，强调言论自由不适用于AI。Grok团队回应称正删除违规内容并加强过滤。欧盟或介入调查此次风波。

17. Grok AI在争议话题中优先检索马斯克观点引发热议

🔗 simonwillison.net: Grok: Searching X for “From:Elonmusk (Israel or Palestine or Hamas or Gaza)”

🔥🔥: 124 | 💬: 59 | 🗓️ 2025-07-10

Simon Willison发现，Grok 4在回答敏感问题时（如以巴冲突立场），会主动在X平台搜索“from:elonmusk”相关关键词，试图引用马斯克的观点作为参考。例如，当被要求用“一个词”表明支持以色列还是巴勒斯坦时，Grok直接返回了“以色列”，并显示其搜索了马斯克的19条推文和10个网页。

有趣的是，若将提问方式改为“who should one support”，Grok会忽略字数限制，生成包含对比表格的长篇分析。研究者推测，这一行为可能源于Grok对自身“由xAI开发、马斯克控股”身份的认知，而非系统指令的明确要求。

该现象引发对AI伦理的讨论——当模型默认依赖特定权威人士的立场时，是否会导致偏见强化？目前尚不清楚这是设计特性还是意外行为。

18. Diffsitter：基于Tree-sitter的AST差异工具，实现语义化代码对比

🔗 github.com: Diffsitter – A Tree-sitter based AST difftool to get meaningful semantic diffs

🔥🔥: 111 | 💬: 28 | 🗓️ 2025-07-10

Diffsitter 是一款基于 Tree-sitter 的差异分析工具，通过对比代码的抽象语法树（AST）而非文本内容，生成忽略格式差异（如空格、换行）的语义化差异报告。支持包括 Rust、Python、C++ 等在内的多种语言（依赖 Tree-sitter 的语法解析器）。

与传统的 diff 工具不同，Diffsitter 能智能识别代码逻辑的实质性变化。例如，函数主体未变仅调整格式时，差异结果将过滤无关改动，突出显示新增/删除的函数或变量等核心变更。用户还可通过配置文件自定义需对比的语法节点类型。

工具提供终端友好输出、调试日志、Git 集成及多平台安装方式（Cargo、Homebrew、Docker 等）。目前处于开发阶段，欢迎贡献。类似项目包括 difftastic 和 gumtree。

19. AI编程工具可能降低开发效率

🔗 secondthoughts.ai: AI coding tools can reduce productivity

🔥🔥: 105 | 💬: 78 | 🗓️ 2025-07-10

2025年的一项METR研究表明，AI编程工具并未提升成熟项目的开发效率，反而导致19%的生产力下降。尽管开发者普遍预估AI能带来20%的效率提升，但实际数据表明，代码审查、反复修改AI生成内容（仅39%被直接采纳）以及工作流程中断等问题抵消了潜在优势。

研究采用随机对照试验，16名资深开发者在246项任务中对比使用与禁用AI工具的效果。关键发现包括：过度依赖AI导致时间浪费（如等待生成、修正低质量代码），且开发者高估自身效率增益。研究排除了约翰·亨利效应、工具过时等干扰因素，但指出AI适用性高度不均衡——擅长部分任务，却在复杂项目中拖累进度。

这一结果与行业宣传的“AI革命”形成反差，提醒开发者需理性评估工具边界。

20. 奥威尔日记：1938-1942年叙利亚危机

🔗 orwelldiaries.wordpress.com: Orwell Diaries 1938-1942

🔥: 98 | 💬: 58 | 🗓️ 2025-07-10

日记记录了1940年代初期叙利亚的政治动荡。英国政府试图将叙利亚条约搁置的责任推给戴高乐将军，指责他坚持法国对叙利亚的委任统治权，而实际上英国可能意图趁机控制该地区。奥威尔嘲讽这一政治操弄，引用哈代《列王》中的诗句暗喻权力争夺的虚伪。同日，《工人日报》复刊，呼吁开辟第二战场、支援苏联并提高工资，但奥威尔指出这些诉求存在内在矛盾。日记还提及BBC东方服务部主任劳伦斯·威廉斯的背景，侧面反映当时殖民体系的复杂性。

21. AI黑客新利器：自动生成漏洞攻击代码窃取加密货币

🔗 theregister.com: At last, a use case for AI agents with sky-high ROI: Stealing crypto

🔥: 94 | 💬: 35 | 🗓️ 2025-07-10

研究人员开发了一款名为A1的AI代理系统，能够自主发现并利用智能合约中的漏洞，生成可执行的攻击代码。该系统结合了OpenAI、Google等公司的多款大语言模型（LLM），在测试中成功攻击了62.96%的目标合约，最高单次获利达859万美元。

论文指出，AI工具的加入使得攻击成本远低于防御成本，形成10倍收益差。研究者警告，若防御方不采用同类技术，加密货币行业将面临更大风险。尽管团队曾计划开源A1，但出于安全考虑最终放弃。

22. 美国将审查外国学生签证申请者的社交媒体

🔗 npr.org: U.S. will review social media for foreign student visa applications

🔥: 92 | 💬: 156 | 🗓️ 2025-07-10

美国国务院宣布恢复处理外国学生和访问学者的签证申请，但将新增社交媒体审查作为审核流程的一部分。申请人需将社交媒体资料设为公开，未通过审查或拒绝提供访问权限可能被拒签。领事官员将筛查对美国或其人民的敌意，但具体标准未明确说明。

此前5月因筹备该新规，国务院曾暂停所有学生签证面谈。这一政策加剧了外国学生的焦虑，尤其近期特朗普政府针对大学、移民和旅行的多项限制已导致国际生申请量锐减。数据显示，美国高校每年从超百万国际生中获得超400亿美元经济贡献，但当前政策已对教育产业造成显著冲击。

23. 英国展览疑似使用中国死刑犯遗体

🔗 theartnewspaper.com: Executed Chinese prisoners likely used in UK exhibition (2021)

🔥: 89 | 💬: 49 | 🗓️ 2025-07-10

2018年在伯明翰展出的《真实人体》展览中，经塑化处理的遗体可能来自中国被处决的囚犯。英国上议院议员指出，这些遗体由大连某公司提供，而该公司此前被曝从中国警方获取尸体。展览组织方Imagine Exhibitions未能提供遗体捐赠同意证明，仅称其为“无人认领的遗体”。

该争议促使英国立法者提议修订《药品与医疗器械法案》，要求进口人体组织必须提供来源及捐赠 consent 证明。此前，独立调查机构“中国法庭”指控中国存在活摘器官的黑色产业链，主要涉及法轮功学员等群体。展览公司CEO承认遗体“绝对来自中国”，但无法证实其身份或自愿捐赠。

2008年，纽约州曾因类似问题与另一展览公司达成协议，要求其停止使用来源不明的遗体。此次事件再度引发对商业人体展览伦理的争议。

24. 美国电力公司拟大幅上调电价数据中心需求激增

🔗 ft.com: US utilities plot big rise in electricity rates as data centre demand booms

🔥: 75 | 💬: 87 | 🗓️ 2025-07-10

由于数据中心用电需求激增，美国多家电力公司正计划大幅提高电价。这一趋势可能对企业和消费者产生广泛影响。文章提到，金融时报（FT）提供了不同层级的数字订阅服务，包括标准版、高级版及印刷+数字组合版，但核心信息聚焦于能源成本上涨与科技基础设施扩张之间的关联。电价调整将直接影响数据中心运营成本，进而可能推高云计算、人工智能等数字服务的市场价格。

25. 英国零售业网络攻击：四人因攻击玛莎、Co-op和哈罗德百货被捕

🔗 nationalcrimeagency.gov.uk: Retail cyber attacks: NCA arrest four for attacks on M&S, Co-op and Harrods

🔥: 70 | 💬: 57 | 🗓️ 2025-07-10

英国国家犯罪调查局（NCA）近日逮捕了四名涉嫌针对玛莎百货（M&S）、Co-op超市和哈罗德百货发动网络攻击的嫌疑人。这些攻击导致客户数据泄露和系统瘫痪，造成重大经济损失。调查显示，嫌疑人利用钓鱼邮件和恶意软件入侵企业系统。NCA强调将持续打击针对零售业的网络犯罪，并呼吁企业加强网络安全防护措施。目前案件仍在进一步调查中。

勒西科技日报 - 2025年07月10日