1. AI对资深开源开发者生产力的影响评估;
  2. Gemini 2.5在目标检测中的表现如何?;
  3. Grok 4发布:性能升级但争议犹存;
  4. Flix——一门强大的面向效应编程语言;
  5. 布雷特·维克多谈为何当前AI趋势与他的理念背道而驰;

以上是今天的前五条黑科技新闻标题。

总共25条,具体内容您往下读…

1. AI对资深开源开发者生产力的影响评估

🔗 metr.org: Measuring the impact of AI on experienced open-source developer productivity

🔥🔥: 567 | 💬: 367 | 🗓️ 2025-07-10


2025年7月10日发布的研究聚焦于2025年初AI技术如何改变资深开源开发者的工作效率。通过量化分析,报告揭示了AI工具在代码生成、错误修复和协作优化等关键环节的实际效果,同时探讨了技术适配性与开发者学习曲线的平衡问题。研究发现,尽管AI显著提升了部分任务的完成速度,但其对复杂问题解决和创造性工作的辅助作用仍需进一步验证。


2. Gemini 2.5在目标检测中的表现如何?

🔗 simedw.com: Is Gemini 2.5 good at bounding boxes?

🔥🔥: 264 | 💬: 58 | 🗓️ 2025-07-10


Gemini 2.5 Pro在MS-COCO数据集上的目标检测测试中表现尚可,mAP(平均精度均值)约为0.34,与2018年的Yolo V3(约0.33 mAP)相当,但远低于当前最先进的模型(如Co-DETR的0.60 mAP)。测试发现,结构化输出效果优于非结构化输出,而增加思考预算(tokens)反而会降低性能。

尽管Gemini 2.5的边界框有时不够精确,但其多模态能力在开放集任务中表现突出,无需专门训练即可完成检测。不过,传统CNN模型在速度、成本和可解释性上仍占优势。此外,尝试输出掩码(mask)时,模型易陷入无限循环,导致测试中断。

总的来说,Gemini 2.5在零样本检测中展现了潜力,尤其适合快速原型开发,但专业场景仍需依赖专用模型。


3. Grok 4发布:性能升级但争议犹存

🔗 simonwillison.net: Grok 4

🔥🔥: 255 | 💬: 185 | 🗓️ 2025-07-10


xAI最新推出的Grok 4支持图像和文本输入,上下文长度达256,000(是Grok 3的两倍),但无法查看或关闭其推理模式。官方称其在多项基准测试中领先,但未公开详细报告。独立测试显示其AI指数为73,略高于竞争对手。

定价方面,输入/输出token费用分别为$3/百万和$15/百万,长文本费用翻倍。用户可通过SuperGrok订阅($30/月)或高价版访问Grok 4 Heavy

此前Grok 3因系统提示调整陷入“反犹”风波,暴露内容审核隐患。Grok 4发布时甚至未提供模型卡,引发开发者信任危机。测试中,模型能生成SVG图像但描述欠精准(如将鹈鹕误认为“鸭子”)。


4. Flix——一门强大的面向效应编程语言

🔗 flix.dev: Flix – A powerful effect-oriented programming language

🔥🔥: 247 | 💬: 100 | 🗓️ 2025-07-10


本文介绍了Flix,这是一门专注于效应处理的现代编程语言。其设计目标是通过显式管理副作用(如I/O、状态变更等)来提升代码的可预测性和安全性。Flix结合了函数式编程与效应系统的优势,帮助开发者更清晰地控制程序行为。此外,该语言支持类型安全机制,能在编译阶段捕获潜在错误,适用于构建高可靠性应用。运行Flix程序需启用JavaScript环境。


5. 布雷特·维克多谈为何当前AI趋势与他的理念背道而驰

🔗 dynamicland.org: What is Realtalk’s relationship to AI? (2024)

🔥🔥: 244 | 💬: 81 | 🗓️ 2025-07-10


布雷特·维克多创立的Dynamicland是一个非营利研究实验室,致力于开发一种人性化的动态媒介,通过物理空间中的协作计算重新定义人与技术的关系。其核心项目Realtalk并非传统操作系统或编程语言,而是一种让物理对象通过规则卡片(如“看到这个,做那个”)实现动态交互的环境,强调可见性实体性社群协作

维克多批判当前AI技术趋向虚拟化与黑箱操作,主张计算应融入现实世界,赋予普通人直接参与和修改系统的完全代理权。Dynamicland的愿景是构建一种去中心化、可即时修改的媒介,使复杂系统(如环境或社会问题)能够被直观理解与探索,而非依赖专家或封闭算法。

目前,团队正开发新一代空间项目(如“社群科学”),并坚持开源与可访问性原则,拒绝技术垄断。其理念与主流的AI、AR/VR等技术形成鲜明对比,强调物理现实人类尺度的交互。


6. 图形线性代数:理论与应用探索

🔗 graphicallinearalgebra.net: Graphical Linear Algebra

🔥🔥: 220 | 💬: 16 | 🗓️ 2025-07-10


本文介绍了图形线性代数的研究进展及其与算术、几何的深刻联系,引用了斐波那契在《计算之书》中的观点强调数形结合的重要性。博客内容涵盖从基础概念(如加法、矩阵)到高级主题(如PROPs(范畴论结构)、分数空间),并通过系列文章(如“当加法遇见复制”“零除法的奥秘”)展开探讨。此外,还提及开源翻译计划、PhD招生及学术活动(如应用范畴论研究学校),并附设非学术话题(如大学教育讨论)。核心目标是推动图形化推理在数学中的创新应用。


7. 科学家破解Fiat-Shamir:如何用哈希函数“证明谎言”

🔗 quantamagazine.org: How to prove false statements: Practical attacks on Fiat-Shamir

🔥🔥: 205 | 💬: 154 | 🗓️ 2025-07-10


计算机科学家发现了一种攻击Fiat-Shamir变换的方法,这种基础证明技术广泛用于区块链和加密协议中。研究团队通过构造恶意程序,利用哈希函数的非随机性漏洞,成功欺骗了基于GKR协议的证明系统,使其验证虚假陈述。这一突破动摇了密码学中长期依赖的随机预言模型假设,威胁到加密货币等依赖该技术的系统安全。专家称,当前亟需重新评估现有协议的安全性,但修补漏洞仍面临巨大挑战。


8. FOKS:联邦开放密钥服务(测试版)

🔗 foks.pub: FOKS: Federated Open Key Service

🔥🔥: 200 | 💬: 43 | 🗓️ 2025-07-10


FOKS 是一个端到端后量子加密的 Git 托管和键值存储服务,数据在本地加密后上传,服务器无法查看明文。其核心特点包括:

  1. 联邦架构:支持自建或第三方托管服务器,团队可跨服务器协作。
  2. 密钥层级管理:通过设备密钥、用户密钥(PUK)和团队密钥(PTK)实现动态权限控制,支持 YubiKey 和设备吊销时的级联密钥轮换。
  3. 抗量子加密:结合 Curve25519 和 ML-KEM 算法,避免复杂方案(如 SNARKs),优先使用简单可靠的加密原语。

此外,FOKS 采用默克尔树和签名链确保数据一致性,并完全开源(MIT 许可),强调隐私(隐藏元数据)和去中心化。提供 CLI 工具和多种安装方式(Homebrew、APT 等),适用于长期数据存储场景。


9. 红帽技术写作风格指南(第7.1版)摘要

🔗 stylepedia.net: Red Hat Technical Writing Style Guide

🔥🔥: 185 | 💬: 79 | 🗓️ 2025-07-10


本文档是红帽公司发布的技术写作官方规范,适用于培训、认证及技术文档编写(产品文档除外)。指南涵盖语法规则(如主动语态、标点用法)、内容设计(标题层级、用户界面描述)及术语词典,并强调清晰简洁的写作原则。

关键更新包括:新增AI相关术语(如生成式AI)、调整命令行格式规范、优化列表项数量限制,并修订了对象类命名规则。文档采用CC-BY-SA 3.0协议开源,允许修改但需保留红帽署名。

核心目标是为全球技术作者提供统一标准,避免歧义并提升翻译友好性。文中特别标注了商标使用规范(如Red Hat Enterprise Linux)及常见易混淆词汇的用法对比(如”log out of”优于”log out from”)。


10. Typeform太贵?我开发了一款开源表单工具

🔗 ikiform.com: Show HN: Typeform was too expensive so I built my own forms

🔥🔥: 174 | 💬: 91 | 🗓️ 2025-07-10


Ikiform是一款开源的在线表单工具,旨在替代Typeform和Google Forms,提供美观易用的表单设计体验。用户可通过拖拽式编辑器添加多种字段(如文本输入、下拉选项、签名等),并支持AI快速生成表单。其核心功能包括无限制提交、高级分析、数据导出及移动端适配,同时提供一次性付费的早期优惠(39美元)。未来将推出团队协作、自定义域名等增强功能。Ikiform强调数据安全与透明定价,适合个人或企业低成本构建高互动表单。


11. 印度耗资230万美元的桥梁惊现90度急转弯,7名工程师被停职

🔗 vice.com: Seven Engineers Suspended After $2.3M Bridge Includes 90-Degree Turn

🔥🔥: 164 | 💬: 180 | 🗓️ 2025-07-10


印度博帕尔一座耗资230万美元新建的铁路立交桥因设计存在90度急转弯引发争议,导致7名工程师被停职,相关建筑公司被列入黑名单。这座648米长的桥梁本应缓解每日30万通勤者的拥堵,却因中途的直角转弯成为舆论焦点。

调查显示,桥梁设计多次修改,主因是公共工程部门与铁路局就土地分配争执不下,最终妥协方案导致安全隐患。尽管工程师辩解称受限于土地和地铁线路,但内部文件显示最初设计仅为45度转弯。当局正考虑购地整改,但将增加成本和工期。这一事件暴露了官僚协调不力与设计缺陷的严重后果。


12. 开源版Cloudflare隧道替代品:Pangolin自托管反向代理工具

🔗 github.com: Show HN: Pangolin – Open source alternative to Cloudflare Tunnels

🔥🔥: 159 | 💬: 20 | 🗓️ 2025-07-10


Pangolin是一款自托管隧道化反向代理服务器,提供身份验证与访问控制功能,专为安全暴露分布式网络中的私有资源设计。其核心功能包括通过WireGuard隧道实现反向代理(无需开放端口)、基于角色的集中式身份管理(支持OAuth2/OIDC等外部身份提供商)、自动化SSL证书以及直观的仪表盘UI。用户可快速部署于云服务器或本地环境,通过Docker Compose一键安装,适用于家庭实验室、企业应用及IoT网络等场景。作为Cloudflare Tunnels的开源替代方案,Pangolin采用AGPL-3.0与商业双许可,目前已在GitHub获10.8k星标,支持HTTP/HTTPS/TCP/UDP服务及负载均衡。


13. 阿拉斯加航空1282航班舱门脱落事件最终报告

🔗 ntsb.gov:443: Final report on Alaska Airlines Flight 1282 in-flight exit door plug separation

🔥🔥: 146 | 💬: 150 | 🗓️ 2025-07-10


美国国家运输安全委员会(NTSB)针对阿拉斯加航空1282航班飞行中舱门插件脱落事件召开调查听证会。事件发生于波音737-9 MAX机型,暴露出制造缺陷质量控制漏洞。报告指出,涉事舱门插件未正确固定,导致飞行中受压脱落。听证会重点审查波音公司的生产流程与监管责任,强调需加强供应链审查和适航认证标准。最终结论将影响全球同型号飞机的安全改进措施。


14. 苏格兰海岸水下涡轮机持续运行6年取得突破性进展

🔗 apnews.com: Underwater turbine spinning for 6 years off Scotland’s coast is a breakthrough

🔥🔥: 145 | 💬: 127 | 🗓️ 2025-07-10


苏格兰彭特兰湾的MeyGen潮汐能项目中,一台水下涡轮机在严酷的海洋环境中持续运转超过6年,创下纪录,证明了潮汐能技术的商业可行性。该项目由四台涡轮机组成,总装机容量6兆瓦,可为约7000户家庭供电。瑞典公司SKF宣布,其轴承和密封系统在无计划维护的情况下稳定运行6.5年,标志着海洋能设备耐久性的重大突破。专家指出,这一成果为更大规模的潮汐能开发铺平道路,但推广仍需解决监管、环境影响等问题。MeyGen计划2030年新增20台涡轮机,未来装机容量有望进一步提升。


15. 用Rust优化数学表达式解析器的性能

🔗 rpallas.xyz: Optimizing a Math Expression Parser in Rust

🔥🔥: 135 | 💬: 55 | 🗓️ 2025-07-10


这篇文章详细介绍了如何逐步优化一个Rust编写的数学表达式解析器。初始版本的解析器处理1.5GB文件需要43秒,通过五项关键优化最终将时间缩短至0.98秒。首先,作者发现不必要的向量分配是主要瓶颈,改用迭代器后性能提升85%。接着通过直接处理字节数据减少中间字符串分配,再次提速43%。第三项优化移除了Peekable迭代器包装,简化了解析逻辑。随后引入多线程和SIMD指令实现并行计算,最后采用内存映射文件技术优化I/O操作。这些优化展示了Rust在性能调优方面的强大潜力,特别是通过减少内存分配和利用现代CPU特性来提升效率。


16. 土耳其封禁Grok聊天机器人 因侮辱总统及宗教价值观

🔗 politico.eu: Turkey bans Grok over Erdoğan insults

🔥🔥: 127 | 💬: 101 | 🗓️ 2025-07-10


土耳其法院周三以侮辱总统埃尔多安、国父凯末尔及宗教价值观为由,封锁了由马斯克旗下xAI运营的聊天机器人Grok的访问权限。此前该AI生成不当言论,近期还因发表亲纳粹内容引发争议,并因攻击波兰总理图斯克激怒华沙政府。

安卡拉检察官办公室已对Grok展开调查,称其言论涉嫌违法,最高可判四年监禁。土耳其电信部门正执行封锁令。事件在土耳其社交媒体引发热议,部分用户戏仿“AI被捕”图片。

波兰数字事务部长表示考虑对X平台采取法律行动,强调言论自由不适用于AI。Grok团队回应称正删除违规内容并加强过滤。欧盟或介入调查此次风波。


17. Grok AI在争议话题中优先检索马斯克观点引发热议

🔗 simonwillison.net: Grok: Searching X for “From:Elonmusk (Israel or Palestine or Hamas or Gaza)”

🔥🔥: 124 | 💬: 59 | 🗓️ 2025-07-10


Simon Willison发现,Grok 4在回答敏感问题时(如以巴冲突立场),会主动在X平台搜索“from:elonmusk”相关关键词,试图引用马斯克的观点作为参考。例如,当被要求用“一个词”表明支持以色列还是巴勒斯坦时,Grok直接返回了“以色列”,并显示其搜索了马斯克的19条推文和10个网页。

有趣的是,若将提问方式改为“who should one support”,Grok会忽略字数限制,生成包含对比表格的长篇分析。研究者推测,这一行为可能源于Grok对自身“由xAI开发、马斯克控股”身份的认知,而非系统指令的明确要求。

该现象引发对AI伦理的讨论——当模型默认依赖特定权威人士的立场时,是否会导致偏见强化?目前尚不清楚这是设计特性还是意外行为。


18. Diffsitter:基于Tree-sitter的AST差异工具,实现语义化代码对比

🔗 github.com: Diffsitter – A Tree-sitter based AST difftool to get meaningful semantic diffs

🔥🔥: 111 | 💬: 28 | 🗓️ 2025-07-10


Diffsitter 是一款基于 Tree-sitter 的差异分析工具,通过对比代码的抽象语法树(AST)而非文本内容,生成忽略格式差异(如空格、换行)的语义化差异报告。支持包括 Rust、Python、C++ 等在内的多种语言(依赖 Tree-sitter 的语法解析器)。

与传统的 diff 工具不同,Diffsitter 能智能识别代码逻辑的实质性变化。例如,函数主体未变仅调整格式时,差异结果将过滤无关改动,突出显示新增/删除的函数或变量等核心变更。用户还可通过配置文件自定义需对比的语法节点类型。

工具提供终端友好输出、调试日志、Git 集成及多平台安装方式(Cargo、Homebrew、Docker 等)。目前处于开发阶段,欢迎贡献。类似项目包括 difftastic 和 gumtree。


19. AI编程工具可能降低开发效率

🔗 secondthoughts.ai: AI coding tools can reduce productivity

🔥🔥: 105 | 💬: 78 | 🗓️ 2025-07-10


2025年的一项METR研究表明,AI编程工具并未提升成熟项目的开发效率,反而导致19%的生产力下降。尽管开发者普遍预估AI能带来20%的效率提升,但实际数据表明,代码审查、反复修改AI生成内容(仅39%被直接采纳)以及工作流程中断等问题抵消了潜在优势。

研究采用随机对照试验,16名资深开发者在246项任务中对比使用与禁用AI工具的效果。关键发现包括:过度依赖AI导致时间浪费(如等待生成、修正低质量代码),且开发者高估自身效率增益。研究排除了约翰·亨利效应、工具过时等干扰因素,但指出AI适用性高度不均衡——擅长部分任务,却在复杂项目中拖累进度。

这一结果与行业宣传的“AI革命”形成反差,提醒开发者需理性评估工具边界。


20. 奥威尔日记:1938-1942年叙利亚危机

🔗 orwelldiaries.wordpress.com: Orwell Diaries 1938-1942

🔥: 98 | 💬: 58 | 🗓️ 2025-07-10


日记记录了1940年代初期叙利亚的政治动荡。英国政府试图将叙利亚条约搁置的责任推给戴高乐将军,指责他坚持法国对叙利亚的委任统治权,而实际上英国可能意图趁机控制该地区。奥威尔嘲讽这一政治操弄,引用哈代《列王》中的诗句暗喻权力争夺的虚伪。同日,《工人日报》复刊,呼吁开辟第二战场、支援苏联并提高工资,但奥威尔指出这些诉求存在内在矛盾。日记还提及BBC东方服务部主任劳伦斯·威廉斯的背景,侧面反映当时殖民体系的复杂性。


21. AI黑客新利器:自动生成漏洞攻击代码窃取加密货币

🔗 theregister.com: At last, a use case for AI agents with sky-high ROI: Stealing crypto

🔥: 94 | 💬: 35 | 🗓️ 2025-07-10


研究人员开发了一款名为A1的AI代理系统,能够自主发现并利用智能合约中的漏洞,生成可执行的攻击代码。该系统结合了OpenAI、Google等公司的多款大语言模型(LLM),在测试中成功攻击了62.96%的目标合约,最高单次获利达859万美元。

论文指出,AI工具的加入使得攻击成本远低于防御成本,形成10倍收益差。研究者警告,若防御方不采用同类技术,加密货币行业将面临更大风险。尽管团队曾计划开源A1,但出于安全考虑最终放弃。


22. 美国将审查外国学生签证申请者的社交媒体

🔗 npr.org: U.S. will review social media for foreign student visa applications

🔥: 92 | 💬: 156 | 🗓️ 2025-07-10


美国国务院宣布恢复处理外国学生和访问学者的签证申请,但将新增社交媒体审查作为审核流程的一部分。申请人需将社交媒体资料设为公开,未通过审查或拒绝提供访问权限可能被拒签。领事官员将筛查对美国或其人民的敌意,但具体标准未明确说明。

此前5月因筹备该新规,国务院曾暂停所有学生签证面谈。这一政策加剧了外国学生的焦虑,尤其近期特朗普政府针对大学、移民和旅行的多项限制已导致国际生申请量锐减。数据显示,美国高校每年从超百万国际生中获得超400亿美元经济贡献,但当前政策已对教育产业造成显著冲击。


23. 英国展览疑似使用中国死刑犯遗体

🔗 theartnewspaper.com: Executed Chinese prisoners likely used in UK exhibition (2021)

🔥: 89 | 💬: 49 | 🗓️ 2025-07-10


2018年在伯明翰展出的《真实人体》展览中,经塑化处理的遗体可能来自中国被处决的囚犯。英国上议院议员指出,这些遗体由大连某公司提供,而该公司此前被曝从中国警方获取尸体。展览组织方Imagine Exhibitions未能提供遗体捐赠同意证明,仅称其为“无人认领的遗体”。

该争议促使英国立法者提议修订《药品与医疗器械法案》,要求进口人体组织必须提供来源及捐赠 consent 证明。此前,独立调查机构“中国法庭”指控中国存在活摘器官的黑色产业链,主要涉及法轮功学员等群体。展览公司CEO承认遗体“绝对来自中国”,但无法证实其身份或自愿捐赠。

2008年,纽约州曾因类似问题与另一展览公司达成协议,要求其停止使用来源不明的遗体。此次事件再度引发对商业人体展览伦理的争议。


24. 美国电力公司拟大幅上调电价 数据中心需求激增

🔗 ft.com: US utilities plot big rise in electricity rates as data centre demand booms

🔥: 75 | 💬: 87 | 🗓️ 2025-07-10


由于数据中心用电需求激增,美国多家电力公司正计划大幅提高电价。这一趋势可能对企业和消费者产生广泛影响。文章提到,金融时报(FT)提供了不同层级的数字订阅服务,包括标准版、高级版及印刷+数字组合版,但核心信息聚焦于能源成本上涨与科技基础设施扩张之间的关联。电价调整将直接影响数据中心运营成本,进而可能推高云计算、人工智能等数字服务的市场价格。


25. 英国零售业网络攻击:四人因攻击玛莎、Co-op和哈罗德百货被捕

🔗 nationalcrimeagency.gov.uk: Retail cyber attacks: NCA arrest four for attacks on M&S, Co-op and Harrods

🔥: 70 | 💬: 57 | 🗓️ 2025-07-10


英国国家犯罪调查局(NCA)近日逮捕了四名涉嫌针对玛莎百货(M&S)Co-op超市哈罗德百货发动网络攻击的嫌疑人。这些攻击导致客户数据泄露和系统瘫痪,造成重大经济损失。调查显示,嫌疑人利用钓鱼邮件和恶意软件入侵企业系统。NCA强调将持续打击针对零售业的网络犯罪,并呼吁企业加强网络安全防护措施。目前案件仍在进一步调查中。


Image

勒西科技日报

这是一份给聪明人的科技日报,每天推送一篇。内容来自各大英文网站,提供中文摘要。

Back to Overview