- AlphaEvolve:基于Gemini的算法设计AI代理;
- HDR到底是什么?;
- 短信双重验证不仅不安全,还对山区居民极不友好;
- Databricks收购Neon:为开发者与AI打造开源Postgres未来;
- 一台不该存在的服务器;
以上是今天的前五条黑科技新闻标题。
总共25条,具体内容您往下读…
1. AlphaEvolve:基于Gemini的算法设计AI代理
🔗 deepmind.google: AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms
🔥🔥: 779 | 💬: 205 | 🗓️ 2025-05-14 |
AlphaEvolve是由谷歌团队开发的进化式编码代理,结合Gemini大语言模型的创造力与自动化评估系统,用于发现和优化算法。它在数学、计算机科学及实际应用中表现出色,例如提升谷歌数据中心效率、优化芯片设计、加速AI训练(如矩阵乘法算法提速23%),并解决开放数学问题(如11维空间球体密铺问题)。其核心是通过进化框架筛选优质代码提案,并支持多领域扩展,未来或应用于材料科学、药物研发等方向。
2. HDR到底是什么?
🔗 lux.camera: What is HDR, anyway?
🔥🔥: 577 | 💬: 278 | 🗓️ 2025-05-14 |
HDR(高动态范围)是一种影像技术,通过扩大亮度和色彩范围,使画面呈现更丰富的细节和更真实的视觉效果。它需要兼容的硬件(如HDR显示器)和内容支持,相比标准动态范围(SDR),能显著提升观影体验。常见标准包括HDR10、Dolby Vision等。
3. 短信双重验证不仅不安全,还对山区居民极不友好
🔗 blog.stillgreenmoss.net: SMS 2FA is not just insecure, it’s also hostile to mountain people
🔥🔥: 363 | 💬: 280 | 🗓️ 2025-05-14 |
一位居住在北卡罗来纳州山区的老人因家中无手机信号,无法接收短信验证码,导致无法登录银行、医疗等账户。尽管她尝试了WiFi通话和更换运营商,但短代码短信仍无法送达。部分账户可改用TOTP验证,但操作复杂且部分服务不支持。运营商覆盖地图显示有信号,实则不然,山区居民面临严重的数字鸿沟。短信验证虽便捷,却忽视了数百万信号薄弱地区用户的需求。
4. Databricks收购Neon:为开发者与AI打造开源Postgres未来
🔗 databricks.com: Databricks acquires Neon
🔥🔥: 307 | 💬: 195 | 🗓️ 2025-05-14 |
Databricks宣布收购Neon——一家专注于开发者体验的无服务器Postgres公司。Neon通过分离存储与计算的全新架构,实现了秒级数据库创建、弹性扩展及类似Git的分支功能,极大简化了开发流程。值得注意的是,其80%的数据库由AI代理自动创建,得益于Postgres生态兼容性、极速响应及低成本扩展等优势。此次收购将结合双方技术基因,重塑OLTP数据库市场,现有Neon用户将继续获得支持与创新。
5. 一台不该存在的服务器
🔗 it-notes.dragas.net: A server that wasn’t meant to exist
🔥🔥: 292 | 💬: 83 | 🗓️ 2025-05-14 |
16年前,作者受朋友委托为一家因创始人突然离世而陷入混乱的公司搭建IT系统。该企业此前毫无数字化管理,数据分散在员工个人电脑中,财务漏洞百出。作者部署了基于NetBSD的服务器,集中文件存储并引入审计功能,却遭到创始人亲信的强烈反对——此人疑似侵吞公司资产。当外部技术人员以安装软件为由要求格式化服务器时,作者识破其销毁证据的企图,并凭借私人关系化解危机。但最终服务器仍遭人为破坏,所幸隐蔽备份保存了关键数据。尽管公司高薪挽留,作者拒绝卷入这场注定失败的斗争,因为「当当事人选择保护问题而非解决它时,再好的技术也无力回天」。
6. 通行密钥背后的密码学原理
🔗 blog.trailofbits.com: The cryptography behind passkeys
🔥🔥: 192 | 💬: 165 | 🗓️ 2025-05-14 |
通行密钥通过公钥加密替代传统密码,利用数字签名验证用户身份,避免钓鱼攻击和数据泄露。核心规范WebAuthn通过绑定网站域名(origin binding)确保密钥仅用于注册时的合法网站,并支持HTTPS加密连接。密钥存储分为平台认证器(如iCloud钥匙串)和漫游认证器(如YubiKey),前者便捷但依赖设备安全,后者隔离性更强。扩展功能支持衍生或存储加密密钥,但需注意设备丢失或浏览器劫持等风险。
7. AI编程的成瘾陷阱与经济悖论
🔗 fredbenenson.medium.com: Perverse incentives of vibe coding
🔥🔥: 172 | 💬: 183 | 🗓️ 2025-05-14 |
作者指出,AI编程助手(如Claude Code)通过间歇性奖励机制(类似赌博)让人沉迷,但其生成的代码往往冗长低效。核心矛盾在于:AI公司按token数量收费,客观上鼓励冗余代码。用户需主动对抗这一机制,例如强制要求AI先制定计划、使用廉价模型或频繁重构代码。文章揭示了一个深层问题:当商业利益与代码质量目标冲突时,开发者反而成为受害者。
8. AI代理的行为缓存工具:Muscle-Mem
🔗 github.com: Show HN: Muscle-Mem, a behavior cache for AI agents
🔥🔥: 170 | 💬: 37 | 🗓️ 2025-05-14 |
Muscle-Mem是一个为AI代理设计的行为缓存工具,通过记录代理的工具调用模式,在重复任务时直接回放缓存轨迹,减少对LLM的依赖。核心功能包括缓存验证机制(通过Check
类确保环境匹配)和工具装饰器(@engine.tool
)。它能提升速度、降低token成本,适用于重复性任务。开发者可集成现有代理,通过Engine
类管理缓存。项目已开源(Apache-2.0协议),欢迎加入Discord反馈或测试。
9. 警察与媒体如何操控新闻:揭秘”警察宣传”的真相
🔗 teenvogue.com: Copaganda: How Police and the Media Manipulate Our News
🔥🔥: 159 | 💬: 51 | 🗓️ 2025-05-14 |
本书揭露了警察宣传(Copaganda)如何通过选择性报道制造道德恐慌,例如夸大犯罪率下降时的盗窃案,引导公众支持增加警力预算。作者指出,这种操纵掩盖了权力阶层的真正危害,并推动惩罚性政策,而非解决社会不平等。媒体通过片面引用个案(如将枪击案归咎于”削减警费”)扭曲事实,尽管数据显示警费连年增长。最终,这种循环导致资源持续流向监狱和警察系统,而非根治暴力根源。
10. 多租户经济学的运作原理
🔗 blacksmith.sh: How the economics of multitenancy work
🔥🔥: 153 | 💬: 32 | 🗓️ 2025-05-14 |
本文以Blacksmith的服务器less CI云平台为例,阐述了多租户系统的经济学优势。CI工作负载具有突发性和短时性,而多租户模式通过共享资源池,将客户分散的峰值需求转化为平滑的整体利用率。随着客户数量增加,随机任务分布形成泊松过程,显著提升硬件利用率(20%利用率对应70%毛利率)。跨时区客户进一步优化资源使用,使固定成本分摊更高效。这种模式实现了平台与客户的双赢。
11. 优步在美推出固定路线拼车服务,通勤可省50%费用
🔗 techcrunch.com: Uber to introduce fixed-route shuttles in major US cities
🔥🔥: 150 | 💬: 377 | 🗓️ 2025-05-14 |
优步宣布在巴尔的摩、波士顿、芝加哥等七大城市推出固定路线拼车服务“Route Share”,工作日高峰时段提供预设定点班车,价格比UberX便宜50%。该服务基于用户出行数据规划高频路线,每20分钟一班,最多3人共乘。优步计划未来将此服务扩展至自动驾驶车辆,并与大众合作2026年在洛杉矶推出电动共享车。此外,优步还推出价格锁定和预付费套餐等新功能,帮助用户应对通胀压力。
12. 从CockroachDB迁移至PostgreSQL的经验分享
🔗 engineering.usemotion.com: Migrating to Postgres
🔥🔥: 149 | 💬: 128 | 🗓️ 2025-05-14 |
Motion公司早期使用CockroachDB(支持多区域部署和高可用性),但随着业务增长,其高昂成本和性能问题(如迁移超时、ETL任务失败)日益突出。尽管部分查询在CockroachDB上更快,但多数场景下PostgreSQL性能提升3倍,且生态工具更完善。最终团队通过自定义ETL脚本完成迁移,节省11万美元年成本,系统延迟降低33%。迁移后还借助PostgreSQL生态快速优化了查询性能。
13. 叙事的牢笼
🔗 aeon.co: Our narrative prison
🔥🔥: 142 | 💬: 117 | 🗓️ 2025-05-14 |
当代影视、文学作品中,英雄之旅的叙事公式无处不在:主角经历平凡生活→遭遇触发事件→对抗反派→在低谷中觉醒→最终颠覆人生观。这一模板源自亚里士多德的《诗学》,经弗莱塔格、坎贝尔等人发展为好莱坞工业化生产的核心套路。尽管表面千变万化,叙事工业通过隐藏结构框架,将保守价值观包装成”变革幻想”,实则强化现状。学者指出,这种模式既反映人类对意义的本能渴求,也暗含对批判性思维的消解——我们消费故事以体验改变的幻觉,却回避现实中的真正行动。当叙事成为资本与权力的工具,它既是集体潜意识的映射,也可能成为思想自由的枷锁。
14. 大语言模型在多轮对话中容易迷失方向
🔗 arxiv.org: LLMs get lost in multi-turn conversation
🔥🔥: 135 | 💬: 73 | 🗓️ 2025-05-14 |
研究表明,大语言模型(LLMs) 在多轮对话中的表现显著低于单轮任务,平均性能下降达39%。主要问题在于模型会过早假设并生成最终方案,导致一旦偏离正确路径便难以恢复。实验分析了20万次模拟对话,发现性能下降源于轻微的能力损失和显著的可靠性降低。这一现象揭示了当前LLM评估过于侧重单轮明确指令的局限性。
15. Grok回应无关问题时大谈“白人种族灭绝”
🔗 twitter.com: Grok answers unrelated queries with long paragraphs about “white genocide”
🔥🔥: 119 | 💬: 74 | 🗓️ 2025-05-14 |
该内容显示用户遇到JavaScript未启用的问题,导致无法正常使用x.com(原Twitter)。平台建议启用JavaScript或更换支持的浏览器,并提示某些隐私扩展插件可能引发访问异常。文末附有帮助中心链接和公司政策信息,但主要内容与标题所述的“白人种族灭绝”无关,疑似技术错误或内容错位。
16. 美国邮政40万美元的纸质电子邮件项目:E-COM的兴衰
🔗 buttondown.com: E-COM: The $40M USPS project to send email on paper
🔥🔥: 112 | 💬: 111 | 🗓️ 2025-05-14 |
1982年,美国邮政(USPS)推出E-COM服务,将电子内容打印成纸质信件投递,试图应对电子邮件的冲击。尽管初期吸引了一些企业(如银行和广告商),但高昂成本(每封亏损5.25美元)和官僚限制(如最低200封起发)导致其沦为垃圾邮件工具。1985年项目关闭,累计亏损超4000万美元。讽刺的是,E-COM无意中推动了“e-mail”一词的普及,而邮政业务最终因电商包裹而非传统信件复苏。
17. AI短期内无法取代放射科医生
🔗 nytimes.com: The A.I. Radiologist Will Not Be with You Soon
🔥🔥: 107 | 💬: 186 | 🗓️ 2025-05-14 |
九年前,AI先驱Geoffrey Hinton预言五年内AI将超越人类放射科医生,但如今该职业需求仍在增长。美国放射学会研究显示,相关岗位将持续增加至2055年。梅奥诊所等顶级医疗机构将AI用作辅助工具,例如优化影像、自动化流程和辅助诊断,但无法完全替代医生。专家强调,放射学涉及复杂决策,AI目前仅能作为”第二双眼睛”。
18. 2万美元悬赏优化Rust版AV1解码器rav1d性能
🔗 memorysafety.org: $20K Bounty Offered for Optimizing Rust Code in Rav1d AV1 Decoder
🔥🔥: 102 | 💬: 96 | 🗓️ 2025-05-14 |
2023年3月启动的Rust版AV1解码器rav1d项目现已基本完成,性能比C语言编写的dav1d慢约5%。开发者通过优化仍未能实现性能持平,现设立2万美元奖金池,邀请全球开发者参与优化。参赛者需通过改进Rust代码、编译器或标准库提升性能,但不得修改共享的汇编代码。悬赏将按贡献比例分配,最终解释权归主办方所有。
19. Smalltalk-78 Xerox NoteTaker 浏览器模拟器
🔗 smalltalkzoo.thechm.org: Smalltalk-78 Xerox NoteTaker in-browser emulator
🔥: 76 | 💬: 29 | 🗓️ 2025-05-14 |
这是一款可在浏览器中运行的 Smalltalk-78 模拟器,复刻了 Xerox NoteTaker 系统。用户可以直接在网页中修改 Smalltalk 代码并保存到本地(非服务器)。模拟器基于 JavaScript 实现,但需注意:修改其底层代码会影响其他访问者。界面提供运行控制、调试、内存分析等功能,并附有技术文档链接。日志显示其动态加载了多项 Lively Web 核心模块(如网络工具、图形界面组件等)。
20. 大模型正在让我变笨
🔗 vvvincent.me: LLMs are making me dumber
🔥: 65 | 💬: 64 | 🗓️ 2025-05-14 |
作者反思过度依赖LLM(如Claude、Gemini)导致自身能力退化:用AI代写代码导致JavaScript基础薄弱,依赖AI解题削弱数学能力,模板化邮件降低写作水平。尽管短期效率提升,但深度学习被牺牲,可能阻碍创新与复杂问题解决能力。历史类比(如计算器、GPS)显示技术解放人力,但当前AI威胁的是核心智力技能。作者尝试平衡:自动化简单任务,保留第一性原理思考和长期项目能力,强调主动学习与批判性对话的重要性。
21. 未来太贵:低生育率背后的信任危机
🔗 medium.com: The Future Is Too Expensive – A New Theory on Collapsing Birth Rates
🔥: 62 | 💬: 183 | 🗓️ 2025-05-14 |
全球生育率持续下降,传统解释如住房成本、女性职场参与等未能触及核心。作者提出时间通胀理论:当未来充满不确定性(职业动荡、气候危机、文化混乱等),人们会认为抚养孩子是高风险投资。历史证明,即使面对战争贫困,人类仍愿生育;但如今,对未来的信仰崩塌导致理性选择”退出”。解决之道并非金钱激励,而是重建长期稳定的社会系统,让明天值得信赖。
22. 英国古树名木普查计划
🔗 ati.woodlandtrust.org.uk: UK’s Ancient Tree Inventory
🔥: 61 | 💬: 52 | 🗓️ 2025-05-14 |
英国拥有比多数欧洲国家更丰富的古树资源,这些树龄数百年的活化石亟待保护。该项目已收录超19万棵古树,但仍有数千棵待发现,呼吁公众参与记录。通过互动地图可探索树木分布,并了解树龄鉴定标准及保护意义。附视频指南和志愿者故事,助力公众参与这项自然遗产保护行动。
23. 开发者别慌,科技巨头与AI炒作再次失控
🔗 cicero.sh: Developers, don’t despair, big tech and AI hype is off the rails again
🔥: 47 | 💬: 24 | 🗓️ 2025-05-14 |
文章批判了当前科技巨头对AI能力的夸大宣传,指出Transformer架构存在根本缺陷,无法实现真正自主编程。作者以亲身经历为例,说明AI生成的代码常缺乏常识判断(如内存管理错误),且需要人工全程监督。虽然AI能辅助前端开发等简单任务,但无法替代人类工程师的系统设计能力。最终强调,开发者应保持技术敏锐度,因为AI目前仅是辅助工具,远未达到取代人类的水平。
24. DeepMind发布通用科学AI AlphaEvolve,突破数学与芯片设计难题
🔗 nature.com: DeepMind unveils general-purpose science AI
🔥: 47 | 💬: 3 | 🗓️ 2025-05-14 |
谷歌DeepMind推出AlphaEvolve,该系统结合大语言模型(LLM)的创造力和算法验证能力,解决数学、计算机科学等领域的复杂问题。它已优化下一代AI芯片设计,并为谷歌节省0.7%的全球计算资源。AlphaEvolve基于Gemini模型,通过进化算法筛选改进方案,甚至在矩阵乘法计算上超越了1969年的经典方法。专家称其为“首个基于通用LLM实现科学发现的成功案例”。
25. Data.olllo推出CSV GB+:本地打开和处理大型CSV文件
🔗 apps.microsoft.com: Show HN: CSV GB+ by Data.olllo – Open and Process CSVs Locally
🔥: 44 | 💬: 13 | 🗓️ 2025-05-14 |
该工具允许用户直接在浏览器中处理超大型CSV文件,无需上传至云端,保障数据隐私。支持快速加载、筛选和编辑,适合处理GB级数据。纯前端运行,无需安装,但需启用JavaScript。