勒西科技日报

OpenAI 愤怒指责 DeepSeek 可能窃取了其数据；
DeepSeek数据库泄露敏感信息，包括聊天记录；
为什么DeepSeek必须开源；
DeepSeek的R1-Zero与R1分析；
我不想让AI“润色”我；

以上是今天的前五条黑科技新闻标题。

总共20条，具体内容您往下读…

1. OpenAI 愤怒指责 DeepSeek 可能窃取了其数据

🔗 404media.co: OpenAI Furious DeepSeek Might Have Stolen All the Data OpenAI Stole from Us

🔥🔥: 1284 | 💬: 12 | 🗓️ 2025-01-29

OpenAI 和微软正在调查中国 AI 初创公司 DeepSeek 是否未经授权使用了 OpenAI 的数据来训练其 R1 模型。OpenAI 指责 DeepSeek 通过蒸馏技术从 OpenAI 模型中提取知识，尽管 OpenAI 自身也因未经授权使用大量数据而面临诉讼。OpenAI 辩称其行为符合合理使用原则，但 DeepSeek 通过更高效的强化学习策略，成功开发出性能优越的模型，挑战了 OpenAI 的“数据规模至上”理论。

2. DeepSeek数据库泄露敏感信息，包括聊天记录

🔗 wiz.io: Exposed DeepSeek database leaking sensitive information, including chat history

🔥🔥: 526 | 💬: 340 | 🗓️ 2025-01-29

Wiz Research发现DeepSeek的一个公开访问的ClickHouse数据库，暴露了超过100万条日志流，包含聊天记录、密钥和后端细节等敏感信息。DeepSeek已迅速修复此问题。此次事件凸显了AI服务快速采用中的安全风险，强调基础设施安全的重要性。

3. 为什么DeepSeek必须开源

🔗 getlago.com: Why DeepSeek had to be open source

🔥🔥: 496 | 💬: 269 | 🗓️ 2025-01-29

DeepSeek提供了开源版本和高级版本，分别适用于小型项目和需要更多控制与灵活性的团队。无论选择哪种方式，用户都无需担心计费问题，可以专注于构建产品。开源版本适合预算有限的项目，而高级版本则提供更多功能和支持。

4. DeepSeek的R1-Zero与R1分析

🔗 arcprize.org: An analysis of DeepSeek’s R1-Zero and R1

🔥🔥: 483 | 💬: 188 | 🗓️ 2025-01-29

DeepSeek发布的R1-Zero和R1系统在ARC-AGI-1基准测试中表现出色，尤其是R1-Zero，它通过纯强化学习实现推理，无需人类标注数据。这一突破表明，SFT（监督微调）在某些领域并非必要，且推理系统的可靠性可通过增加计算资源提升。未来，推理需求将大幅增长，推动AI系统向更高效、更通用的方向发展。

5. 我不想让AI“润色”我

🔗 thebloggess.com: I do not want AI to “polish” me

🔥🔥: 395 | 💬: 252 | 🗓️ 2025-01-29

作者在写邮件时，Gmail的“润色”功能突然弹出，试图改写她的邮件，让她感到不适。她拒绝使用AI的建议，认为自己的独特风格（如拼写错误和随意的语气）才是真实的表达。然而，AI不断干预，甚至在博客中试图用AI生成图片替代她选择的图片。作者对此感到无奈，认为AI过度干预创作过程，破坏了她的个人风格。

6. 希捷：’全新’硬盘已使用数万小时

🔗 tomshardware.com: Seagate: ‘new’ hard drives used for tens of thousands of hours

🔥🔥: 329 | 💬: 198 | 🗓️ 2025-01-29

德国媒体Heise.de揭露，许多读者购买的希捷硬盘标榜全新，实则为二手产品。部分硬盘使用时间高达50,000小时，且SMART数据被重置。希捷表示这些是OEM型号，不适用五年保修。问题涉及多家零售商，包括亚马逊等大型平台。希捷正在调查此事。

7. 商业客机与黑鹰直升机在里根机场附近相撞

🔗 mediaite.com: Commercial jet collides with Black Hawk helicopter near Reagan airport

🔥🔥: 288 | 💬: 218 | 🗓️ 2025-01-29

2025年1月29日晚，一架从堪萨斯州威奇托飞来的商业客机在弗吉尼亚州北部的罗纳德·里根华盛顿国家机场附近与一架黑鹰直升机相撞。事故发生后，机场航班暂停，搜救团队正在波托马克河搜寻幸存者。初步调查显示，涉事飞机为PSA航空的庞巴迪CRJ700支线客机。目前伤亡情况不明，社交媒体上已出现爆炸和搜救行动的影像。

8. 2032年小行星撞击地球概率1%，能量达8百万吨

🔗 cneos.jpl.nasa.gov: Asteroid Impact on Earth 2032 with Probability 1% and 8Mt Energy

🔥🔥: 285 | 💬: 230 | 🗓️ 2025-01-29

该文本描述了2032年一颗小行星可能撞击地球的情况，撞击概率为1%，释放能量约为8百万吨。文中详细介绍了评估撞击风险的指标，如Torino等级、Sigma VI、Sigma MC等，用于量化轨道不确定性和撞击可能性。尽管概率较低，但潜在能量巨大，需持续监测。

9. Google Pixel 4a 旧固件消失，用户被困在电池更新问题中

🔗 androidcentral.com: Google Pixel 4a’s old firmware is gone, trapping users on buggy battery update

🔥🔥: 265 | 💬: 254 | 🗓️ 2025-01-29

Google 为 Pixel 4a 推出的电池更新导致严重电池耗电问题，且删除了旧固件，用户无法回滚。Google 已承认问题并提供补偿：免费电池更换、50 美元现金或 100 美元 Pixel 购买优惠。此次更新本应改善电池性能，却使问题恶化，许多用户陷入困境。

10. SmolGPT：一个用于从头训练小型LLM的极简PyTorch实现

🔗 github.com: SmolGPT: A minimal PyTorch implementation for training a small LLM from scratch

🔥🔥: 256 | 💬: 34 | 🗓️ 2025-01-29

SmolGPT 是一个基于 PyTorch 的极简实现，专为教育和简单性设计，支持高效训练、Flash Attention 和现代采样技术。它包含 GPT 模型、混合精度训练、数据集处理和自定义分词器，适合初学者学习LLM训练流程。

11. 年轻大麻使用者大脑功能下降，迄今最大规模研究揭示

🔗 newatlas.com: Younger cannabis users have reduced brain function, finds largest study yet

🔥🔥: 232 | 💬: 188 | 🗓️ 2025-01-29

一项针对18至36岁人群的最大规模研究发现，大麻使用会降低认知测试中的大脑功能，尤其是工作记忆任务。研究指出，近期使用和长期大量使用大麻均与大脑活动减少相关，特别是在前额叶皮层和脑岛区域。研究人员建议，在认知任务前戒断大麻可能有助于提升表现，但长期使用者戒断可能伴随戒断症状。

12. 我们的手机正在扼杀我们的性感能力

🔗 catherineshannon.substack.com: Our phones are killing our ability to feel sexy (2024)

🔥🔥: 223 | 💬: 224 | 🗓️ 2025-01-29

手机和互联网的过度使用不仅削弱了我们的注意力，还让我们失去了性感的感觉。Eros（欲望）是一种身体体验，而手机让我们脱离身体，陷入虚拟世界。即时获取一切让我们失去了渴望和冒险的能力，而这些都是性感的核心。我们需要放下手机，重新感受真实生活中的短暂与美好。

13. 食盐加碘对认知改善的作用：研究（2013）

🔗 discovermagazine.com: Adding iodine to salt played a role in cognitive improvements: research (2013)

🔥🔥: 207 | 💬: 147 | 🗓️ 2025-01-29

研究表明，食盐加碘在20世纪美国人口的认知改善中发挥了重要作用。自1924年起，碘被添加到食盐中，最初是为了减少甲状腺肿的发生。研究发现，碘缺乏是全球可预防智力障碍的主要原因，而加碘盐显著提高了低碘地区人口的智商，平均提升了3.5点。尽管加碘导致了一些甲状腺相关死亡，但其对大脑发育的积极影响不可忽视，甚至可能解释了弗林效应的部分原因。

14. 杰文斯悖论

🔗 en.wikipedia.org: Jevons paradox

🔥🔥: 181 | 💬: 157 | 🗓️ 2025-01-29

杰文斯悖论指出，技术进步提高资源使用效率后，虽然单次使用所需资源减少，但由于成本下降，总需求增加，导致资源消耗总量上升。这一现象由经济学家威廉·斯坦利·杰文斯在1865年提出，最初针对煤炭使用，现扩展至其他资源。反弹效应和卡祖姆-布鲁克斯假说进一步解释了这一现象，强调效率提升可能加速资源消耗。因此，单纯提高效率未必减少资源使用，需结合政策干预（如碳税）来控制需求。

15. 制作让Gorillaz成名的视频

🔗 animationobsessive.substack.com: Making the video that made Gorillaz

🔥🔥: 181 | 💬: 40 | 🗓️ 2025-01-29

本文讲述了动画师Pete Candeland如何通过Clint Eastwood音乐视频为Gorillaz奠定视觉风格。Candeland结合2D与CG技术，创造了独特的动画风格，并深入探讨了视频制作中的创意与技术挑战。

16. 我们遭遇了一次极其精心准备的钓鱼垃圾邮件攻击

🔗 utcc.utoronto.ca: We got hit by an alarmingly well-prepared phish spammer

🔥🔥: 173 | 💬: 105 | 🗓️ 2025-01-29

2025年1月28日，我们遭遇了一次精心准备的钓鱼攻击。攻击者通过窃取的密码迅速注册了我们的VPN服务，并利用内部SMTP网关发送垃圾邮件。攻击者显然事先研究过我们的邮件和VPN环境，行动迅速且高效。这次事件提醒我们，钓鱼攻击者的准备工作越来越充分，我们需要加强防范。

17. 加州总检察长警告AI公司：几乎所有行为可能违法

🔗 gizmodo.com: Cali’s AG Tells AI Companies Almost Everything They’re Doing Might Be Illegal

🔥🔥: 172 | 💬: 143 | 🗓️ 2025-01-29

加州总检察长Rob Bonta发布法律备忘录，指出AI行业可能涉及多项违法行为，包括利用AI进行欺骗性内容生成、虚假宣传AI系统的能力，以及开发或销售可能对受保护群体产生歧视性影响的AI系统。备忘录强调，AI的开发和使用必须符合伦理和法律，否则可能面临法律制裁。此外，AI公司在版权法等领域也面临诸多法律挑战。

18. 英特尔不懂如何成为代工厂，蒂姆·库克曾对台积电CEO表示

🔗 tomshardware.com: Intel doesn’t know how to be a foundry, Tim Cook reportedly said in 2011

🔥🔥: 153 | 💬: 92 | 🗓️ 2025-01-29

苹果在2010年代初期开始自研iPhone和iPad处理器时，曾考虑使用英特尔定制代工（ICF），但发现其不适合外部客户。最终选择了台积电，因其客户至上的服务态度和灵活的技术响应能力。库克曾表示，英特尔缺乏代工厂所需的服务意识。台积电通过满足苹果的定制需求，逐步超越英特尔，成为全球领先的半导体制造商。

19. 零停机时间完成Postgres重大升级

🔗 instantdb.com: A major Postgres upgrade with zero downtime

🔥🔥: 148 | 💬: 47 | 🗓️ 2025-01-29

Instant团队在圣诞节前发现其Aurora Postgres实例需要进行重大版本升级。他们参考了Lyft团队的升级经验，但通过调整主库切换方式，最终实现了零停机时间的升级。团队首先尝试了原地升级和蓝绿部署，但由于复制槽问题，这些方法均不可行。最终，他们通过手动创建Postgres 16副本、切换订阅和写入流，成功完成了升级。这一过程展示了在小规模系统中，精细控制连接和算法设计如何实现零停机升级。

20. 死去的游戏

🔗 garry.net: Dead Games

🔥🔥: 145 | 💬: 50 | 🗓️ 2025-01-29

文章讨论了未成功发布的游戏中制作的资源（如模型、音效、动画）的命运。作者认为这些资源被丢弃是一种浪费，建议开发者将资源免费开放或出售。有人提议建立一个开源资源库，方便开发者共享和使用这些资源。

勒西科技日报 - 2025年01月29日