1. OpenAI 愤怒指责 DeepSeek 可能窃取了其数据;
  2. DeepSeek数据库泄露敏感信息,包括聊天记录;
  3. 为什么DeepSeek必须开源;
  4. DeepSeek的R1-Zero与R1分析;
  5. 我不想让AI“润色”我;

以上是今天的前五条黑科技新闻标题。

总共20条,具体内容您往下读…

1. OpenAI 愤怒指责 DeepSeek 可能窃取了其数据

🔗 404media.co: OpenAI Furious DeepSeek Might Have Stolen All the Data OpenAI Stole from Us

🔥🔥: 1284 | 💬: 12 | 🗓️ 2025-01-29


OpenAI 和微软正在调查中国 AI 初创公司 DeepSeek 是否未经授权使用了 OpenAI 的数据来训练其 R1 模型。OpenAI 指责 DeepSeek 通过蒸馏技术从 OpenAI 模型中提取知识,尽管 OpenAI 自身也因未经授权使用大量数据而面临诉讼。OpenAI 辩称其行为符合合理使用原则,但 DeepSeek 通过更高效的强化学习策略,成功开发出性能优越的模型,挑战了 OpenAI 的“数据规模至上”理论。


2. DeepSeek数据库泄露敏感信息,包括聊天记录

🔗 wiz.io: Exposed DeepSeek database leaking sensitive information, including chat history

🔥🔥: 526 | 💬: 340 | 🗓️ 2025-01-29


Wiz Research发现DeepSeek的一个公开访问的ClickHouse数据库,暴露了超过100万条日志流,包含聊天记录、密钥和后端细节等敏感信息。DeepSeek已迅速修复此问题。此次事件凸显了AI服务快速采用中的安全风险,强调基础设施安全的重要性。


3. 为什么DeepSeek必须开源

🔗 getlago.com: Why DeepSeek had to be open source

🔥🔥: 496 | 💬: 269 | 🗓️ 2025-01-29


DeepSeek提供了开源版本高级版本,分别适用于小型项目和需要更多控制与灵活性的团队。无论选择哪种方式,用户都无需担心计费问题,可以专注于构建产品。开源版本适合预算有限的项目,而高级版本则提供更多功能和支持。


4. DeepSeek的R1-Zero与R1分析

🔗 arcprize.org: An analysis of DeepSeek’s R1-Zero and R1

🔥🔥: 483 | 💬: 188 | 🗓️ 2025-01-29


DeepSeek发布的R1-ZeroR1系统在ARC-AGI-1基准测试中表现出色,尤其是R1-Zero,它通过纯强化学习实现推理,无需人类标注数据。这一突破表明,SFT(监督微调)在某些领域并非必要,且推理系统的可靠性可通过增加计算资源提升。未来,推理需求将大幅增长,推动AI系统向更高效、更通用的方向发展。


5. 我不想让AI“润色”我

🔗 thebloggess.com: I do not want AI to “polish” me

🔥🔥: 395 | 💬: 252 | 🗓️ 2025-01-29


作者在写邮件时,Gmail的“润色”功能突然弹出,试图改写她的邮件,让她感到不适。她拒绝使用AI的建议,认为自己的独特风格(如拼写错误和随意的语气)才是真实的表达。然而,AI不断干预,甚至在博客中试图用AI生成图片替代她选择的图片。作者对此感到无奈,认为AI过度干预创作过程,破坏了她的个人风格。


6. 希捷:’全新’硬盘已使用数万小时

🔗 tomshardware.com: Seagate: ‘new’ hard drives used for tens of thousands of hours

🔥🔥: 329 | 💬: 198 | 🗓️ 2025-01-29


德国媒体Heise.de揭露,许多读者购买的希捷硬盘标榜全新,实则为二手产品。部分硬盘使用时间高达50,000小时,且SMART数据被重置。希捷表示这些是OEM型号,不适用五年保修。问题涉及多家零售商,包括亚马逊等大型平台。希捷正在调查此事。


7. 商业客机与黑鹰直升机在里根机场附近相撞

🔗 mediaite.com: Commercial jet collides with Black Hawk helicopter near Reagan airport

🔥🔥: 288 | 💬: 218 | 🗓️ 2025-01-29


2025年1月29日晚,一架从堪萨斯州威奇托飞来的商业客机在弗吉尼亚州北部的罗纳德·里根华盛顿国家机场附近与一架黑鹰直升机相撞。事故发生后,机场航班暂停,搜救团队正在波托马克河搜寻幸存者。初步调查显示,涉事飞机为PSA航空的庞巴迪CRJ700支线客机。目前伤亡情况不明,社交媒体上已出现爆炸和搜救行动的影像。


8. 2032年小行星撞击地球概率1%,能量达8百万吨

🔗 cneos.jpl.nasa.gov: Asteroid Impact on Earth 2032 with Probability 1% and 8Mt Energy

🔥🔥: 285 | 💬: 230 | 🗓️ 2025-01-29


该文本描述了2032年一颗小行星可能撞击地球的情况,撞击概率为1%,释放能量约为8百万吨。文中详细介绍了评估撞击风险的指标,如Torino等级、Sigma VI、Sigma MC等,用于量化轨道不确定性和撞击可能性。尽管概率较低,但潜在能量巨大,需持续监测。


9. Google Pixel 4a 旧固件消失,用户被困在电池更新问题中

🔗 androidcentral.com: Google Pixel 4a’s old firmware is gone, trapping users on buggy battery update

🔥🔥: 265 | 💬: 254 | 🗓️ 2025-01-29


Google 为 Pixel 4a 推出的电池更新导致严重电池耗电问题,且删除了旧固件,用户无法回滚。Google 已承认问题并提供补偿:免费电池更换、50 美元现金或 100 美元 Pixel 购买优惠。此次更新本应改善电池性能,却使问题恶化,许多用户陷入困境。


10. SmolGPT:一个用于从头训练小型LLM的极简PyTorch实现

🔗 github.com: SmolGPT: A minimal PyTorch implementation for training a small LLM from scratch

🔥🔥: 256 | 💬: 34 | 🗓️ 2025-01-29


SmolGPT 是一个基于 PyTorch 的极简实现,专为教育和简单性设计,支持高效训练、Flash Attention 和现代采样技术。它包含 GPT 模型、混合精度训练、数据集处理和自定义分词器,适合初学者学习LLM训练流程。


11. 年轻大麻使用者大脑功能下降,迄今最大规模研究揭示

🔗 newatlas.com: Younger cannabis users have reduced brain function, finds largest study yet

🔥🔥: 232 | 💬: 188 | 🗓️ 2025-01-29


一项针对18至36岁人群的最大规模研究发现,大麻使用会降低认知测试中的大脑功能,尤其是工作记忆任务。研究指出,近期使用和长期大量使用大麻均与大脑活动减少相关,特别是在前额叶皮层和脑岛区域。研究人员建议,在认知任务前戒断大麻可能有助于提升表现,但长期使用者戒断可能伴随戒断症状。


12. 我们的手机正在扼杀我们的性感能力

🔗 catherineshannon.substack.com: Our phones are killing our ability to feel sexy (2024)

🔥🔥: 223 | 💬: 224 | 🗓️ 2025-01-29


手机和互联网的过度使用不仅削弱了我们的注意力,还让我们失去了性感的感觉Eros(欲望)是一种身体体验,而手机让我们脱离身体,陷入虚拟世界。即时获取一切让我们失去了渴望和冒险的能力,而这些都是性感的核心。我们需要放下手机,重新感受真实生活中的短暂与美好。


13. 食盐加碘对认知改善的作用:研究(2013)

🔗 discovermagazine.com: Adding iodine to salt played a role in cognitive improvements: research (2013)

🔥🔥: 207 | 💬: 147 | 🗓️ 2025-01-29


研究表明,食盐加碘在20世纪美国人口的认知改善中发挥了重要作用。自1924年起,碘被添加到食盐中,最初是为了减少甲状腺肿的发生。研究发现,碘缺乏是全球可预防智力障碍的主要原因,而加碘盐显著提高了低碘地区人口的智商,平均提升了3.5点。尽管加碘导致了一些甲状腺相关死亡,但其对大脑发育的积极影响不可忽视,甚至可能解释了弗林效应的部分原因。


14. 杰文斯悖论

🔗 en.wikipedia.org: Jevons paradox

🔥🔥: 181 | 💬: 157 | 🗓️ 2025-01-29


杰文斯悖论指出,技术进步提高资源使用效率后,虽然单次使用所需资源减少,但由于成本下降,总需求增加,导致资源消耗总量上升。这一现象由经济学家威廉·斯坦利·杰文斯在1865年提出,最初针对煤炭使用,现扩展至其他资源。反弹效应卡祖姆-布鲁克斯假说进一步解释了这一现象,强调效率提升可能加速资源消耗。因此,单纯提高效率未必减少资源使用,需结合政策干预(如碳税)来控制需求。


15. 制作让Gorillaz成名的视频

🔗 animationobsessive.substack.com: Making the video that made Gorillaz

🔥🔥: 181 | 💬: 40 | 🗓️ 2025-01-29


本文讲述了动画师Pete Candeland如何通过Clint Eastwood音乐视频为Gorillaz奠定视觉风格。Candeland结合2D与CG技术,创造了独特的动画风格,并深入探讨了视频制作中的创意与技术挑战。


16. 我们遭遇了一次极其精心准备的钓鱼垃圾邮件攻击

🔗 utcc.utoronto.ca: We got hit by an alarmingly well-prepared phish spammer

🔥🔥: 173 | 💬: 105 | 🗓️ 2025-01-29


2025年1月28日,我们遭遇了一次精心准备的钓鱼攻击。攻击者通过窃取的密码迅速注册了我们的VPN服务,并利用内部SMTP网关发送垃圾邮件。攻击者显然事先研究过我们的邮件和VPN环境,行动迅速且高效。这次事件提醒我们,钓鱼攻击者的准备工作越来越充分,我们需要加强防范。


17. 加州总检察长警告AI公司:几乎所有行为可能违法

🔗 gizmodo.com: Cali’s AG Tells AI Companies Almost Everything They’re Doing Might Be Illegal

🔥🔥: 172 | 💬: 143 | 🗓️ 2025-01-29


加州总检察长Rob Bonta发布法律备忘录,指出AI行业可能涉及多项违法行为,包括利用AI进行欺骗性内容生成虚假宣传AI系统的能力,以及开发或销售可能对受保护群体产生歧视性影响的AI系统。备忘录强调,AI的开发和使用必须符合伦理和法律,否则可能面临法律制裁。此外,AI公司在版权法等领域也面临诸多法律挑战。


18. 英特尔不懂如何成为代工厂,蒂姆·库克曾对台积电CEO表示

🔗 tomshardware.com: Intel doesn’t know how to be a foundry, Tim Cook reportedly said in 2011

🔥🔥: 153 | 💬: 92 | 🗓️ 2025-01-29


苹果在2010年代初期开始自研iPhone和iPad处理器时,曾考虑使用英特尔定制代工(ICF),但发现其不适合外部客户。最终选择了台积电,因其客户至上的服务态度和灵活的技术响应能力。库克曾表示,英特尔缺乏代工厂所需的服务意识。台积电通过满足苹果的定制需求,逐步超越英特尔,成为全球领先的半导体制造商。


19. 零停机时间完成Postgres重大升级

🔗 instantdb.com: A major Postgres upgrade with zero downtime

🔥🔥: 148 | 💬: 47 | 🗓️ 2025-01-29


Instant团队在圣诞节前发现其Aurora Postgres实例需要进行重大版本升级。他们参考了Lyft团队的升级经验,但通过调整主库切换方式,最终实现了零停机时间的升级。团队首先尝试了原地升级蓝绿部署,但由于复制槽问题,这些方法均不可行。最终,他们通过手动创建Postgres 16副本、切换订阅和写入流,成功完成了升级。这一过程展示了在小规模系统中,精细控制连接和算法设计如何实现零停机升级。


20. 死去的游戏

🔗 garry.net: Dead Games

🔥🔥: 145 | 💬: 50 | 🗓️ 2025-01-29


文章讨论了未成功发布的游戏中制作的资源(如模型、音效、动画)的命运。作者认为这些资源被丢弃是一种浪费,建议开发者将资源免费开放或出售。有人提议建立一个开源资源库,方便开发者共享和使用这些资源。


Image

勒西科技日报

这是一份给聪明人的科技日报,每天推送一篇。内容来自各大英文网站,提供中文摘要。

Back to Overview