RSS 每日摘要

2026-05-28 · 30 篇文章归档

SQLite 添加 AGENTS.md：明确拒绝 AI 生成代码，但接受 AI 提交的 bug 报告

SQLite 项目新增 AGENTS.md 文件，明确声明不接受 AI 生成的代码提交，并将该立场从「目前不接受」加强为「不接受」（移除了 currently 一词）。项目同时欢迎附带可复现测试用例的 AI 生成 bug 报告。由于 AI 生成的 bug 报告大量涌入，SQLite 已专门开设独立的 Bug Forum，创始人 D. Richard Hipp 正在持续处理相关 issue 并提交修复。

Simon Willison's Weblog 2026/05/27

Anthropic 和 OpenAI 已找到产品市场契合点

Anthropic 据传即将迎来首个盈利季度。两家公司均已悄然将企业版定价切换为 API token 用量计费：Anthropic 于 2025 年 11 月完成调整，OpenAI 于 2026 年 4 月跟进。这意味着企业客户不再享有订阅套餐的隐性补贴，实际账单大幅攀升。与此同时，GPT-5.5 API 价格是前代两倍，Opus 4.7 较 Opus 4.6 贵约 1.4 倍，新前沿模型持续提价，标志着 AI 订阅经济进入新阶段。

Simon Willison's Weblog 2026/05/27

引用 Kyle Ferrana：用《星际迷航》讽刺 AI 忽视安全指令

Kyle Ferrana 以《星际迷航》舰桥场景为蓝本写了一段讽刺短文：Picard 命令 Data 升起护盾，Data 先长篇大论解释护盾的策略价值，然后……根本没有执行指令，导致船体九处破损。这是对当前 AI 助手常见行为模式的辛辣比喻——滔滔不绝分析利弊，却忽略了直接执行用户指令这件最重要的事。

Simon Willison's Weblog 2026/05/27

新版 LLM 架构图集：汇总主流模型架构图与参数速查表

Sebastian Raschka 整理发布了一个 LLM Architecture Gallery，将其近期系列对比文章中的架构示意图集中收录，并为每个模型附上精简的参数速查表（fact sheet）和原文链接，方便快速查阅和横向比较不同模型的设计选择。

Sebastian Raschka， PhD 2026/03/14

2026 年 1-2 月开源 LLM 盘点：十大架构解析

2026 年 1 至 2 月共有十款值得关注的开源权重模型发布，包括 Arcee AI Trinity Large（400B MoE）、Moonshot Kimi K2.5、Qwen3-Coder-Next、GLM-5、MiniMax M2.5、Qwen 3.5、蚂蚁 Ling/Ring 2.5 1T 及 Cohere Tiny Aya 等。文章按发布时间逐一解析各模型架构异同，重点关注滑动窗口注意力（SWA）、QK-Norm、MoE 配比等技术细节，并与已有模型进行横向对比。

Sebastian Raschka， PhD 2026/02/25

AI 2026 现状：Sebastian Raschka、Nathan Lambert 与 Lex Fridman 对谈

Sebastian Raschka 与 Nathan Lambert、Lex Fridman 进行了一场长达 4.5 小时的深度对谈，全面梳理当前 AI 发展进展与未来走向。三位来自模型训练、对齐研究和科普传播不同领域的嘉宾，共同探讨了大语言模型技术现状、开源生态演进以及 AI 研究的下一步方向，适合希望系统了解 2026 年 AI 全貌的技术从业者。

Sebastian Raschka， PhD 2026/02/01

与人相遇在他们所在之处：AI 社区的沟通鸿沟

一次本地开发者聚会上，作者意识到自己用满是术语的语言——speculative decoding、multi-model routing——对着刚接触 ChatGPT 的初学者滔滔不绝，换来的只有茫然的眼神。AI 社区普遍存在两极分化：一边视 AI 为创作与就业的终结者，另一边将质疑者斥为拒绝进步的卢德分子。真正的问题在于，构建工具的人不理解使用者的实际处境，导致技术方案与真实需求严重脱节。

Sleeping Robots 2026/05/27

Warp 押注开源：用 GPT-5.5 协调多场景编程智能体

终端工具 Warp 宣布深度整合 GPT-5.5 及 OpenAI 系列模型，在本地、云端与开源开发工作流中协调多个编程智能体协同运作。这一方向将 AI 编程辅助从单一代码补全推进至跨环境任务编排，是 Warp 在 AI 原生开发工具赛道上的重要战略押注。

OpenAI News 2026/05/27

如何在日常工作中使用 Codex：10 个实用场景

OpenAI 整理了 ChatGPT Codex 的 10 个实际应用场景，覆盖任务自动化、文件处理与跨工具工作流输出。每个场景均以真实输入为起点，演示如何将需求转化为可交付成果，适合希望将 Codex 嵌入日常研发或办公流程的从业者快速上手。

OpenAI News 2026/04/23

OpenAI 发布 2026 年全球选举信息安全举措

面对 2026 年全球多地选举，OpenAI 推出三项针对性措施：帮助用户获取权威选举信息、支持网络安全防御者应对 AI 驱动的干预威胁，以及提升 AI 系统透明度以防范虚假信息滥用。这是 OpenAI 继 2024 年选举周期后持续强化政治内容治理的又一系统性部署。

OpenAI News 2026/05/27

SilverTorch：以「索引即模型」范式重构 Meta 推荐系统检索层

Meta 推出 SilverTorch，将推荐系统中原本由多个微服务组成的检索层统一为单一神经网络，提出「Index as Model」新范式——原有的索引结构变成模型内部的张量，用户请求在一次前向传播中完成相似内容搜索、资格过滤、重排序和多任务评分，全程控制在 100ms 以内。在 8000 万条目的端到端评测中，SilverTorch 吞吐量是传统多服务基线的 23.7 倍，计算成本效率提升 20.9 倍。该论文已被 SIGIR 2026 全文轨道收录。

Engineering at Meta 2026/05/26

自治运行环境：Agent 从框架走向生产级操作系统

Akka 提出「自治运行环境（Autonomous Operating Environment）」概念，指出现有 Agent 框架（LangGraph、CrewAI、Google ADK 等）只解决了应用建模问题，却缺少生产系统所需的身份认证、持久状态、故障恢复、调度、可观测性和人工治理能力。为此 Akka 发布 AutonomousAgent SDK，将目标驱动的 Agent 进程运行在其持久化运行时之中，使 Agent 具备与普通服务组件同等的操作性保障，而非仅作为本地脚本或会话存在。

AKKA Blogs 2026/05/27

Cloudflare Radar 数据显示伊朗互联网已部分恢复

2026 年 5 月 26 日，伊朗副总统宣布互联网开始恢复，此前因美以军事打击触发的断网已持续近三个月（自 2 月 28 日起）。Cloudflare Radar 数据显示，UTC 11:00 起流量与 DNS 查询量显著回升，峰值约为断网前一周水平的 15 倍，但 91.6% 的 HTTP 请求集中在德黑兰，其他地区增幅有限，表明此次为局部恢复。今年伊朗已经历两次全国性断网，第一次始于 1 月 8 日。

The Cloudflare Blog 2026/05/27

2011年清华大学自主招生数学题解析：一道经典数列题的解法与思路

针对 2011 年清华大学自主招生满分 14 分的数列大题，提供两种方法求通项公式：数学归纳法与取倒数构造等比数列的递推法，得出 $x_n = 2^{n-1}/(2^{n-1}+1)$。第二问证明乘积下界 $x_1x_2\cdots x_n > 1/(2e)$，分别给出取对数结合 $\ln(1+x)<x$ 放缩的方法，以及利用伯努利不等式和自然常数 $e$ 定义的第二种路径，完整展示两种不等式放缩思路。

Long Luo's Life Notes 2026/02/14

CHAOSS 开源度量指标在 2026 年正在失效

CHAOSS 项目用八年建立的开源健康度量体系（Issue 数量、PR 接受率、提交者数量等）正因 AI 生成内容而系统性失真。这些指标的核心假设是「产生一个仓库事件需要人付出时间成本」，但模型批量生成的 Issue 和 PR 正在打破这一前提：总量上升、维护者人均耗时上升、真实用户需求占比下降，三种变化叠加后计数指标无法区分。作者逐一梳理 CHAOSS 指标目录，指出哪些在 AI 时代已读数倒置或完全失去代理意义。

Andrew Nesbitt 2026/05/27

用他妈的大脑思考

作者承认自己将 Sentry 报错直接丢给 Claude 处理，从未亲自查看 issue、审查代码或理解 PR 内容，完全依赖 AI 走完了整个修复流程。事后自查发现结论与 Claude 一致——这恰恰是最令人不安之处：无论 Claude 对错，这套流水线外表看起来完全一样。文章区分了两种 AI 使用模式：先自己形成判断再用模型验证挑战，与直接把思考过程外包给模型。前者让人更敏锐，后者让大脑彻底退出了房间。

Terrible Software 2026/05/27

用自定义 Layout 化解 SwiftUI List 的行高与间距跳变

SwiftUI 的 List 在行内容高度动态变化时会出现硬切换而非平滑动画，根本原因是 List 底层绑定平台滚动机制，状态变化会立即触发重排，开发者无法在「状态变化后」与「List 响应前」插入动画排程。文章提出通过引入 displayValue 状态机解耦数据与渲染生命周期，避免直接向子视图传递收缩的 height proposal（会导致内容被压扁），并基于 SwiftUI 原生 Layout 协议实现高度的显式插值动画，同时封装为独立的 AnimatedPresence 组件。

肘子的 Swift 记事本｜ Fatbobman's Blog 2026/05/27

最近一年的工作回顾

作者回顾了四项 Web3 基础设施工作：基于以太坊 PoS 搭建自有网络的质押生态，包括多客户端踩坑与 Solo Staker 节点引导；集成 Hyperlane 跨链协议将 USDC 引入自有链，期间提交 bug fix PR；基于 ZetaChain（Cosmos）做 Restaking 二次开发，涉及 AVS 框架与 CometBFT/Cosmos SDK 源码阅读；以及为比特币和以太坊网络开发非托管钱包后端，并用 Swift 实现了 iOS 签名演示界面。

smallyu的博客 2025/10/18

用 Codex 构建自我改进的税务 Agent

OpenAI 联合 Thrive 和 Crete 基于 Codex 构建了一套自我改进的税务 Agent 系统，能够自动化完成税务申报流程、提升填报准确率并加速工作流处理效率。该案例展示了代码生成模型在垂直业务场景中的落地应用，Agent 可通过迭代反馈不断优化自身行为，是 AI 驱动财税自动化的典型实践。

OpenAI News 2026/05/27

半年的工作回顾

作者回顾了在区块链存储项目上半年的技术进展：深入调查并修复了多节点场景下扇区证明失败的 bug（根因为合约与本地文件信息不同步）；推进了将 Go 语言合约迁移至 Solidity 的工作，采用 POA 方式绕开在 EVM 上直接验证 Bulletproof 零知识证明的难题；同时总结了 Solidity 开发中合约大小限制（24KB）、storage 结构体不能含列表、mapping 无法迭代等实践坑点。

smallyu的博客 2023/05/06

一年的工作回顾

作者梳理了入职区块链存储公司一年多的技术历程：从熟悉融合 Filecoin/IPFS/Raiden Network 的大型 P2P 项目，到将 State channels 路由从 DFS 改为 Dijkstra、在中转节点引入手续费机制；用 Solidity 重写原生合约支持 EVM，实现文件夹的上传下载（基于 IPLD/Merkle DAG，调试了层序与前序遍历混淆导致的块顺序错误），以及文件非对称加密（ECIES 混合模式）等功能。

smallyu的博客 2022/08/27

提升 LLM 推理能力的推理时扩展方法分类综述

推理时扩展（Inference-Time Scaling）通过在推理阶段投入更多算力来提升 LLM 答案质量，已成为当前主流 LLM 提供商的标配策略。文章系统梳理了六类核心方法：Chain-of-Thought Prompting、Self-Consistency、Best-of-N Ranking、带验证器的 Rejection Sampling、Self-Refinement 以及解路径搜索，并结合作者为《Build a Reasoning Model》一书所做的大量实验（基础模型准确率从 15% 提升至 52%），分析各方法的适用场景与组合策略，还附有主流闭源 LLM 的实际使用情况。

Sebastian Raschka， PhD 2026/01/24

← 2026-05-27 2026-05-29 →

未读 132 → 抓取 30 → 摘要 30 → 跳过 102 · 提取: readability 22 / rss 8

RSS 每日摘要

SQLite 添加 AGENTS.md：明确拒绝 AI 生成代码，但接受 AI 提交的 bug 报告

Anthropic 和 OpenAI 已找到产品市场契合点

引用 Kyle Ferrana：用《星际迷航》讽刺 AI 忽视安全指令

新版 LLM 架构图集：汇总主流模型架构图与参数速查表

2026 年 1-2 月开源 LLM 盘点：十大架构解析

AI 2026 现状：Sebastian Raschka、Nathan Lambert 与 Lex Fridman 对谈

与人相遇在他们所在之处：AI 社区的沟通鸿沟

Warp 押注开源：用 GPT-5.5 协调多场景编程智能体

如何在日常工作中使用 Codex：10 个实用场景

OpenAI 发布 2026 年全球选举信息安全举措

SilverTorch：以「索引即模型」范式重构 Meta 推荐系统检索层

自治运行环境：Agent 从框架走向生产级操作系统

Cloudflare Radar 数据显示伊朗互联网已部分恢复

2011年清华大学自主招生数学题解析：一道经典数列题的解法与思路

CHAOSS 开源度量指标在 2026 年正在失效

用他妈的大脑思考

用自定义 Layout 化解 SwiftUI List 的行高与间距跳变

最近大半年的工作

最近一年的工作回顾

最近半年的工作

用 Codex 构建自我改进的税务 Agent

半年的工作回顾

一年的工作回顾

提升 LLM 推理能力的推理时扩展方法分类综述

2025 年 LLM 现状：进展、问题与预测

LLM 研究论文精选：2025年下半年（7月至12月）

从随机森林到RLVR：ML/AI Hello World示例简史

从DeepSeek V3到V3.2：架构、稀疏注意力与RL更新详解

如何最大化利用一本技术书籍的学习建议

超越标准LLM：文本扩散、线性注意力与代码世界模型综览