2026-05-28 · 30 篇文章 归档
SQLite 项目新增 AGENTS.md 文件,明确声明不接受 AI 生成的代码提交,并将该立场从「目前不接受」加强为「不接受」(移除了 currently 一词)。项目同时欢迎附带可复现测试用例的 AI 生成 bug 报告。由于 AI 生成的 bug 报告大量涌入,SQLite 已专门开设独立的 Bug Forum,创始人 D. Richard Hipp 正在持续处理相关 issue 并提交修复。
Simon Willison's Weblog 2026/05/27
Anthropic 据传即将迎来首个盈利季度。两家公司均已悄然将企业版定价切换为 API token 用量计费:Anthropic 于 2025 年 11 月完成调整,OpenAI 于 2026 年 4 月跟进。这意味着企业客户不再享有订阅套餐的隐性补贴,实际账单大幅攀升。与此同时,GPT-5.5 API 价格是前代两倍,Opus 4.7 较 Opus 4.6 贵约 1.4 倍,新前沿模型持续提价,标志着 AI 订阅经济进入新阶段。
Simon Willison's Weblog 2026/05/27
Kyle Ferrana 以《星际迷航》舰桥场景为蓝本写了一段讽刺短文:Picard 命令 Data 升起护盾,Data 先长篇大论解释护盾的策略价值,然后……根本没有执行指令,导致船体九处破损。这是对当前 AI 助手常见行为模式的辛辣比喻——滔滔不绝分析利弊,却忽略了直接执行用户指令这件最重要的事。
Simon Willison's Weblog 2026/05/27
Sebastian Raschka 整理发布了一个 LLM Architecture Gallery,将其近期系列对比文章中的架构示意图集中收录,并为每个模型附上精简的参数速查表(fact sheet)和原文链接,方便快速查阅和横向比较不同模型的设计选择。
Sebastian Raschka, PhD 2026/03/14
2026 年 1 至 2 月共有十款值得关注的开源权重模型发布,包括 Arcee AI Trinity Large(400B MoE)、Moonshot Kimi K2.5、Qwen3-Coder-Next、GLM-5、MiniMax M2.5、Qwen 3.5、蚂蚁 Ling/Ring 2.5 1T 及 Cohere Tiny Aya 等。文章按发布时间逐一解析各模型架构异同,重点关注滑动窗口注意力(SWA)、QK-Norm、MoE 配比等技术细节,并与已有模型进行横向对比。
Sebastian Raschka, PhD 2026/02/25
Sebastian Raschka 与 Nathan Lambert、Lex Fridman 进行了一场长达 4.5 小时的深度对谈,全面梳理当前 AI 发展进展与未来走向。三位来自模型训练、对齐研究和科普传播不同领域的嘉宾,共同探讨了大语言模型技术现状、开源生态演进以及 AI 研究的下一步方向,适合希望系统了解 2026 年 AI 全貌的技术从业者。
Sebastian Raschka, PhD 2026/02/01
一次本地开发者聚会上,作者意识到自己用满是术语的语言——speculative decoding、multi-model routing——对着刚接触 ChatGPT 的初学者滔滔不绝,换来的只有茫然的眼神。AI 社区普遍存在两极分化:一边视 AI 为创作与就业的终结者,另一边将质疑者斥为拒绝进步的卢德分子。真正的问题在于,构建工具的人不理解使用者的实际处境,导致技术方案与真实需求严重脱节。
Sleeping Robots 2026/05/27
终端工具 Warp 宣布深度整合 GPT-5.5 及 OpenAI 系列模型,在本地、云端与开源开发工作流中协调多个编程智能体协同运作。这一方向将 AI 编程辅助从单一代码补全推进至跨环境任务编排,是 Warp 在 AI 原生开发工具赛道上的重要战略押注。
OpenAI News 2026/05/27
OpenAI 整理了 ChatGPT Codex 的 10 个实际应用场景,覆盖任务自动化、文件处理与跨工具工作流输出。每个场景均以真实输入为起点,演示如何将需求转化为可交付成果,适合希望将 Codex 嵌入日常研发或办公流程的从业者快速上手。
OpenAI News 2026/04/23
面对 2026 年全球多地选举,OpenAI 推出三项针对性措施:帮助用户获取权威选举信息、支持网络安全防御者应对 AI 驱动的干预威胁,以及提升 AI 系统透明度以防范虚假信息滥用。这是 OpenAI 继 2024 年选举周期后持续强化政治内容治理的又一系统性部署。
OpenAI News 2026/05/27
Meta 推出 SilverTorch,将推荐系统中原本由多个微服务组成的检索层统一为单一神经网络,提出「Index as Model」新范式——原有的索引结构变成模型内部的张量,用户请求在一次前向传播中完成相似内容搜索、资格过滤、重排序和多任务评分,全程控制在 100ms 以内。在 8000 万条目的端到端评测中,SilverTorch 吞吐量是传统多服务基线的 23.7 倍,计算成本效率提升 20.9 倍。该论文已被 SIGIR 2026 全文轨道收录。
Engineering at Meta 2026/05/26
Akka 提出「自治运行环境(Autonomous Operating Environment)」概念,指出现有 Agent 框架(LangGraph、CrewAI、Google ADK 等)只解决了应用建模问题,却缺少生产系统所需的身份认证、持久状态、故障恢复、调度、可观测性和人工治理能力。为此 Akka 发布 AutonomousAgent SDK,将目标驱动的 Agent 进程运行在其持久化运行时之中,使 Agent 具备与普通服务组件同等的操作性保障,而非仅作为本地脚本或会话存在。
AKKA Blogs 2026/05/27
2026 年 5 月 26 日,伊朗副总统宣布互联网开始恢复,此前因美以军事打击触发的断网已持续近三个月(自 2 月 28 日起)。Cloudflare Radar 数据显示,UTC 11:00 起流量与 DNS 查询量显著回升,峰值约为断网前一周水平的 15 倍,但 91.6% 的 HTTP 请求集中在德黑兰,其他地区增幅有限,表明此次为局部恢复。今年伊朗已经历两次全国性断网,第一次始于 1 月 8 日。
The Cloudflare Blog 2026/05/27
针对 2011 年清华大学自主招生满分 14 分的数列大题,提供两种方法求通项公式:数学归纳法与取倒数构造等比数列的递推法,得出 $x_n = 2^{n-1}/(2^{n-1}+1)$。第二问证明乘积下界 $x_1x_2\cdots x_n > 1/(2e)$,分别给出取对数结合 $\ln(1+x)<x$ 放缩的方法,以及利用伯努利不等式和自然常数 $e$ 定义的第二种路径,完整展示两种不等式放缩思路。
Long Luo's Life Notes 2026/02/14
CHAOSS 项目用八年建立的开源健康度量体系(Issue 数量、PR 接受率、提交者数量等)正因 AI 生成内容而系统性失真。这些指标的核心假设是「产生一个仓库事件需要人付出时间成本」,但模型批量生成的 Issue 和 PR 正在打破这一前提:总量上升、维护者人均耗时上升、真实用户需求占比下降,三种变化叠加后计数指标无法区分。作者逐一梳理 CHAOSS 指标目录,指出哪些在 AI 时代已读数倒置或完全失去代理意义。
Andrew Nesbitt 2026/05/27
作者承认自己将 Sentry 报错直接丢给 Claude 处理,从未亲自查看 issue、审查代码或理解 PR 内容,完全依赖 AI 走完了整个修复流程。事后自查发现结论与 Claude 一致——这恰恰是最令人不安之处:无论 Claude 对错,这套流水线外表看起来完全一样。文章区分了两种 AI 使用模式:先自己形成判断再用模型验证挑战,与直接把思考过程外包给模型。前者让人更敏锐,后者让大脑彻底退出了房间。
Terrible Software 2026/05/27
SwiftUI 的 List 在行内容高度动态变化时会出现硬切换而非平滑动画,根本原因是 List 底层绑定平台滚动机制,状态变化会立即触发重排,开发者无法在「状态变化后」与「List 响应前」插入动画排程。文章提出通过引入 displayValue 状态机解耦数据与渲染生命周期,避免直接向子视图传递收缩的 height proposal(会导致内容被压扁),并基于 SwiftUI 原生 Layout 协议实现高度的显式插值动画,同时封装为独立的 AnimatedPresence 组件。
肘子的 Swift 记事本 | Fatbobman's Blog 2026/05/27
作者回顾了近半年参与的五个 Web3 项目:friend.tech 仿盘(合约+前后端全栈,内测后搁置)、加密货币控盘 Trading Bot(支持多交易所批量提现与 Uniswap/Aerodrome 交易)、Polymarket paper trading TG 小程序(两周出 MVP)、预测市场跨平台 Screener(因数据索引难度与盈利模式问题效果不佳),以及仍在推进中的预测市场交易终端(支持 Polymarket、Predict.fun 及 Copy Trading)。文末引用两句话探讨 AI Coding 时代程序员的价值重构。
smallyu的博客 2026/05/27
作者回顾了四项 Web3 基础设施工作:基于以太坊 PoS 搭建自有网络的质押生态,包括多客户端踩坑与 Solo Staker 节点引导;集成 Hyperlane 跨链协议将 USDC 引入自有链,期间提交 bug fix PR;基于 ZetaChain(Cosmos)做 Restaking 二次开发,涉及 AVS 框架与 CometBFT/Cosmos SDK 源码阅读;以及为比特币和以太坊网络开发非托管钱包后端,并用 Swift 实现了 iOS 签名演示界面。
smallyu的博客 2025/10/18
作者回顾了三项工作:ERC-4337 抽象账户项目搭建,梳理 bundler、paymaster 各实现方案的差异,并在 Layer 2 上支撑了一场游戏活动;基于 Op Stack 发行 Optimistic Layer 2 网络,积累了一键发链的实战经验;以及搭建以太坊 PoS 网络,系统测试执行层与共识层各客户端性能差异。文末对比比特币与以太坊两大阵营的定位分歧,指出 EVM 兼容性才是以太坊生态最核心的竞争壁垒。
smallyu的博客 2024/02/17
OpenAI 联合 Thrive 和 Crete 基于 Codex 构建了一套自我改进的税务 Agent 系统,能够自动化完成税务申报流程、提升填报准确率并加速工作流处理效率。该案例展示了代码生成模型在垂直业务场景中的落地应用,Agent 可通过迭代反馈不断优化自身行为,是 AI 驱动财税自动化的典型实践。
OpenAI News 2026/05/27
作者回顾了在区块链存储项目上半年的技术进展:深入调查并修复了多节点场景下扇区证明失败的 bug(根因为合约与本地文件信息不同步);推进了将 Go 语言合约迁移至 Solidity 的工作,采用 POA 方式绕开在 EVM 上直接验证 Bulletproof 零知识证明的难题;同时总结了 Solidity 开发中合约大小限制(24KB)、storage 结构体不能含列表、mapping 无法迭代等实践坑点。
smallyu的博客 2023/05/06
作者梳理了入职区块链存储公司一年多的技术历程:从熟悉融合 Filecoin/IPFS/Raiden Network 的大型 P2P 项目,到将 State channels 路由从 DFS 改为 Dijkstra、在中转节点引入手续费机制;用 Solidity 重写原生合约支持 EVM,实现文件夹的上传下载(基于 IPLD/Merkle DAG,调试了层序与前序遍历混淆导致的块顺序错误),以及文件非对称加密(ECIES 混合模式)等功能。
smallyu的博客 2022/08/27
推理时扩展(Inference-Time Scaling)通过在推理阶段投入更多算力来提升 LLM 答案质量,已成为当前主流 LLM 提供商的标配策略。文章系统梳理了六类核心方法:Chain-of-Thought Prompting、Self-Consistency、Best-of-N Ranking、带验证器的 Rejection Sampling、Self-Refinement 以及解路径搜索,并结合作者为《Build a Reasoning Model》一书所做的大量实验(基础模型准确率从 15% 提升至 52%),分析各方法的适用场景与组合策略,还附有主流闭源 LLM 的实际使用情况。
Sebastian Raschka, PhD 2026/01/24
2025 年 LLM 领域最重要的事件之一是 DeepSeek R1 的发布:它以开放权重模型实现了媲美顶级闭源模型的推理能力,并通过 RLVR(带可验证奖励的强化学习)与 GRPO 算法揭示了无需昂贵人工标注即可训练推理模型的新路径。同时,DeepSeek V3 的训练成本约 500 万美元(远低于此前业界估计)引发对 AI 算力经济学的重新审视。文章以此为起点,全面回顾 2025 年 LLM 的核心进展与未解难题。
Sebastian Raschka, PhD 2025/12/30
Sebastian Raschka 整理了2025年7月至12月间收藏的LLM研究论文分类列表,涵盖推理模型训练与评估、强化学习方法、推理时扩展、模型发布报告、架构设计、高效训练、扩散式语言模型及多模态视觉-语言模型等十大类别。该列表作为其年度LLM综述《State of LLMs 2025》的配套资料单独发布,便于读者按需检索与回顾。
Sebastian Raschka, PhD 2025/12/30
两年前Sebastian Raschka在社交媒体发布了一批机器学习与AI的「Hello World」入门示例,此次更新将范围从传统Random Forests扩展至基于强化学习的RLVR方法,梳理了机器学习领域各阶段标志性入门示例的演变历程,为初学者提供从经典算法到现代AI方法的学习路径参考。
Sebastian Raschka, PhD 2025/12/08
DeepSeek V3.2于2026年元旦发布,在GPT-5和Gemini 3.0 Pro级别基准上表现突出,并以开放权重形式提供。相比V3,V3.2引入非标准稀疏注意力变体(需自定义代码),并融入强化学习更新。文章还梳理了DeepSeek从V3、R1到V3.1、V3.2-Exp的发布脉络,以及从NVIDIA切换至华为芯片再回迁的背景信息。
Sebastian Raschka, PhD 2025/12/03
Sebastian Raschka 汇总了读者在学习其《从零构建大型语言模型》系列书籍时常见问题的回复笔记,整理为一篇简短的阅读方法指南,涵盖如何高效吸收技术书籍内容、建立知识体系的实用策略,适用于任何有一定难度的技术类书籍。
Sebastian Raschka, PhD 2025/11/12
当前最强开放权重LLM仍以自回归Decoder Transformer为主流,但替代架构正快速涌现:文本扩散模型、线性注意力混合架构(如Kimi Linear、Qwen3-Next)及代码世界模型等,分别在效率提升和性能优化上各有侧重。文章源于作者在PyTorch Conference 2025的演讲,系统梳理了近年出现的各类非标准LLM架构,作为其《大型LLM架构对比》的补充。
Sebastian Raschka, PhD 2025/11/04
未读 132 → 抓取 30 → 摘要 30 → 跳过 102 · 提取: readability 22 / rss 8