RSS 每日摘要

2026-04-03 · 17 篇文章归档

Codex now offers more flexible pricing for teams

OpenAI 为 Codex 推出按量计费（pay-as-you-go）定价方案，面向 ChatGPT Business 和 Enterprise 用户。此前 Codex 仅提供固定套餐，新定价模式让团队可以低门槛启动并按实际用量灵活扩展，降低了企业级 AI 编程工具的采用成本。

OpenAI News 2026/04/02

OpenAI acquires TBPN

OpenAI 宣布收购科技媒体 TBPN，意在借助其媒体影响力加速推动全球 AI 议题讨论，并为开发者、企业和技术社区提供独立媒体平台。这是 OpenAI 近期在媒体和传播领域的一次战略性布局。

OpenAI News 2026/04/02

Why we're rethinking cache for the AI era

Cloudflare 数据显示其网络流量中 32% 来自自动化请求，AI 爬虫正成为最活跃的新兴类别——它们以高并发、顺序全站扫描的方式抓取内容，与人类流量模式差异显著，导致现有 CDN 缓存策略难以兼顾两者。Cloudflare 联合 ETH 苏黎世研究团队在 2025 年云计算研讨会发表论文，提出针对 AI 时代重新设计 Web 缓存架构的方向，包括如何同时服务 RAG 检索型 AI 助手与人类用户。

The Cloudflare Blog 2026/04/02

A SwiftUI Block Blast Game in Skip Showcase

Skip Showcase 2.3.6 以「彩蛋」形式内置了一款 Block Blast 风格的益智游戏，全部代码不足 1000 行纯 Swift 实现，同时运行于 iOS 和 Android——后者通过 Swift 6.3 Android SDK 与 Skip Fuse 将 SwiftUI 转译为 Jetpack Compose。该案例展示了 SwiftUI 用于休闲游戏开发的可行性，以及 Skip 框架在无需引入 Unity/Godot 等专用引擎的前提下实现跨平台发布的能力。

Skip 2026/04/02

Being the adult in the room

Tailscale CEO 以「房间里的大人」比喻阐述公司在 AI 浪潮中的定位：AI 加速了工程交付节奏，但也带来复杂性堆积、安全忽视和短视决策等副作用。Tailscale 的策略是成为混乱中的稳定底座——在 AI 驱动的大量服务互联场景下，提供可预期的安全性、可观测性与合规保障，而非跟风成为「更多的旋风」。

Blog on Tailscale 2026/04/02

Highlights from my conversation about agentic engineering on Lenny's Podcast

Simon Willison 在 Lenny's Podcast 分享对 AI 工程现状的判断：GPT 5.1 与 Claude Opus 4.5 于去年11月构成关键拐点，代码生成质量从「大部分能跑」跃升至「几乎总是按要求执行」。他指出软件工程师正在成为其他知识工作者的「金丝雀」——代码对错易判断，而 AI 生成的法律文书、论文则难以核实质量。AI 幻觉案例数据库目前已记录 1228 起案例。他还讨论了测试成为新瓶颈、估期能力退化、以及中级工程师面临的职业压力等议题。

Simon Willison's Weblog 2026/04/02

Gemma 4: Byte for byte, the most capable open models

Google DeepMind 发布 Gemma 4 系列，共四款视觉推理模型（E2B、E4B、31B、26B-A4B MoE），均采用 Apache 2.0 协议。小尺寸模型引入 Per-Layer Embeddings（PLE）技术压缩有效参数量，E2B 和 E4B 还支持原生音频输入。作者在本地 LM Studio 测试了 GGUF 版本，26B-A4B（18GB）表现最佳，31B 模型存在循环输出 bug。整体证明「单位参数智能密度」已成当前小模型研究的核心竞争维度。

Simon Willison's Weblog 2026/04/02

llm-gemini 0.30

Simon Willison 发布 llm-gemini 插件 0.30 版本，新增对 Gemma 4 系列模型的支持，可通过 Google AI Studio API 调用 Gemma 4 的 31B 和 26B-A4B 模型。

Simon Willison's Weblog 2026/04/02

KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure

Meta 推出 KernelEvolve，一套用于自动优化 AI 推理/训练内核的 Agent 系统，已集成至 Ranking Engineer Agent。它将内核优化建模为搜索问题：LLM 持续生成候选内核，专用 harness 自动评测并反馈诊断，迭代数百次候选方案。实测结果：Andromeda 广告模型在 NVIDIA GPU 上推理吞吐提升超 60%，广告模型在 Meta 自研 MTIA 芯片上训练吞吐提升超 25%。支持 Triton、CUDA、HIP 等多种目标语言，覆盖 NVIDIA、AMD、MTIA 全异构硬件栈，相关论文将发表于 ISCA 2026。

Engineering at Meta 2026/04/02

Open Models have crossed a threshold

LangChain 通过 Deep Agents 评测框架对开源模型进行基准测试，发现 GLM-5（z.ai）和 MiniMax M2.7 在文件操作、工具调用、指令遵循等核心 Agent 任务上已与 Claude Opus 4.6、GPT-5.4 持平。成本差距显著：MiniMax M2.7 输出费用约 $1.20/M tokens，比 Opus 4.6（$25/M）低约 20 倍；每天输出 1000 万 token 的应用，年费用差距达 8.7 万美元。延迟方面，GLM-5 平均响应 0.65 秒、70 tokens/s，远优于 Opus 4.6 的 2.56 秒、34 tokens/s。

LangChain Blog 2026/04/02

datasette-enrichments-llm 0.2a1

datasette-enrichments-llm 发布 0.2a1 版本，这是 Simon Willison 为 Datasette 数据工具开发的 LLM 数据增强插件。该插件允许用户通过大语言模型对 Datasette 数据库中的数据进行自动化丰富处理。正文内容有限，本次更新属于早期 alpha 测试版本。

Simon Willison's Weblog 2026/04/01

The Web Automation Stack Explained

Web 自动化技术栈本质上只有两层核心：浏览器引擎（几乎清一色是 Chromium）和 CDP 协议。Puppeteer、Playwright 等库正逐渐被 AI Agent 框架绕过——越来越多框架直接实现 CDP 客户端。文章还介绍了用 Zig 从零构建的轻量级无头浏览器 Lightpanda，它兼容 CDP 协议，可一行代码替换现有 Puppeteer/Playwright 脚本。Firefox 的 CDP 支持已于 2024 年弃用，转向尚未普及的 WebDriver BiDi 标准，导致 Gecko 和 WebKit 在生产自动化场景中几乎无人采用。

The headless browser 2026/04/02

Scalar 2026: Celebrating Functional Programming Fiesta

Scalar 2026 函数式编程大会在华沙举办第 11 届，Scala 创始人 Martin Odersky 以「如何信任 AI Agent」为主题发表主旨演讲，主张用类型系统和能力模型将可信度内建于语言层。大会还覆盖 Scala 3.9 LTS 路线图、Cyfra 项目（将 Scala 高层抽象引入 GPU 并行计算）、Scala Native 与 C 互操作、ZIO/Cats Effect/Kyo 并发框架对比，以及 Protobuf 的 Scala-First 替代方案等议题，展示了 Scala 生态在 AI 时代向系统编程和高性能计算延伸的努力。

SoftwareMill 2026/04/02

OpenAI 总裁 Greg Brockman：AI 自我改进、Super App 豪赌、通往 AGI 之路、算力扩张

OpenAI 总裁 Greg Brockman 在播客访谈中回应了三大争议：Sora 停止运营的真实原因（官方说法是技术资源聚焦，但其日烧百万美元、用户跌破 50 万的商业失败被刻意回避）；Super App 计划将 ChatGPT、编程 Agent Codex 和浏览器 Atlas 合并为统一产品，直接与微软 365 Copilot 竞争却未作回应；下一代模型 Spud 完成预训练，1100 亿美元融资主要投入 GPU 基础设施。他将 AGI 进度自评为 70-80%，同时承认 AGI 定义「更像是一种氛围」，前后矛盾未予解决。

宝玉的分享 2026/04/01

← 2026-04-02 2026-04-04 →

未读 1 → 抓取 17 → 摘要 17 · 提取: readability 15 / rss 2

RSS 每日摘要

Codex now offers more flexible pricing for teams

OpenAI acquires TBPN

Why we're rethinking cache for the AI era

A SwiftUI Block Blast Game in Skip Showcase

Being the adult in the room

Highlights from my conversation about agentic engineering on Lenny's Podcast

Gemma 4: Byte for byte, the most capable open models

llm-gemini 0.30

KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure

Open Models have crossed a threshold

datasette-enrichments-llm 0.2a1

The Web Automation Stack Explained

Scalar 2026: Celebrating Functional Programming Fiesta

OpenAI 总裁 Greg Brockman：AI 自我改进、Super App 豪赌、通往 AGI 之路、算力扩张

March 2026 sponsors-only newsletter

datasette-llm 0.1a6

科技爱好者周刊（第 391 期）：AI 的贫富分化