RSS 每日摘要
2026-04-03 · 17 篇文章 归档
OpenAI News 2026/04/02
OpenAI 为 Codex 推出按量计费(pay-as-you-go)定价方案,面向 ChatGPT Business 和 Enterprise 用户。此前 Codex 仅提供固定套餐,新定价模式让团队可以低门槛启动并按实际用量灵活扩展,降低了企业级 AI 编程工具的采用成本。
OpenAI News 2026/04/02
OpenAI 宣布收购科技媒体 TBPN,意在借助其媒体影响力加速推动全球 AI 议题讨论,并为开发者、企业和技术社区提供独立媒体平台。这是 OpenAI 近期在媒体和传播领域的一次战略性布局。
The Cloudflare Blog 2026/04/02
Cloudflare 数据显示其网络流量中 32% 来自自动化请求,AI 爬虫正成为最活跃的新兴类别——它们以高并发、顺序全站扫描的方式抓取内容,与人类流量模式差异显著,导致现有 CDN 缓存策略难以兼顾两者。Cloudflare 联合 ETH 苏黎世研究团队在 2025 年云计算研讨会发表论文,提出针对 AI 时代重新设计 Web 缓存架构的方向,包括如何同时服务 RAG 检索型 AI 助手与人类用户。
Skip 2026/04/02
Skip Showcase 2.3.6 以「彩蛋」形式内置了一款 Block Blast 风格的益智游戏,全部代码不足 1000 行纯 Swift 实现,同时运行于 iOS 和 Android——后者通过 Swift 6.3 Android SDK 与 Skip Fuse 将 SwiftUI 转译为 Jetpack Compose。该案例展示了 SwiftUI 用于休闲游戏开发的可行性,以及 Skip 框架在无需引入 Unity/Godot 等专用引擎的前提下实现跨平台发布的能力。
Blog on Tailscale 2026/04/02
Tailscale CEO 以「房间里的大人」比喻阐述公司在 AI 浪潮中的定位:AI 加速了工程交付节奏,但也带来复杂性堆积、安全忽视和短视决策等副作用。Tailscale 的策略是成为混乱中的稳定底座——在 AI 驱动的大量服务互联场景下,提供可预期的安全性、可观测性与合规保障,而非跟风成为「更多的旋风」。
Simon Willison's Weblog 2026/04/02
Simon Willison 在 Lenny's Podcast 分享对 AI 工程现状的判断:GPT 5.1 与 Claude Opus 4.5 于去年11月构成关键拐点,代码生成质量从「大部分能跑」跃升至「几乎总是按要求执行」。他指出软件工程师正在成为其他知识工作者的「金丝雀」——代码对错易判断,而 AI 生成的法律文书、论文则难以核实质量。AI 幻觉案例数据库目前已记录 1228 起案例。他还讨论了测试成为新瓶颈、估期能力退化、以及中级工程师面临的职业压力等议题。
Simon Willison's Weblog 2026/04/02
Google DeepMind 发布 Gemma 4 系列,共四款视觉推理模型(E2B、E4B、31B、26B-A4B MoE),均采用 Apache 2.0 协议。小尺寸模型引入 Per-Layer Embeddings(PLE)技术压缩有效参数量,E2B 和 E4B 还支持原生音频输入。作者在本地 LM Studio 测试了 GGUF 版本,26B-A4B(18GB)表现最佳,31B 模型存在循环输出 bug。整体证明「单位参数智能密度」已成当前小模型研究的核心竞争维度。
Simon Willison's Weblog 2026/04/02
Simon Willison 发布 llm-gemini 插件 0.30 版本,新增对 Gemma 4 系列模型的支持,可通过 Google AI Studio API 调用 Gemma 4 的 31B 和 26B-A4B 模型。
Engineering at Meta 2026/04/02
Meta 推出 KernelEvolve,一套用于自动优化 AI 推理/训练内核的 Agent 系统,已集成至 Ranking Engineer Agent。它将内核优化建模为搜索问题:LLM 持续生成候选内核,专用 harness 自动评测并反馈诊断,迭代数百次候选方案。实测结果:Andromeda 广告模型在 NVIDIA GPU 上推理吞吐提升超 60%,广告模型在 Meta 自研 MTIA 芯片上训练吞吐提升超 25%。支持 Triton、CUDA、HIP 等多种目标语言,覆盖 NVIDIA、AMD、MTIA 全异构硬件栈,相关论文将发表于 ISCA 2026。
LangChain Blog 2026/04/02
LangChain 通过 Deep Agents 评测框架对开源模型进行基准测试,发现 GLM-5(z.ai)和 MiniMax M2.7 在文件操作、工具调用、指令遵循等核心 Agent 任务上已与 Claude Opus 4.6、GPT-5.4 持平。成本差距显著:MiniMax M2.7 输出费用约 $1.20/M tokens,比 Opus 4.6($25/M)低约 20 倍;每天输出 1000 万 token 的应用,年费用差距达 8.7 万美元。延迟方面,GLM-5 平均响应 0.65 秒、70 tokens/s,远优于 Opus 4.6 的 2.56 秒、34 tokens/s。
Simon Willison's Weblog 2026/04/01
datasette-enrichments-llm 发布 0.2a1 版本,这是 Simon Willison 为 Datasette 数据工具开发的 LLM 数据增强插件。该插件允许用户通过大语言模型对 Datasette 数据库中的数据进行自动化丰富处理。正文内容有限,本次更新属于早期 alpha 测试版本。
The headless browser 2026/04/02
Web 自动化技术栈本质上只有两层核心:浏览器引擎(几乎清一色是 Chromium)和 CDP 协议。Puppeteer、Playwright 等库正逐渐被 AI Agent 框架绕过——越来越多框架直接实现 CDP 客户端。文章还介绍了用 Zig 从零构建的轻量级无头浏览器 Lightpanda,它兼容 CDP 协议,可一行代码替换现有 Puppeteer/Playwright 脚本。Firefox 的 CDP 支持已于 2024 年弃用,转向尚未普及的 WebDriver BiDi 标准,导致 Gecko 和 WebKit 在生产自动化场景中几乎无人采用。
SoftwareMill 2026/04/02
Scalar 2026 函数式编程大会在华沙举办第 11 届,Scala 创始人 Martin Odersky 以「如何信任 AI Agent」为主题发表主旨演讲,主张用类型系统和能力模型将可信度内建于语言层。大会还覆盖 Scala 3.9 LTS 路线图、Cyfra 项目(将 Scala 高层抽象引入 GPU 并行计算)、Scala Native 与 C 互操作、ZIO/Cats Effect/Kyo 并发框架对比,以及 Protobuf 的 Scala-First 替代方案等议题,展示了 Scala 生态在 AI 时代向系统编程和高性能计算延伸的努力。
宝玉的分享 2026/04/01
OpenAI 总裁 Greg Brockman 在播客访谈中回应了三大争议:Sora 停止运营的真实原因(官方说法是技术资源聚焦,但其日烧百万美元、用户跌破 50 万的商业失败被刻意回避);Super App 计划将 ChatGPT、编程 Agent Codex 和浏览器 Atlas 合并为统一产品,直接与微软 365 Copilot 竞争却未作回应;下一代模型 Spud 完成预训练,1100 亿美元融资主要投入 GPU 基础设施。他将 AGI 进度自评为 70-80%,同时承认 AGI 定义「更像是一种氛围」,前后矛盾未予解决。
Simon Willison's Weblog 2026/04/02
Simon Willison 发布 2026 年 3 月赞助者专属月刊,内容涵盖 Agent 工程模式、Mac 上使用 MoE 模型流式调用专家网络、3 月模型发布动态、「氛围移植」(Vibe porting)、PyPI 和 NPM 供应链攻击事件等话题。每月 10 美元订阅可提前一个月获取内容,2 月刊作为样本公开预览。
Simon Willison's Weblog 2026/04/01
datasette-llm 插件发布 0.1a6 版本,修复了模型配置的冗余问题:将某个模型 ID 设为默认模型后,无需再手动将其加入允许模型列表,系统自动处理。此版本同时改进了 Python API 的使用文档。该插件定位为供其他 Datasette 插件依赖的 LLM 集成基础层。
阮一峰的网络日志 2026/04/03
阮一峰第391期周刊聚焦AI带来的社会贫富分化:Claude Code Max套餐月费200美元,OpenAI曾构想月费2万美元的顶级套餐,大模型与工业品相反——不存在规模效应,算力越多成本越高。周刊还介绍了一项衡量模型能力的新方法:以人类完成任务所需时间为基准,O3可50%成功率完成约2小时的任务,Opus 4.6达12小时,且每7个月翻倍,预计2027-2031年间模型将能处理人类专家需一个月完成的任务。另附GitHub Copilot自动插入广告事件、小米MiMo v2 Pro评测等资讯。
未读 1 → 抓取 17 → 摘要 17 · 提取: readability 15 / rss 2