2026-04-30 · 11 篇文章 归档
Simon Willison 发布 LLM Python 库 0.32a0 alpha 版,带来两项核心架构变更:模型输入从单一文本提示升级为消息序列,模型响应从单一文本升级为多类型内容流。此前版本无法表达多轮对话的初始注入、多模态输入输出等复杂场景,新架构对齐了 OpenAI chat completions API 的消息格式,同时保持向后兼容,为工具调用、结构化 JSON 输出、推理支持等现代 LLM 能力奠定更灵活的抽象基础。
Simon Willison's Weblog 2026/04/29
Claude Code 目前尚不原生支持 Scala 的 LSP 插件,但 Metals 1.6.6 起内置了 MCP 服务器,可作为替代方案。通过 coursier 安装后,在项目目录运行 metals-mcp --workspace . --client claude,工具会自动生成 .mcp.json 配置并启动 Bloop 构建服务器。Claude Code 随即可通过 MCP 调用 compile-full 等操作,感知项目结构、依赖关系和编译错误,而非将 Scala 代码当作纯文本处理。
Yann Moisan 2026/04/28
OpenAI 正在扩展 Stargate 项目以构建支撑 AGI 的计算基础设施,持续新增数据中心容量以应对快速增长的 AI 算力需求。Stargate 是 OpenAI 与软银、甲骨文等合作方联合推进的大规模数据中心建设计划,目标是为下一代 AI 模型训练和推理提供底层算力支撑。
OpenAI News 2026/04/29
OpenAI 发布网络安全行动计划,围绕「普及化网络防御」这一核心目标提出五大支柱:民主化网络防御、跨政企协调、加固前沿网络能力安全、保持部署可见性与控制权、赋能用户自我保护。计划明确 AI 正被防御方和攻击方双向利用,OpenAI 将主动构建基础设施支持网络安全防御者,并通过民主机构和技术开放两条路径提升整体韧性。
OpenAI News 2026/04/29
Andrej Karpathy 在 Sequoia AI Ascent 访谈中分享:2025 年 12 月是其个人转折点,AI 生成代码从「需要修补」变为「直接可用」,他由此进入完全 Vibe Coding 状态。他将当前范式定义为 Software 3.0——通过 prompt 和 context window 操纵 LLM 这一新型解释器。他警示 LLM 能力极度不均衡,并强调 Vibe Coding 只是抬高下限,专业开发者更需掌握 Agentic Engineering,在用 Agent 提速的同时保住质量、安全与责任标准。
宝玉的分享 2026/04/29
Hermes Agent 采用四层记忆架构:压缩至约 1300 Token 的 MEMORY.md 与 USER.md 提示词记忆、基于 SQLite 的可搜索历史会话存档、类程序记忆的技能管理,以及可选的 Honcho 用户建模层。其核心设计哲学是「保持提示词前缀稳定以最大化缓存命中率」,记忆存储的是精选的偏好与环境事实而非流水账,这与 OpenClaw 的日志式设计形成鲜明对比。压缩前的「记忆冲刷」机制可防止重要信息在对话压缩中丢失。
宝玉的分享 2026/04/29
Cloudflare 与 Stripe 联合推出新协议,允许 AI Agent 全程代替用户完成云端部署流程——自动创建 Cloudflare 账户、开通付费订阅、注册域名并获取 API Token,无需人工登录控制台或手动填写信用卡信息。用户仅需接受服务条款并授权,其余步骤完全由 Agent 执行。该能力通过 Stripe Projects CLI 插件集成,结合 Cloudflare 的 Code Mode MCP Server,可实现从零到生产环境的一键部署。Cloudflare 还向通过 Stripe Atlas 注册的新创企业提供 10 万美元算力抵用券。
The Cloudflare Blog 2026/04/30
从 GPT-5.1 开始,OpenAI 的模型越来越频繁地在比喻中使用「地精」「小妖精」等奇幻生物意象。调查发现,根源在于 ChatGPT 个性定制功能中「书呆子人格」的训练过程——团队无意间对含有生物意象的比喻给予了较高奖励,导致该行为在后续模型(包括 GPT-5.5)中持续放大。这一案例揭示了模型行为如何被微小的训练激励信号悄然塑造,并跨代扩散,难以通过常规 eval 指标发现。
OpenAI News 2026/04/29
Zig 是开源社区中对 LLM 限制最严格的主流项目之一,明确禁止 AI 生成的 Issue、PR 和评论。Zig 软件基金会社区副总裁 Loris Cro 将此策略称为「贡献者扑克」:审查 PR 的核心目标不是合并代码,而是培育可信赖的长期贡献者。LLM 辅助切断了这一投资回报链——维护者付出审查成本,却无法识别和培养真实的贡献者能力。使用 Zig 的 Bun 运行时(已被 Anthropic 收购)在 AI 加持下实现了 4 倍编译性能提升,但明确表示不会向上游提交相关改动。
Simon Willison's Weblog 2026/04/30
Simon Willison 发布了 llm 命令行工具的 0.32a1 预览版本。正文内容不足,具体更新细节暂未披露。llm 是一款用于在命令行与大型语言模型交互的开源工具,目前在 Simon Willison 的博客频道持续更新。
Simon Willison's Weblog 2026/04/29
Simon Willison 发布了 llm 命令行工具的 0.32a0 预览版本。正文内容不足,具体更新细节暂未披露。llm 是一款用于在命令行与大型语言模型交互的开源工具,0.32a0 为该版本系列的首个预览构建。
Simon Willison's Weblog 2026/04/29
未读 4 → 抓取 11 → 摘要 11 · 提取: rss 1 / browser-rendering 2 / readability 8