RSS 每日摘要

2026-05-08 · 25 篇文章归档

优化 Echo-TTS：CPU 性能超越 GPU 混合方案

作者对 Echo-TTS 文本转语音模型进行 CPU 路径优化，最终让纯 CPU 方案超越了此前最快的 GPU 混合路径（RTF 0.52）。核心优化包括：将 CFG 前向传播从 3 次降至 2 次（节省约 25% 计算量）、将自动编码器切换到 bfloat16（解码时间从 7.8s 降至 4.7s，提升 40%）、将 CFG 窗口缩窄至 30% 的步骤、以及根据文本长度动态调整潜变量序列帧数（解决短文本性能差问题）。8 项优化中 5 项有效，组合后 RTF 大幅提升。

Sleeping Robots 2026/05/07

MTP 投机解码：Strix Halo 上 Qwen 3.6 27B 提速 4.8 倍

Qwen 3.6 27B 因无同族小模型可用，传统投机解码和 ngram 方案均无效，速度卡在 6.2 t/s。Multi-Token Prediction（MTP）将预测头直接内置于模型权重中，无需外部 draft 模型，在 Strix Halo 上将速度提升至 29.8 t/s（Q4_K_M），实现 4.8 倍加速。MTP 支持目前在 llama.cpp PR #22673 中，需使用专门转换的 GGUF 文件，Vulkan 后端已获完整支持。

Sleeping Robots 2026/05/06

llm-gemini 0.31 发布

Simon Willison 发布 llm-gemini 插件 0.31 版本，该插件为 LLM 命令行工具提供 Google Gemini 模型支持。正文内容有限，具体更新细节未在摘要中披露。

Simon Willison's Weblog 2026/05/07

Big Words：将文字转为简洁演示幻灯片的小工具

Simon Willison 为其 macOS 演示工具制作了配套页面 Big Words，通过 URL 查询参数接受文字内容，将其渲染为带渐变背景的全屏大字幻灯片。支持文字大小、渐变等参数调节，双击页面可打开表单进行可视化编辑。典型使用场景是在仅接受 URL 的演示工具中快速生成文字幻灯片。

Simon Willison's Weblog 2026/05/07

GitHub Repo Stats：在浏览器中查看仓库详细统计信息的工具

Simon Willison 构建的浏览器端工具，通过 GitHub REST API 直接获取仓库统计数据，包括提交数、贡献者、语言占比、Stars、Forks、分支、标签及活跃时间等。开发动因是 GitHub 移动端布局不显示提交总数。可选填 GitHub Token，将 API 速率限制从 60 次/小时提升至 5000 次/小时。

Simon Willison's Weblog 2026/05/07

Simplex 借助 Codex 重新定义软件开发流程

Simplex 将 ChatGPT Enterprise 与 Codex 整合进软件开发全流程，显著压缩设计、构建和测试环节的耗时，并在团队内部规模化落地 AI 驱动的工作流。该案例展示了 Codex 在实际工程场景中提升交付效率的具体路径，是 OpenAI 推动企业级 AI 工具落地的最新案例之一。

OpenAI News 2026/05/07

OpenAI 推出 GPT-5.5 和 GPT-5.5-Cyber，扩大网络安全可信访问范围

OpenAI 于 2026 年 5 月正式推出 GPT-5.5-Cyber，向负责关键基础设施安全的防御方提供限量预览，专门支持网络安全专项工作流。GPT-5.5 已通过「网络安全可信访问」（TAC）机制向开发者和安全团队开放，新推出的 Codex Security 工具也面向开源社区和防御方上线，整体目标是加速构建 AI 驱动的安全防御飞轮。

OpenAI News 2026/05/07

ChatGPT 推出「可信联系人」功能，检测到严重自伤风险时自动通知指定联系人

ChatGPT 新增可选安全功能「Trusted Contact（可信联系人）」，当系统检测到用户存在严重自我伤害风险时，将自动通知用户预先指定的信任联系人。该功能属于主动式危机干预机制，用户可自主选择是否开启，旨在为心理健康高风险场景提供额外的安全保障。

OpenAI News 2026/05/07

Cloudflare 宣布裁员逾 1100 人，以应对 AI 时代的组织架构重塑

Cloudflare 联合创始人在全员邮件中宣布全球裁减超过 1100 名员工，明确表示这并非削减成本或绩效淘汰，而是为适应「智能体 AI 时代」主动重构公司架构。公司内部 AI 使用量过去三个月增长超 600%，工程、HR、财务等部门每日运行数千次 AI 智能体会话。离职员工将获得等同于 2026 年底前全额底薪的遣散补偿，以及相应医疗保障。

The Cloudflare Blog 2026/05/07

Cloudflare 应对 Linux「Copy Fail」本地提权漏洞的完整复盘

2026 年 4 月 29 日，Linux 内核本地提权漏洞 CVE-2026-31431「Copy Fail」公开披露，Cloudflare 安全与工程团队在漏洞披露后数分钟内即通过既有行为检测确认可识别攻击模式，全程无环境影响、无客户数据泄露、无服务中断。漏洞根源在于 AF_ALG 套接字族的 algif_aead 模块处理 AEAD 加密请求时存在缺陷。文章详细介绍了 Cloudflare 定制 Linux LTS 内核的发布流程及其在大规模基础设施安全响应中的实际效果。

The Cloudflare Blog 2026/05/07

Anthropic 兄妹 Dario 和 Daniela 最新对话：Claude 为什么一直限速？

在 Code with Claude 开发者大会上，Anthropic CEO Dario Amodei 透露，公司原按「每年 10 倍」规划算力，但 2026 年 Q1 年化增速高达 80 倍，这是 Claude 持续限速的直接原因。同日，Anthropic 宣布签下 SpaceX Colossus 1 数据中心全部算力（300 MW、22 万张 NVIDIA GPU）。对话还涵盖：最强模型 Mythos 因可利用软件漏洞而未公开发布、编码能力下一个难关是 code review 等「主观判断」任务，以及「组织级 AI」将成未来六个月最大能力跃升。

宝玉的分享 2026/05/06

读书会潜移默化地改变认知

作者读《罗马人的故事》起初带着研究西方人思维方式的目的，被早期罗马的民主与规则意识所吸引，却在读到凯撒之后经历「祛魅」——罗马帝国的腐败与权谋与中国历史如出一辙，由此得出阶段性判断：中西方人本质上差异有限，只是表达形式不同。文章进而分享一个读书心得：真正难啃的书，当下未必有酣畅感，却会在潜意识中重塑大脑认知结构，回报往往在多年后才显现。

Andy Stewart 2026/05/05

AI 时代，销售是最好的职业

作者认为 AI 时代技术门槛趋于消解，销售反而成为最具竞争力的职业——入门门槛低、成长天花板高，且每天面对真实市场检验。做销售能磨练心性、直接感知市场真实需求，这种对需求的深度理解是日后创业或产品开发的核心资产。文章特别强调，传统销售身上的耐心倾听、坚持摆摊、屡败不弃等特质，正是 AI 无法替代的人性光辉，也是未来最稀缺的竞争力。

Andy Stewart 2026/05/05

幕后实录：Mozilla 用 Claude Mythos Preview 加固 Firefox 安全

Mozilla 获得 Claude Mythos 预览访问权限后，利用其定位并修复了 Firefox 中数百个漏洞，其中包括一个存在 20 年的 XSLT 漏洞和 15 年的 `<legend>` 元素缺陷。2025 年 Firefox 每月修复安全漏洞约 20-30 个，4 月单月骤升至 423 个。团队指出，这一突破来自两个因素：模型能力大幅提升，以及通过「引导、扩展、叠加」多模型的工程方法有效过滤噪声——此前 AI 生成的安全报告大多是高成本误报。

Simon Willison's Weblog 2026/05/07

关于 xAI/Anthropic 数据中心交易的几点观察

Anthropic 在 Code w/ Claude 大会上宣布租用 SpaceX Colossus 1 数据中心全部算力，但该设施有严重环保污点——燃气轮机曾以「临时设备」名义绕过《清洁空气法》许可，被指与周边医院入院率上升相关。交易并不意味着 xAI 放弃 Grok，xAI 保留了更大的 Colossus 2 自用。Elon Musk 在推文中表示，若 Claude「危害人类」，xAI 保留收回算力的权利——由其本人界定标准，实质上形成了一种新型供应链控制。

Simon Willison's Weblog 2026/05/07

NLnet Labs：用 Rust 守护互联网核心基础设施

NLnet Labs 是一家25年来专注于 DNS 和 BGP 基础设施的荷兰非营利组织，其开发的 NSD、Unbound、Krill、Routinator 等工具被 Let's Encrypt 和各大互联网运营商广泛部署。这期播客专访了该团队的 Arya Khanna 和 Martin Hoffmann，聊到小团队如何维护关键基础设施，以及他们为何选择 Rust 开发新项目——包括 domain crate 和新一代 DNSSEC 签名工具 Cascade，并分享了在 tokio 生态下的工程实践经验。

Corrode Rust Consulting 2026/05/07

← 2026-05-07 2026-05-09 →

未读 2 → 抓取 27 → 摘要 25 → 失败 2 · 提取: rss 7 / browser-rendering 1 / readability 19

RSS 每日摘要

优化 Echo-TTS：CPU 性能超越 GPU 混合方案

MTP 投机解码：Strix Halo 上 Qwen 3.6 27B 提速 4.8 倍

llm-gemini 0.31 发布

Big Words：将文字转为简洁演示幻灯片的小工具

GitHub Repo Stats：在浏览器中查看仓库详细统计信息的工具

Simplex 借助 Codex 重新定义软件开发流程

OpenAI 推出 GPT-5.5 和 GPT-5.5-Cyber，扩大网络安全可信访问范围

ChatGPT 推出「可信联系人」功能，检测到严重自伤风险时自动通知指定联系人

Cloudflare 宣布裁员逾 1100 人，以应对 AI 时代的组织架构重塑

Cloudflare 应对 Linux「Copy Fail」本地提权漏洞的完整复盘

Anthropic 兄妹 Dario 和 Daniela 最新对话：Claude 为什么一直限速？

读书会潜移默化地改变认知

AI 时代，销售是最好的职业

幕后实录：Mozilla 用 Claude Mythos Preview 加固 Firefox 安全

关于 xAI/Anthropic 数据中心交易的几点观察

NLnet Labs：用 Rust 守护互联网核心基础设施

免费如繁殖中的毛球：开源依赖的失控隐喻

我买基金从不亏钱

为什么更长训练周期没有拖慢 AI 进展？

关于留学生

OpenAI API 推出新实时语音模型，支持推理、翻译与语音转录

Parloa 借助 OpenAI 模型打造企业级语音 AI 客服智能体

Singular Bank 用 ChatGPT 和 Codex 为银行员工每天节省 60–90 分钟

Uber 接入 OpenAI，助司机更高效接单、乘客更快完成预订

OpenAI 发布 ChatGPT Futures 2026届：26位学生创新者入选