2026-05-08 · 25 篇文章 归档
作者对 Echo-TTS 文本转语音模型进行 CPU 路径优化,最终让纯 CPU 方案超越了此前最快的 GPU 混合路径(RTF 0.52)。核心优化包括:将 CFG 前向传播从 3 次降至 2 次(节省约 25% 计算量)、将自动编码器切换到 bfloat16(解码时间从 7.8s 降至 4.7s,提升 40%)、将 CFG 窗口缩窄至 30% 的步骤、以及根据文本长度动态调整潜变量序列帧数(解决短文本性能差问题)。8 项优化中 5 项有效,组合后 RTF 大幅提升。
Sleeping Robots 2026/05/07
Qwen 3.6 27B 因无同族小模型可用,传统投机解码和 ngram 方案均无效,速度卡在 6.2 t/s。Multi-Token Prediction(MTP)将预测头直接内置于模型权重中,无需外部 draft 模型,在 Strix Halo 上将速度提升至 29.8 t/s(Q4_K_M),实现 4.8 倍加速。MTP 支持目前在 llama.cpp PR #22673 中,需使用专门转换的 GGUF 文件,Vulkan 后端已获完整支持。
Sleeping Robots 2026/05/06
Simon Willison 发布 llm-gemini 插件 0.31 版本,该插件为 LLM 命令行工具提供 Google Gemini 模型支持。正文内容有限,具体更新细节未在摘要中披露。
Simon Willison's Weblog 2026/05/07
Simon Willison 为其 macOS 演示工具制作了配套页面 Big Words,通过 URL 查询参数接受文字内容,将其渲染为带渐变背景的全屏大字幻灯片。支持文字大小、渐变等参数调节,双击页面可打开表单进行可视化编辑。典型使用场景是在仅接受 URL 的演示工具中快速生成文字幻灯片。
Simon Willison's Weblog 2026/05/07
Simon Willison 构建的浏览器端工具,通过 GitHub REST API 直接获取仓库统计数据,包括提交数、贡献者、语言占比、Stars、Forks、分支、标签及活跃时间等。开发动因是 GitHub 移动端布局不显示提交总数。可选填 GitHub Token,将 API 速率限制从 60 次/小时提升至 5000 次/小时。
Simon Willison's Weblog 2026/05/07
Simplex 将 ChatGPT Enterprise 与 Codex 整合进软件开发全流程,显著压缩设计、构建和测试环节的耗时,并在团队内部规模化落地 AI 驱动的工作流。该案例展示了 Codex 在实际工程场景中提升交付效率的具体路径,是 OpenAI 推动企业级 AI 工具落地的最新案例之一。
OpenAI News 2026/05/07
OpenAI 于 2026 年 5 月正式推出 GPT-5.5-Cyber,向负责关键基础设施安全的防御方提供限量预览,专门支持网络安全专项工作流。GPT-5.5 已通过「网络安全可信访问」(TAC)机制向开发者和安全团队开放,新推出的 Codex Security 工具也面向开源社区和防御方上线,整体目标是加速构建 AI 驱动的安全防御飞轮。
OpenAI News 2026/05/07
ChatGPT 新增可选安全功能「Trusted Contact(可信联系人)」,当系统检测到用户存在严重自我伤害风险时,将自动通知用户预先指定的信任联系人。该功能属于主动式危机干预机制,用户可自主选择是否开启,旨在为心理健康高风险场景提供额外的安全保障。
OpenAI News 2026/05/07
Cloudflare 联合创始人在全员邮件中宣布全球裁减超过 1100 名员工,明确表示这并非削减成本或绩效淘汰,而是为适应「智能体 AI 时代」主动重构公司架构。公司内部 AI 使用量过去三个月增长超 600%,工程、HR、财务等部门每日运行数千次 AI 智能体会话。离职员工将获得等同于 2026 年底前全额底薪的遣散补偿,以及相应医疗保障。
The Cloudflare Blog 2026/05/07
2026 年 4 月 29 日,Linux 内核本地提权漏洞 CVE-2026-31431「Copy Fail」公开披露,Cloudflare 安全与工程团队在漏洞披露后数分钟内即通过既有行为检测确认可识别攻击模式,全程无环境影响、无客户数据泄露、无服务中断。漏洞根源在于 AF_ALG 套接字族的 algif_aead 模块处理 AEAD 加密请求时存在缺陷。文章详细介绍了 Cloudflare 定制 Linux LTS 内核的发布流程及其在大规模基础设施安全响应中的实际效果。
The Cloudflare Blog 2026/05/07
在 Code with Claude 开发者大会上,Anthropic CEO Dario Amodei 透露,公司原按「每年 10 倍」规划算力,但 2026 年 Q1 年化增速高达 80 倍,这是 Claude 持续限速的直接原因。同日,Anthropic 宣布签下 SpaceX Colossus 1 数据中心全部算力(300 MW、22 万张 NVIDIA GPU)。对话还涵盖:最强模型 Mythos 因可利用软件漏洞而未公开发布、编码能力下一个难关是 code review 等「主观判断」任务,以及「组织级 AI」将成未来六个月最大能力跃升。
宝玉的分享 2026/05/06
作者读《罗马人的故事》起初带着研究西方人思维方式的目的,被早期罗马的民主与规则意识所吸引,却在读到凯撒之后经历「祛魅」——罗马帝国的腐败与权谋与中国历史如出一辙,由此得出阶段性判断:中西方人本质上差异有限,只是表达形式不同。文章进而分享一个读书心得:真正难啃的书,当下未必有酣畅感,却会在潜意识中重塑大脑认知结构,回报往往在多年后才显现。
Andy Stewart 2026/05/05
作者认为 AI 时代技术门槛趋于消解,销售反而成为最具竞争力的职业——入门门槛低、成长天花板高,且每天面对真实市场检验。做销售能磨练心性、直接感知市场真实需求,这种对需求的深度理解是日后创业或产品开发的核心资产。文章特别强调,传统销售身上的耐心倾听、坚持摆摊、屡败不弃等特质,正是 AI 无法替代的人性光辉,也是未来最稀缺的竞争力。
Andy Stewart 2026/05/05
Mozilla 获得 Claude Mythos 预览访问权限后,利用其定位并修复了 Firefox 中数百个漏洞,其中包括一个存在 20 年的 XSLT 漏洞和 15 年的 `<legend>` 元素缺陷。2025 年 Firefox 每月修复安全漏洞约 20-30 个,4 月单月骤升至 423 个。团队指出,这一突破来自两个因素:模型能力大幅提升,以及通过「引导、扩展、叠加」多模型的工程方法有效过滤噪声——此前 AI 生成的安全报告大多是高成本误报。
Simon Willison's Weblog 2026/05/07
Anthropic 在 Code w/ Claude 大会上宣布租用 SpaceX Colossus 1 数据中心全部算力,但该设施有严重环保污点——燃气轮机曾以「临时设备」名义绕过《清洁空气法》许可,被指与周边医院入院率上升相关。交易并不意味着 xAI 放弃 Grok,xAI 保留了更大的 Colossus 2 自用。Elon Musk 在推文中表示,若 Claude「危害人类」,xAI 保留收回算力的权利——由其本人界定标准,实质上形成了一种新型供应链控制。
Simon Willison's Weblog 2026/05/07
NLnet Labs 是一家25年来专注于 DNS 和 BGP 基础设施的荷兰非营利组织,其开发的 NSD、Unbound、Krill、Routinator 等工具被 Let's Encrypt 和各大互联网运营商广泛部署。这期播客专访了该团队的 Arya Khanna 和 Martin Hoffmann,聊到小团队如何维护关键基础设施,以及他们为何选择 Rust 开发新项目——包括 domain crate 和新一代 DNSSEC 签名工具 Cascade,并分享了在 tokio 生态下的工程实践经验。
Corrode Rust Consulting 2026/05/07
作者从「免费如啤酒」「免费如言论」「免费如小狗」三种开源隐喻出发,提出第四种:「免费如 Tribbles」——《星际迷航》中指数级繁殖的毛球生物。一个 React 项目启动时会拉入超过一千个包,每个直接依赖又携带着自己的依赖链,left-pad 事件正是这一机制的典型产物。随着 AI 辅助扫描器加速暴露漏洞,传递性依赖的安全风险已超出维护者的处理能力,「天生已孕」的包生态正在悄悄毒化供应链。
Andrew Nesbitt 2026/05/07
作者历时五年从深套到回本,记录了一段始于2020年7月、净值腰斩后漫长解套的基金投资经历。最终总结出三点让自己持仓不割肉的原因:长期主义性格、相信市场终会回归、只用闲钱投资。同时给出操作层面的反思:不碰个股(七亏二平一赚)、少买主动基金(经理旱涝保收)、以宽基指数为核心仓位,制定明确的买卖策略后交给时间。
运维咖啡吧 2026/05/07
针对 Dwarkesh Patel 提出的 AI 进展之谜,作者给出两个核心解释:一是训练代码中「低级 bug」的修复(如 GPT-4 初期训练误用 FP16 累加导致精度问题)可带来数量级的算力利用效率提升,足以抵消更长 horizon 任务的开销;二是人类对智能的感知存在系统性偏差——模型比自己弱时很容易察觉,一旦超过自身水平便难以判断真实进步速率,导致外界低估了近年模型能力的实际增长。
seangoedecke.com RSS feed 2026/05/07
作者以亲身经历反驳「留学生水平不行」这一中国互联网流行论断,认为该信息至少滞后5年。真正出现断崖的是2000年前后出生、从小在封闭教育环境下成长的一代——缺乏出国、实习与全球交流机会,专业选择也脱离技术趋势。相比之下,2018年后从英美理工科毕业的留学生普遍具备 Python、机器学习基础能力,整体质量反而持续提升。作者同时援引日本「失落世代」和美国年轻白领的类似现象作横向对比。
新的原野 2026/05/07
OpenAI 在 API 中发布新一代实时语音模型,具备语言推理、多语言翻译和语音转录能力,开发者可借此构建更自然、更智能的语音交互体验。新模型面向 API 用户开放,旨在提升语音 AI 在复杂对话场景中的实用性,是 OpenAI 推进语音智能化的重要一步。
OpenAI News 2026/05/07
德国 AI 公司 Parloa 基于 OpenAI 模型构建可扩展的语音驱动客服智能体,支持企业设计、模拟并部署实时语音交互流程。该方案面向大型企业,可处理高并发客服场景,目标是让客户愿意主动与 AI 对话,而非绕过自动化系统寻求人工服务。
OpenAI News 2026/05/07
西班牙 Singular Bank 基于 ChatGPT 和 Codex 构建了内部助手 Singularity,覆盖会议准备、投资组合分析和跟进事项等日常工作流。实测显示,银行员工每天可节省 60 至 90 分钟,显著提升业务处理效率,是金融行业将大模型落地内部工具的典型案例。
OpenAI News 2026/05/06
Uber 在全球实时出行市场中引入 OpenAI 能力,为司机端提供 AI 助手以优化收入策略,为乘客端提供语音功能以加速叫车流程。该合作覆盖 Uber 核心出行和外卖业务,是 OpenAI 模型在大规模消费级平台落地的最新案例。
OpenAI News 2026/05/06
OpenAI 公布 ChatGPT Futures Class of 2026,从全球选出 26 名在校学生,涵盖科研、创业和社会影响力等方向,展示 Z 世代如何将 ChatGPT 融入学习、创作与解决真实世界问题的实践中。该项目旨在挖掘并放大 AI 原生一代的创新潜力。
OpenAI News 2026/05/06
未读 2 → 抓取 27 → 摘要 25 → 失败 2 · 提取: rss 7 / browser-rendering 1 / readability 19