RSS 每日摘要

2026-04-13 · 7 篇文章 归档

Claude Code 省 Token 指南:慎用 1M 上下文,不开新会话或者总是开新会话都不对

宝玉的分享 2026/04/06
Claude Code 配额消耗过快的根源在于提示缓存机制被误用。缓存命中成本仅为全量计算的十分之一,但缓存前缀必须完全匹配且存活时间仅1小时(主智能体)。频繁 /clear 或切换会话会强制触发全量重建,反而更贵。正确策略是:缓存热、任务未变时继续聊;任务切换或闲置超1小时再开新会话。此外,1M上下文窗口一旦缓存过期将触发巨额重建费用,团队正考虑将默认窗口从1M降至400K。长日志应给路径而非粘贴内容,简单任务应关闭扩展思考模式。

“多智能体协作指南:五种主流模式怎么选、怎么用?”

宝玉的分享 2026/04/12
多智能体系统五种协作模式的选型指南:生成-验证者模式适合有明确评估标准的质量把控场景(如代码生成+测试),但验证标准必须具体否则沦为橡皮图章;调度-子智能体模式适合任务拆解清晰的场景(Claude Code即采用此模式),但调度者易成信息瓶颈;智能体团队模式适合长时间并行的独立子任务,成员可持续积累领域上下文;消息总线适合事件驱动流水线;共享状态适合需要高度协作互相参考的场景。核心建议:从最简单可运行的模式开始,遇到瓶颈再升级。

This week in #Scala (Apr 13, 2026)

This Week In #Scala 2026/04/12
Scala 社区2026年4月动态:Ammonite REPL 工具宣布正式废弃;Scala 2优化器已移植至Scala 3;Scala Days 2026大会官宣,The Scala Workshop征稿截止前于布鲁塞尔举办。此外有关于Protobuf Scala优先支持、PureLogic事件溯源、元编程反射等技术文章发布,以及VirtusLab新工具cellar(从终端查询JVM依赖公共API)值得关注。

500 Tbps of capacity: 16 years of scaling our global network

The Cloudflare Blog 2026/04/10
Cloudflare 外部互联容量突破500 Tbps,覆盖330余个城市的transit、peering及CNI端口总和。从2010年帕洛阿尔托单一transit提供商起步,16年间扩展至保护全球逾20%的Web流量。2025年成功抵御Aisuru-Kimwolf僵尸网络发起的31.4 Tbps DDoS攻击(持续35秒),当日共拦截超5000次攻击,全程无需人工介入。500 Tbps规模的核心在于将防御智能分布至每台服务器,实现网络自主防御。

那个集记账、基金、股票于一体的APP,又往前迈了一大步

运维咖啡吧 2026/04/12
个人开发者独立财务APP「财务管家」迎来重要更新:记账模块新增债务管理(借入/借出跟踪);基金模块新增私募基金管理;股票模块从A股扩展至美股、港股,支持完整家庭资产负债视图。底层同步、缓存、列表渲染全面优化,UI视觉统一性提升。iOS开发者账号已获批,上架流程启动中,首版可能以测试版形式发布。终身会员早鸟价从29.9元上调至39.9元,正式上线后预计128元;已购用户权益不变。

Quoting Bryan Cantrill

Simon Willison's Weblog 2026/04/13
Bryan Cantrill 指出 LLM 天然缺乏「懒惰」美德——对模型而言生成代码没有成本,因此它不会主动追求简洁抽象,反而倾向于堆砌更多代码,使系统越来越臃肿。他认为人类的时间有限,这种「懒惰」恰恰是迫使我们设计精良抽象的核心驱动力;而 LLM 的出现正在侵蚀这一机制,让虚荣指标凌驾于真正重要的系统质量之上。

Gemma 4 audio with MLX

Simon Willison's Weblog 2026/04/12
在 macOS 上通过 MLX 和 mlx-vlm 运行 Google Gemma 4 E2B(10.28 GB)模型实现音频转录的实测记录。作者用一条 14 秒 WAV 文件验证了 `mlx_vlm.generate` 命令,转录结果基本准确,仅有两处口音导致的小错误("front" 误识别为 "right here","how that works" 代替 "how well that works"),整体可用性良好。
未读 2 → 抓取 7 → 摘要 7 · 提取: readability 6 / browser-rendering 1