2026-05-11 · 17 篇文章 归档
Google 官方 MTP Assistant 头部模型(约 0.5B 参数,仅 310-337 MB)通过直接读取目标模型的 KV 缓存实现异步推测解码,在 AMD Ryzen AI MAX+ 395(Strix Halo)平台上将 Gemma 4 31B 从 6.2 t/s 提升至 22.9 t/s(3.7x),并首次让 MoE 架构的 26B-A4B 也获得有效加速(43.6→63.2 t/s,+45%)。传统草稿模型因争抢内存带宽反而拖慢 MoE 推理,而 MTP Assistant 无独立 KV 缓存、计算与系统开销异步重叠的设计从根本上解决了这一问题。需使用 atomic-llama-cpp-turboquant 专用 fork,配合 Vulkan 后端运行。
Sleeping Robots 2026/05/10
Apache OpenDAL 是以 Rust 为核心实现的统一数据访问层,支持 S3、GCS、HDFS、Redis、OneDrive 等数十种存储后端,提供 Python、Node.js、Java、C 等多语言绑定。与 SDK 聚合器不同,OpenDAL 自行实现各存储服务对接(如手动构造 S3 HTTP 请求),原生支持断点续传重试、链路追踪、metrics 等中间件能力。已被 Databend、GreptimeDB、RisingWave、Sccache 等云原生项目采用。未来计划打磨 oli 命令行工具和 oay 代理服务。
尚卓燃 · PsiACE - 文章 2023/07/05
从递归(指数级)到记忆化、线性递推、黄金比例通项公式(常数级),再到矩阵快速幂(对数级),系统梳理了 Python 实现斐波那契数列的多种算法。后半部分对比了 ctypes、CPython C API、Cython、SWIG 四种 C/C++ 扩展 Python 的方案,分析各自在易用性、调试成本和性能方面的取舍,并以 fib(47) 为基准验证不同实现的性能差异。
尚卓燃 · PsiACE - 文章 2022/09/30
作者在入职一年节点的个人复盘:开源方面在 Databend 累计提交超 400 次,ritelinked 达 10 万下载,databend-internals 获 160 star,并开始担任 GSoC 导师;同时坦承数月状态低落、databend-perf 频繁出 bug 等不足。后续计划包括对 databend-query 进行拆分/测试重构、持续维护 databend-internals,以及提升开发者运营能力。
尚卓燃 · PsiACE - 文章 2022/07/05
本期 Scala 周报汇聚多项社区进展:SIP-80 提案引入目标类型伴生对象简写语法;sbt 2 进入收尾阶段;Mill 博客探讨改善 Scala 脚本体验;Scala 3 新增 Capture Checking 与 Separation Checking 特性介绍;Golem 1.5 宣布支持 Scala;社区新增 alpaca(编译期验证的词法/解析库)、pgmq4s(Postgres 消息队列 Scala 客户端)等开源项目。
This Week In #Scala 2026/05/10
《纽约时报》发布编辑更正说明,承认一篇报道将 AI 生成的内容误当作加拿大保守党领袖 Pierre Poilievre 的真实引语发布。AI 工具将其政治观点"总结"后以第一人称引语格式输出,记者未核实即采用。这一事件再次暴露新闻从业者使用 AI 辅助工具时的核实漏洞,该报已将文章更正为 Poilievre 4 月演讲的实际内容。
Simon Willison's Weblog 2026/05/10
Andrew Quinn 在一篇关于用 10MB FST 替换 3GB SQLite 数据库的技术文章脚注中,分享了关于学习方法的洞见:真正掌握某个领域不需要重造一千个轮子,也不能一个都不造,在大多数领域重造四五个就够了,数学、计算机科学等严谨领域可能需要二三十个。每次亲手实现,加上沿途主动提问,比同等时间的被动学习效率高五倍以上。
Simon Willison's Weblog 2026/05/10
AI Agent 在生产环境中频繁失效的根源不在模型,而在模型外围的基础设施——即 Agent Harness。LangChain 仅通过改变架构层就让系统在 TerminalBench 2.0 上从第 30 名跃升至第 5 名。Harness 涵盖编排循环、工具、记忆、上下文管理等 12 个核心组件,可类比为操作系统:上下文窗口是内存,外部数据库是硬盘,工具是设备驱动。文章系统拆解了 Anthropic、OpenAI、LangChain 的具体实现方案,并区分了提示词工程、上下文工程和 Harness 工程三个层次。
宝玉的分享 2026/05/10
作者身处 8000 人裁员名单的阴影下,借 Coinbase「AI 裁员」事件剖析一个核心矛盾:企业 AI 用量暴增(部分公司工程师每天消耗亿级 Token、代码 PR 量增 2-5 倍),但收入并未同步增长。关键在于混淆了「投入、产出、成果」三个概念——代码只是投入,AI 按 Token 收费的定价模式无法与业务成果挂钩。加速生产代码同时也暴露出产品方向模糊、跨团队对齐失效等深层组织问题,裁员潮本质上是倒逼企业重新定义 AI 的商业转化路径。
宝玉的分享 2026/05/10
英伟达 GEAR Lab 负责人 Jim Fan 在 Sequoia AI Ascent 2026 上宣告 VLA(视觉-语言-动作)架构过时,包括他自己主导的 GR00T。新范式 WAM(世界动作模型)以 DreamZero(140 亿参数)为代表,执行动作前先用视频世界模型「做梦」预测未来几秒,视觉与动作首次成为一等公民。数据策略上,EgoScale 用 21,000 小时人类第一人称视频预训练,发现灵巧操作的神经缩放定律(R²=0.998);DexUMI 外骨骼装置完全绕过遥操作采集数据。Fan 给出 2040 年前实现机器人自主设计制造下一代机器人的预测,置信度 95%。
宝玉的分享 2026/05/10
Databend 的 common/functions 模块因大量 codegen 导致链接阶段 OOM,CI 持续挂掉。文章提供两条实用缓解路径:一是用 mold 替换默认链接器,其内存占用低于 GNU ld 和 lld,可通过 mold -run 或 .cargo/config.toml 配置接入;二是启用 Rust 新符号修饰方案(symbol-mangling-version=v0),在存在重复组件时生成更小的符号体积。此外还提到拆分编译单元、精简依赖等辅助手段。
尚卓燃 · PsiACE - 文章 2022/02/23
摘录自沈向洋提出的论文阅读方法论,以十个递进问题为框架系统拆解一篇论文:从「解决什么问题」「是否是新问题」「科学假设是什么」,到相关研究梳理、方案关键点、实验设计、数据集与开源情况、实验对假设的支撑程度,再到论文贡献与后续研究方向。配套三条使用原则:区分问题边界、尽量引用原文表达、确保十答能完整呈现论文核心贡献。
尚卓燃 · PsiACE - 文章 2022/02/19
Fedora 默认仅配置约 8GiB 的 zram,在跑 grcov 单元测试时触发 OOM。文章演示在 Btrfs 文件系统上正确创建 Swapfile 的完整流程:新建 non-snapshotted 子卷、用 chattr +C 关闭 CoW、禁用压缩,再用 dd 填充 32GiB 并设置优先级 50(低于 zram 的 100),最终组成 memory → zram → swapfile 三级交换体系,总 Swap 约 40GiB,并写入 fstab 实现开机自动挂载。
尚卓燃 · PsiACE - 文章 2022/01/23
作者在 2022 年元旦写下 2021 年的简短回顾。下半年入职 Datafuse Labs,以全职开源加远程办公的方式完成了职场新人转型;上半年除两次答辩外几乎脱离校园,五月因扭伤卧床近一月。新年期望放下执念,与生活和解,扎实投入学习与工作,不再贪多。
尚卓燃 · PsiACE - 文章 2022/01/01
记录将阿里云 ECS 从 CentOS 迁移至 Arch Linux 的完整流程。使用 vps2arch 脚本三条命令完成系统转换;之后依次配置 SSH 密钥认证、新建非 root 用户并通过 sudoers 授权、用 ufw 设置基础防火墙仅放行 SSH,以及通过 rsync 将密钥同步至普通用户目录。作者认为滚动更新带来的安全性提升和 Arch Wiki 的资料质量足以弥补稳定性损失。
尚卓燃 · PsiACE - 文章 2018/09/11
通过 DOSBox 模拟 DOS 环境,可在 Linux 下运行国内课程常用的 MASM 汇编工具链。具体步骤:安装 DOSBox,将 MASM.EXE、LINK.EXE 等工具放入 ~/.dosbox/MASM 目录,在 dosbox.conf 的 [autoexec] 段配置挂载路径和环境变量,再将 .asm 源文件目录挂载为 E 盘。配置完成后依次执行 masm、link 命令即可编译运行,以 hello world 程序验证环境可用性。
尚卓燃 · PsiACE - 文章 2018/09/06
通过 Bundler 和 github-pages gem 在本地搭建与 GitHub Pages 完全一致的 Jekyll 环境,避免部署时出现差异。文章涵盖本地环境配置、创建 username.github.io 仓库启用用户页面、选用第三方主题(推荐 Huxblog-Boilerplate、Jekyll NexT、Leonids)以及 Jekyll 目录结构解析(_config.yml、_posts、_layouts 等)。整合第三方评论和统计插件可弥补静态站点缺少动态功能的不足。
尚卓燃 · PsiACE - 文章 2018/07/14
未读 22 → 抓取 22 → 摘要 17 → 失败 5 · 提取: readability 20 / browser-rendering 1 / rss 1