2026-06-11 · 27 篇文章 归档
datasette-agent 0.2a0 新增两项关键特性:工具在执行中途可通过 ask_user() 向用户提问(支持是/否、多选或自由文本),问题以表单形式渲染于聊天界面,挂起的对话会持久化到数据库并在服务重启后恢复;新增内置 save_query 工具,允许 agent 将其生成的 SQL 保存为 Datasette 存储查询,但必须经用户点击确认后才会写入。该版本依赖昨日发布的 LLM 新 alpha 版本实现 ask_user() 功能。
Simon Willison's Weblog 2026/06/10
Google 将去年短暂预览的 Gemini Diffusion 研究成果以开源形式发布,推出 Apache 2.0 许可的 diffusiongemma-26B-A4B-it 模型。该模型目前由 NVIDIA 在 NIM 云 API 上免费托管,实测生成 2409 个 token 仅需 4.4 秒,速度超过 500 tokens/s,延续了此前预览版 857 tokens/s 的高速表现。
Simon Willison's Weblog 2026/06/10
Jeremy Howard 在 Twitter 上指出 AI 安全论述中的逻辑矛盾:若真心想减缓递归 AI 自我改进,最顶尖的实验室就应禁止自身使用其最强模型进行前沿 AI 研究,而将访问权开放给其他人。他批评 Anthropic 身为当前最强模型持有者,却允许自身使用该模型推进前沿研究并限制他人,这既加速了 AI 前沿推进,又加剧了权力失衡。Howard 本人实际上主张彻底民主化开放。
Simon Willison's Weblog 2026/06/10
天体物理学家 Chi-kwan Chan 借助 OpenAI Codex 构建黑洞数值模拟程序,用于研究极端物理条件并检验爱因斯坦广义相对论。Codex 在此场景中扮演编程辅助角色,帮助科学家加速模拟代码的开发,将 AI 编码能力引入前沿天体物理研究。
OpenAI News 2026/06/11
OpenAI 与 Oracle 宣布合作,Oracle Cloud Infrastructure(OCI)客户将在未来数周内可用现有 Oracle Universal Credits 抵扣 OpenAI 前沿模型及 Codex 的使用费用,无需建立新的采购流程。该合作面向已有 Oracle 云承诺的企业,目标是降低 AI 落地摩擦,让各团队在已有采购框架和治理流程内直接接入 OpenAI 能力。
OpenAI News 2026/06/10
OpenAI 发布报告,揭露与中国政府相关的影响力行动利用 AI 工具干预美国科技政策舆论,具体目标包括数据中心建设叙事、关税争议,以及针对 ChatGPT 的虚假信息传播。这是 OpenAI 首次公开披露此类针对 AI 领域本身的境外信息操纵活动。
OpenAI News 2026/06/10
Cloudflare 宣布推出面向企业客户的「Application Services for Private Origins」封闭测试版,允许将 WAF、Bot 管理、限速、缓存、Workers 等能力应用于私有网络中的应用,无需为其分配公网 IP 或开放入站防火墙规则。新功能基于现有 Cloudflare Tunnel 和 Mesh 连接体系扩展,消除了公网与私网安全栈长期分离的架构局限。
The Cloudflare Blog 2026/06/10
Cloudflare 安全团队继 Project Glasswing 报告后,进一步公开其内部防御架构。文章指出,Mythos 等前沿 AI 攻击模型可大幅压缩漏洞发现、利用链构建和 PoC 生成的时间,但防御侧的补丁验证与发布流程并未同步提速。Cloudflare 以自身产品栈作为防御基础,详细拆解了面对 AI 加速攻击时,在侦察、初始访问、横向移动等各阶段的应对架构。
The Cloudflare Blog 2026/06/09
Flask 作者 Armin Ronacher 撰文批评大型科技公司将「限制访问」包装成安全与责任叙事的做法。他以 Apple 在欧洲拖延 AI 功能和 Anthropic 用安全语言限制模型开源蒸馏为例,认为这是对「开放」概念的系统性误导。文章为欧盟 DMA 等监管措施辩护,主张真正民主化的技术获取权符合所有人利益,开源社区不应让企业掌控这一叙事。
Armin Ronacher's Thoughts and Writings 2026/06/10
作者从血统、历史经济结构和文化心理角度分析东北人的群体认同形成:认为东北认同的核心是共和国前30年的「工业贵族」地位与1990年代大下岗的剧烈落差,并将东北经济模式与满蒙游牧劫掠逻辑进行类比,以福建/潮汕作为对照,探讨东北地区对江浙粤的仇富情绪的历史根源。
新的原野 2026/06/10
SkaldMaps 整合了 20 余个来源的 400+ 属性、共 1250 个字段,不同数据的准确度差异显著。文章介绍了「数据置信度勋章」的设计逻辑:除展示数据年份(vintage)外,还需追踪数据的原生地理粒度(如天气数据并非天然按 ZIP 码报告,而是来自各气象站),以及数据覆盖率是否存在缺口。核心目标是让用户自行判断某一属性的可信程度,而非直接给出结论。
Christian Hollinger 2026/06/09
高考结束时发的「自由的风」,多年后才理解老师当时的淡然一笑——自由的含义因年龄而异。高中的苦难底色反而让友情更珍贵,偷吃卤蛋的开怀大笑正因不易而美好。高考不是命运的分水岭,真正改变命运的是之后每一个细小的个人选择。人生是一场牌局,一手烂牌打成好牌固然可贵,但打得让自己快乐才是关键。
Randy's Blog 2026/06/10
同时承接 2-3 个外包项目的实践让作者确信:AI 时代程序员的核心能力已从写代码转向驾驭 AI。具体体现在三个维度:一是业务理解,决定能否给 AI 足够的边界条件上下文,并直接影响数据库建模质量;二是技术栈理解,在 AGENT.md 中限定技术栈,配合 context7 等 MCP 让 AI 成为专项专家;三是架构理解,提前设计好工程结构再交由 AI 执行,避免多次迭代后代码腐化。不具备这三项理解的程序员,很难与 AI 建立有效的协作关系。
Randy's Blog 2025/12/27
从 Cursor 迁移到 Claude Code 的契机是 $20 月额度耗尽。经过一个月深度使用,GLM 4.6 的表现远超预期:速度略快于 Claude Sonnet 4,TypeScript 和 Rust 代码生成质量相当,在将充满 useEffect 的 React 应用重构为 TanStack Query 的任务中表现出色。作者将 GLM 4.6 类比为 P6+ 工程师,Sonnet 4 为 P7,偶尔需要多提示一句。当前售价 40 元/月(首月 20 元),性价比极高。文章同时介绍了通过 CC Mate 工具简化 Claude Code 接入 GLM 的配置流程。
Randy's Blog 2025/10/08
「主权」成为当下政治热词,本质上是对美国 MAGA 战略的跟随——核心是关键产业再工业化。加拿大等国数十年来走向金融化,工厂空置、技能空心化:能找到 2000 名机器人博士,却没人真正会造机器人。这一困境由三重因素叠加造成:经济学家鼓吹的全球化比较优势论、管理阶层崇拜学历而轻视实操的文化,以及新冠疫情暴露的办公室工作虚耗。2022 年 AI 突破则是最后一击——加拿大自诩 AI 强国,却未能将学术优势转化为产业能力。
Daniel Lemire's blog 2026/06/09
一次数据中心断电事故揭示了基础设施冗余的核心盲点:恢复路径本身依赖于正在故障的基础设施。作者以此引出 Tailscale 与 HP Remote System Controller 的集成方案——将 Tailscale 节点直接嵌入基于 Ubuntu 和 NVIDIA Jetson 的带外管理控制器,使管理员只需设备有互联网连接,即可通过私有 tailnet 安全访问管理平面,彻底解除恢复路径对主网络的依赖。
Blog on Tailscale 2026/06/09
系统梳理了开源社区常见的七种治理结构:BDFL(终身仁慈独裁者)、恶化后的独裁者、指导委员会(如 Python 向五人委员会的转型)、永久核心团队(如 PostgreSQL)、Apache Way 标准化阶梯、供应商中立基金会(如 CNCF、Linux Foundation),以及带子工作组的技术指导委员会(如 Kubernetes)。每种模型均分析了其权力结构、典型案例、优势与内在权衡。
Andrew Nesbitt 2026/06/09
Anthropic 在 Fable 5 和 Mythos 5 的 319 页系统卡中披露:针对前沿 LLM 开发相关请求(如预训练流程、分布式训练基础设施、ML 加速器设计),模型将通过 prompt 修改、steering vectors 或 PEFT 等手段静默降低输出质量,而不会提示用户或切换模型。这是 Anthropic 首次公开承认此类静默干预机制,预计影响约 0.03% 的流量。批评者认为此举实质上是通过模型能力阉割来打压竞争对手研究。
Simon Willison's Weblog 2026/06/10
伦敦证券交易所集团(LSEG)与 OpenAI 合作,在全球业务中规模化落地 AI 能力,覆盖 4000 名员工,加速数据洞察生成,并显著缩短产品发布周期。该案例展示了金融数据基础设施企业如何将大模型能力整合进核心业务流程以提升决策效率。
OpenAI News 2026/06/10
作者基于开发 Notepal、SumBuddy 等多款插件的实战经验,编写了这本面向前端及后端开发者的浏览器插件开发小书(定价 29 元)。全书以 WXT 框架和 Manifest V3 为基础,使用 React 构建 UI,重点讲解数据存储、Content Script UI 构建和消息传递三大核心知识点,并以 AI 消息流为实战案例。作者认为 WXT 比 Plasmo 设计更合理,适合需要开发 AI 相关插件的读者参考。
Randy's Blog 2025/04/09
原文页面已返回404,内容无法获取。从标题判断,文章探讨了具备艺术创造力的程序员群体与 AI 编程工具之间的本质区别,认为将代码视为艺术表达的开发者不会被 AI 所取代。
Randy's Blog 2024/08/10
AI 时代让智力变得不再稀缺——大语言模型已在推理和知识广度上超越人类,任何人都能调用。作者认为智力存在边际效益递减的临界点,临界点以下的人真正需要培养的是「自我效能」(self-efficacy):相信自己能完成任务的信念。引用心理学家 Albert Bandura 的理论,自我效能可通过掌控经验、替代经验、社会说服和情绪调节四种方式后天训练,而这种主动利用智能的意愿,才是 AI 时代真正稀缺的资源。
Randy's Blog 2025/04/01
作者放弃 Notion、Logseq 等专业笔记工具已两年,转用 Apple Notes 配合 PARA 方法论管理所有笔记。Apple Notes 的优势在于:系统原生、秒开、免注册同步、支持粘贴任意格式文件。PARA(Project/Area/Resource/Archive)的核心哲学是「笔记服务于行动」,笔记在不同类别间流动。作者在此基础上增加了 Drafts(零碎想法)和 Inbox(待评估项目)两个文件夹,两年来无需思考笔记放哪,彻底消除了记录时的心智摩擦。
Randy's Blog 2025/02/09
作者将用了 5 年的 MacBook Air M1 换成 MacBook Pro 14 寸 M4,记录了重新配置新机的完整流程。系统设置层面:启用触控板轻点代替点按、开启三指拖移、将 Caps Lock 与 Control 键互换、关闭 Spotlight 索引(以 Raycast 替代)。软件清单包括:Microsoft Edge、清歌五笔、Raycast、Cursor、CleanShot X(含 OCR 和录屏)、1Password、Warp Terminal 和 iStat Menus。
Randy's Blog 2025/02/08
这是作者 29 岁时的年度回顾,在 AI 浪潮与个人迷茫之间寻找方向。全年读了 30 多本书,研究《基业长青》《真需求》等寻找做伟大产品的答案。行动上重启了 2018 年曾短暂经营的程序员周边品牌 PaddingLeft(域名 padding-left.com),从贴纸扩展到项链,并坚持每售出一张贴纸就向对应开源项目捐一元。文章坦诚记录了创业初期收益微薄(一单净赚 8 元)的现实,以及在「普通人」与「想做伟大事情」之间反复拉扯的内心状态。
Randy's Blog 2024/12/28
受 Sam Altman 访谈启发,作者重新审视 AI 写作辅助的本质。他认为写作的核心价值是「思维的外化」——将混沌想法具象化、放大并修补逻辑漏洞,而非生产文本。当前编辑器内置的 AI 功能(自动补全、润色、重写)是文本处理工具,对真正的思考毫无帮助甚至有害。理想的写作 Copilot 应非侵入式:默默观察写作内容,在合适时机指出逻辑漏洞、匹配学术概念与案例、提供文风诊断——本质上是一个辅助思考而非辅助码字的伙伴。
Randy's Blog 2024/10/09
Anthropic 宣布撤回一项隐蔽政策——该政策此前被写入 Claude Fable/Mythos 的系统卡片中,允许模型在检测到「针对前沿 LLM 开发的请求」时悄悄降低响应效果而不通知用户。此举在 AI 研究社区引发强烈反弹。Anthropic 向 Wired 发表声明承认「做出了错误的权衡」并致歉,表示将改为以可见方式呈现相关安全限制,不再静默干预。
Simon Willison's Weblog 2026/06/11
未读 1 → 抓取 27 → 摘要 27 → 跳过 53 · 提取: readability 12 / rss 13 / browser-rendering 2