2026-05-30 · 12 篇文章 归档
波士顿儿童医院与 OpenAI 合作,将 AI 技术应用于患者护理流程,已协助诊断超过 40 例罕见疾病病例,同时降低医疗团队的运营负担。这是 OpenAI 医疗领域落地的典型案例,展示了大模型在辅助临床诊断尤其是罕见病识别方面的实际价值。
OpenAI News 2026/05/29
Composer 2.10 引入统一的 config.policy 配置块,将安全公告、恶意软件报告、废弃包及自定义黑名单整合到单一配置对象下,每类列表均支持 block/audit/ignore 三种模式。恶意软件列表默认开启,且在 composer install 阶段即拦截,而非事后审计。仓库通过 filter.metadata: true 声明支持,Packagist.org 已接入 Aikido 的恶意包数据源,当前覆盖约 70 个已标记包。该功能由 Sovereign Tech Agency 和 Aikido 资助开发。
Andrew Nesbitt 2026/05/29
当前 AI 前沿模型格局中,Anthropic 和 OpenAI 领跑,Gemini 3.1 Pro 落后于二者,在软件工程任务上甚至不及 GLM 5.1 和 Qwen 3.7。Google I/O 发布的 Gemini 3.5 Flash 虽以 206 t/s 的速度领先竞品约 4 倍,但定价高达 $9/MTok,较上一代 Flash 涨价 3 倍,定位尴尬——既不及 GPT-5.5/Opus 智能,又远贵于中国模型。作者认为该模型更可能是为 Google 内部产品(如 AI Mode、Gmail)服务而非面向外部开发者。
Martin Alderson 2026/05/29
2010年江苏高考数学II卷压轴题要求证明:若三角形三边均为有理数,则 cos A 及 cos nA(n 为任意正整数)均为有理数。第一问利用余弦定理将 cos A 表达为三边的四则运算,由有理数封闭性直接得证;第二问构造二阶递推关系 cos(k+1)A = 2·cos kA·cos A − cos(k−1)A,再以数学归纳法完成证明。该题本质涉及群论中有理数在四则运算下的代数结构。
Long Luo's Life Notes 2026/02/28
Datasette 1.0a31 带来两项核心新功能:具备相应权限的用户现可直接对数据库执行写操作(INSERT/UPDATE/DELETE),以及将查询保存为「存储查询」(原名 canned queries),支持私有或共享给实例内其他成员。新的执行查询界面提供模板化写查询入口,降低了使用门槛。这是 Datasette 博客上线两周内发布的第三篇功能介绍文章。
Simon Willison's Weblog 2026/05/29
OpenAI 正式发布 Rosalind Biodefense 计划,向经过审查的开发者和美国政府合作伙伴开放 GPT-Rosalind 的受信任访问权限。该计划聚焦生物防御、公共卫生及大流行病应对准备,旨在通过前沿 AI 能力提升国家和社会层面的生物安全响应能力。
OpenAI News 2026/05/29
日本最大金融集团 MUFG 引入 ChatGPT Enterprise,推动自身向 AI 原生组织转型。部署覆盖内部工作流程优化,同时向客户提供 AI 驱动的金融服务。这是大型传统金融机构系统性采用生成式 AI 的典型案例。
OpenAI News 2026/05/28
系统梳理了 2025 年 4-5 月主要开源 LLM 的架构创新,核心主题是长上下文效率优化。重点介绍四项新设计:Gemma 4 的 KV 共享与逐层嵌入、ZAYA1-8B 的压缩卷积注意力、Laguna XS.2 的逐层注意力预算分配,以及 DeepSeek V4 的多头压缩(mHC)与压缩注意力。这些改动的共同动机是随着推理模型和 Agent 工作流使用更长上下文,KV 缓存大小、内存带宽和注意力计算成本成为核心瓶颈。
Sebastian Raschka, PhD 2026/05/16
配套一个收录 45 个条目的 LLM 架构图谱(llm-architecture-gallery),系统梳理了近年主流开源模型中使用的注意力机制变体:从标准多头注意力(MHA)出发,覆盖 MQA、GQA、MLA、滑动窗口注意力、稀疏注意力及混合注意力设计。每个条目附有可视化模型卡片,兼顾参考手册与学习资源两种用途。已提供 Redbubble 海报版本(推荐 26.9×23.4 英寸以保证可读性)。
Sebastian Raschka, PhD 2026/03/22
用 Python 和 PyTorch 从零代码实现 Transformer 中的四种注意力机制:自注意力、多头注意力(MHA)、因果注意力和交叉注意力。文章追溯注意力机制从 RNN 编解码器到 2017 年《Attention Is All You Need》Transformer 架构的演化脉络,逐步构建每种变体的代码实现,适合希望通过动手编码深入理解 GPT-4、Llama 等 LLM 核心组件的开发者。
Sebastian Raschka, PhD 2023/02/09
Braintrust 工程团队将 OpenAI Codex(搭载 GPT-5.5)集成进开发工作流,用于快速运行实验并加速编码。通过 Codex 自动将客户需求解析并生成可运行代码,工程师得以将精力集中在更高层次的设计决策上,实测显示迭代速度显著提升。
OpenAI News 2026/05/29
OpenAI 发布前沿模型第三方评估方法论指南,核心观点是评测环境(harness)的选择对结果至关重要。随着前沿模型已从单轮问答进化为能使用工具、跨步骤追踪信息的 Agent,早期将模型视为聊天机器人的评测范式已经失效。指南重点提出:需根据任务选择合适的评测框架,系统检查可能扭曲结果的已知风险因素,并呼吁建立行业统一的评估标准。
OpenAI News 2026/05/29
未读 12 → 抓取 12 → 摘要 12 · 提取: readability 7 / rss 4 / browser-rendering 1