RSS 每日摘要

2026-06-05 · 25 篇文章 归档

Endava 如何围绕 AI 智能体重构软件交付流程

Endava 正将 AI 智能体、ChatGPT Enterprise 和 Codex 深度整合进软件交付全流程,覆盖需求分析、代码生成、测试自动化等环节。目标不仅是提升单点效率,而是在企业层面建立 AI 原生文化——让开发团队习惯与 AI 协同工作,将自动化工作流作为默认交付方式,而非附加工具。
OpenAI News 2026/06/04

Swift on Android:iOSoho Meetup 演讲回顾

Skip 团队在纽约 iOSoho Meetup 上发表了关于 Swift on Android 的演讲,梳理了从早期社区探索到 Swift 6.3 官方 Android SDK 发布的十年历程。内容涵盖三个层次:Android NDK/SDK 原生交互、swift-java 生成 Java 绑定、以及基于 Skip 用 SwiftUI 构建完整 Jetpack Compose 应用。演讲录像已上线,演讲者片段从 37:09 开始。
Skip 2026/05/05

Justin Miller 今晚在 Seattle Xcoders 发表 Swift Result Builders 演讲

Justin Miller(@incanus)将在 Seattle Xcoders 聚会上发表主题为「Swift Result Builders Case Study: Parsing」的演讲,以解析器构建为案例深入探讨 Swift Result Builders 的实际应用。具体时间地点可查阅 Xcoders 博客。
inessential.com 2026/06/04

断电不断服:Meta 如何验证数据中心瞬时断电容灾能力

Meta 推出全新测试范式「Instantaneous PowerLoss Storm」,专门应对零预警瞬时断电场景。该方案基于纵深防御策略,从机房设施、服务器机架、存储、计算到容器编排系统 Twine 全栈构建断电容忍能力,核心机制包括电池供电内存持久化(PLS)和区域级异步信令(UE)。典型区域规模是单一故障域的 50-60 倍,自举引导(bootstrapping)是主要技术挑战。
Engineering at Meta 2026/06/03

Veo:用 Rust 驱动 AI 运动摄像机的硬件与后端实践

Corrode Rust Consulting 播客专访哥本哈根运动科技公司 Veo 的两位工程师:Anders Hellerup Madsen 负责摄像机嵌入式固件与 GStreamer 媒体处理管线,Gorm Casper 负责以 Rust 构建的后端系统,处理大规模赛事视频的摄取、分析与球员追踪。对话聚焦于 Rust 在硬件/软件边界的取舍、在媒体和计算机视觉领域使用系统级语言的权衡,以及 Veo 为何在核心链路押注 Rust。
Corrode Rust Consulting 2026/06/04

VoidZero 加入 Cloudflare

Cloudflare 宣布收购 VoidZero——Vite、Vitest、Rolldown、Oxc 和 Vite+ 背后的公司,全体团队成员一并加入。Cloudflare 明确承诺:上述项目保持 MIT 开源协议、厂商中立、社区驱动,Evan You 团队继续主导开发。Cloudflare 同时宣布向 Vite 生态基金注资 100 万美元,支持 Vue、Nuxt、SvelteKit、Angular 等众多依赖 Vite 的框架生态。此前 Astro 已以类似模式加入 Cloudflare。
The Cloudflare Blog 2026/06/04

强制验证 BGP AS_PATH 中的第一个 AS

Cloudflare 针对近期 Spamhaus 报告的路由劫持事件展开分析,发现攻击者伪造 BGP AS_PATH,利用闲置 ASN 混淆流量来源。其中一起劫持甚至将 Cloudflare 自身的 AS13335 插入伪造路径。Cloudflare 提出简单防御方案:验证 BGP peer 的第一个 AS 是否为其自身网络,并对多个主流网络的 BGP 实现进行了压测,评估该防护措施的落实情况。
The Cloudflare Blog 2026/06/03

gittuf:为 Git refs 提供签名日志

分支保护、CODEOWNERS、必需审查等规则均由代码托管平台数据库维护,不随 git 仓库迁移,且变更不留记录。文章以 2021 年 PHP git 服务器被篡改、2018 年 Gentoo GitHub 组织被接管、2025 年 tj-actions 标签被重定向等真实攻击为例,指出 git 本身不对 refs 签名,恶意服务器可随意移动 ref 指针。gittuf 通过在仓库内维护一份加密签名的 Reference State Log,将策略执行和历史记录内嵌到 git 本身,填补这一安全空白。
Andrew Nesbitt 2026/06/04

被 AI 工具裹挟的程序员

GitHub Copilot 切换按量计费后,作者估算月费至少 800 美元,被迫花大量时间评估 Antigravity、CodexX 等替代工具。由此引发对 AI 时代程序员处境的反思:开发者的注意力从编程语言和原理转移到了模型选型和套餐比价。作者提出更深层的焦虑——Lambda 演算、编译原理等「手工艺时代」知识是否已过时,AI 是否正在抹平程序员之间的能力差距。
smallyu的博客 2026/06/04

从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源

美团开源数字人视频模型 LongCat-Video-Avatar 1.5,在三个方向实现商业级跃升:音频编码器从 Wav2Vec2 升级为 Whisper-large,提升唇形同步和全身时序稳定性;引入逐帧级 GRPO 偏好对齐,改善手部变形和多人互动场景;采用 DMD 蒸馏将推理步骤从 50 步压缩至 8 步,效率提升约 15 倍,生成 10 秒视频仅需约 1 分钟。评测中对 Kling Avatar 2.0 胜率 65.9%,对 OmniHuman-1.5 胜率 61.1%。
美团技术团队 2026/06/04

AI 热情者与时间赛跑,AI 怀疑者与熵增赛跑

Charity Majors 指出 AI 热情者和怀疑者都没有错:前者看到了团队全力拥抱 AI 后出现的真实、非连续性的能力跃升,担忧观望者会被竞争对手淘汰;后者则警告在工程师来不及审阅代码的情况下快速交付,会消耗多年积累的可靠性信任资产,最终导致无人能理解的系统和崩溃的值班轮换。核心问题在于两个群体之间缺乏自然的反馈回路,这既是领导力挑战,也是工程组织设计难题。
Simon Willison's Weblog 2026/06/04

Google 悄然删除声明中「保持人类监督至关重要」的表述

404 Media 记者 Emanuel Maiberg 披露,Google 在一篇报道发布后主动要求修改官方声明,新版本删除了「保持人类在环路中至关重要(it's critical that we maintain humans in the loop)」的表述。此事发生在 Google 员工内部流传吐槽其 AI 产品质量的表情包背景下,引发外界对 Google AI 治理立场的关注。
Simon Willison's Weblog 2026/06/04

Swift 生态系统成立 Networking 工作组

Swift 生态系统指导组宣布成立 Networking 工作组,目标是推动 Swift 网络库、协议和 API 的统一演进。工作组将在 SwiftNIO、AsyncHTTPClient、swift-http-types 等已有基础上,定义分层统一的网络栈、跨库互操作的货币类型(IP 地址、HTTP 请求响应等),并基于结构化并发推进现代 HTTP 客户端/服务端 API 设计,同时统筹 TLS、HTTP/1.1~3、QUIC、WebSockets 等协议实现的演进。
Swift.org 2026/06/04

OpenAI 发布「智能时代的生物防御」行动计划

OpenAI 发布 AI 驱动的生物安全行动计划,旨在构建更具韧性的生物防御体系。计划基于 4 月发布的生物领域前沿推理模型 GPT-Rosalind 及 5 月推出的 Rosalind Biodefense,目标是帮助可信开发者更早检测生物威胁、更快研发对抗措施,并在危机中提升响应协调能力。OpenAI 同时强调需同步建立相应的安全保障与治理机制,以防止相同能力被滥用于生物安全威胁。
OpenAI News 2026/06/04

ChatGPT 推出「Dreaming」新记忆系统以提供更个性化的帮助

ChatGPT 引入名为「Dreaming」的新记忆机制,能够更好地记住用户偏好,使跨对话的上下文保持新鲜且相关,从而提供更具个性化的助手体验。
OpenAI News 2026/06/04

美团 LongCat 开源 General 365:树立推理评测新标尺

美团 LongCat 团队发布并开源通用推理评测基准 General 365,包含 365 道原创种子题目及 1095 个变体,知识范围限定在 K-12 水平,专门解耦推理能力与专业知识。对 26 款主流大模型的实测显示,当前最强的 Gemini 3 Pro 准确率仅 62.8%,绝大多数模型未能及格。相比 BBH/BBEH 等现有基准,General 365 通过八大维度(复杂约束、时空推理、概率推断等)覆盖通用逻辑,t-SNE 分析证明其题目语义分布更均匀,逻辑独立性更强,有效规避了模板记忆问题。
美团技术团队 2026/06/04

用 Agent 评测思路管理 AI Coding:31 万行代码 AI 重构实践

美团 Agent 评测团队在 90% 代码由 AI 生成、系统规模膨胀至 31 万行的背景下,完成了不停机业务重构。核心方法论是将 Agent 评测中的「人人对齐→人机对齐」理念移植到 AI Coding 管理:先统一团队规范共识,再将共识固化为 AI 可执行约束。实践中利用 AI 辅助代码扫描,仅投入有限人力即发现 10 个隐藏极深的性能隐患(纯人工几乎不可能);技术债则通过拆解为业务需求「顺带动作」的方式渐进消化,无需专项重构窗口。
美团技术团队 2026/06/04

LARYBench:具身动作表征领域的 ImageNet,首次量化从人类视频学习的泛化能力

美团发布 LARYBench(Latent Action Representation Yielding Benchmark),填补具身智能领域缺乏独立动作表征质量评测标准的空白。数据集涵盖超 100 万段视频(总时长逾 1000 小时)、151 种动作类型,覆盖 11 种机器人形态。评测从本体动作回归(MSE)和语义动作分类(准确率)两个粒度展开。核心发现:通用视觉模型(如 DINOv3 平均 MSE 0.19)全面优于具身专项模型(LAPA 平均 MSE 0.97),证明通用动作表征可从大规模人类视频数据中自然涌现,无需依赖昂贵的机器人标注数据。
美团技术团队 2026/06/04

突破零样本 TTS 音色克隆上限:LongCat-AudioDiT 的声音克隆艺术

美团 LongCat 团队开源 LongCat-AudioDiT(1B/3.5B),彻底放弃梅尔频谱等中间表示,直接在波形潜空间(Wav-VAE + 扩散 Transformer)完成 TTS,消除级联误差。两项关键推理改进:一是发现并修复流匹配 TTS 中训练-推理不匹配导致的音色漂移问题;二是用自适应投影引导(APG)替代传统 CFG,精准过滤引导信号中的劣化分量。3.5B 模型在 Seed-ZH 测试集说话人相似度(SIM)达 0.818,Seed-Hard 达 0.797,超越 Seed-TTS、CosyVoice3.5、MiniMax-Speech 等模型。
美团技术团队 2026/06/04

LongCat-Flash-Prover:AI 数学定理证明,MiniF2F-Test 通过率达 97.1%

美团 LongCat 团队开源 LongCat-Flash-Prover,专攻基于 Lean4 的数学形式化定理证明。模型将证明过程拆解为自动形式化(Auto-Formalization)、草稿生成(Sketching)、证明生成(Proving)三个原子能力,结合工具集成推理(TIR)与混合专家迭代训练框架。仅用 72 次推理预算即在 MiniF2F-Test 达到 97.1% 通过率,刷新开源 SOTA;竞赛级任务 MathOlympiad-Bench 达 46.7%、PutnamBench 达 41.5%。发布数日内已收到国内顶尖高校合作邀请,探索将数学教材形式化的可能。
美团技术团队 2026/06/04

美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语

美团 LongCat 团队开源 LongCat-Next 模型及其离散分词器,提出三项核心技术:DiNA(离散原生自回归架构)将图像、语音、文本统一映射为同源离散 Token,用单一自回归模型同时完成多模态理解与生成;dNaViT 视觉分词器支持任意分辨率输入,采用 8 层残差向量量化实现 28 倍像素空间压缩;语义完备编码器解决离散化信息损失问题。基座为 LongCat-Flash-Lite MoE(68.5B 总参数、3B 激活参数),实验显示统一模型的理解损失仅比纯理解模型高 0.006,生成损失反而低于纯生成模型 0.02。
美团技术团队 2026/06/04

美团 BI 指标平台与分析引擎的探索与实践

美团构建以指标平台为核心的新一代 BI 架构,核心能力分为两块:自动语义能力将业务语言定义的指标自动解析为结构化逻辑表达,通过主外键关系自动关联数仓模型,实现「定义即研发」;增强计算能力通过智能查询服务(多引擎路由、查询降级)与智能物化(自动构建宽表、汇总表)平衡运营监控的秒级响应与探索分析的海量数据处理需求。目前平台已覆盖百余业务线,查询量达百万级,查询成功率超 99.9%,并在增量计算引擎的存算分离、向量化执行方向持续探索。
美团技术团队 2026/06/04

重塑站外体验:大众点评 M 站基于 Qwik.js 的重构实践

大众点评 M 站承担将搜索引擎、社交渠道公域流量转化为 App DAU 的关键职责,原有技术栈由小程序 DSL 编译为 Vue 产物,首屏白屏时间长、弱网体验差且框架已停止维护。技术团队对比 Next.js、SvelteKit、Qwik 三种 SSR 方案后,选择 Qwik 的核心原因在于其「可恢复性(Resumability)」设计彻底跳过传统水合(Hydration)环节,首屏所需 JS 资源体积最小,天然适配弱网与低端机型。团队自研补齐缺失工具链,完成商户详情页、内容详情页等核心页面重构,首屏性能实现破局式提升。
美团技术团队 2026/06/04

LongCat 为 OpenClaw 装上效率引擎:自动化任务提速 30%

LongCat-Flash-Thinking-2601 接入开源本地 AI Agent 框架 OpenClaw(23万+ Stars),在 21 个可比任务中平均单任务耗时 2.35 分钟,比对比模型快约 30%。实测覆盖五类场景:Python 开发环境自动配置(2 分钟)、跨应用图片重绘与 iMessage 推送(3 分钟)、TGA 年度游戏信息网页生成(3 分钟)、GitHub 热榜定时推送(cron 自动触发)、模糊文件搜索与即时发送(32 秒)。文章同时提示 Google 和 Anthropic 已相继封禁或限制通过第三方工具的非官方 API 调用,建议开发者转用 LongCat 官方免费 API 以规避账号风险。
美团技术团队 2026/06/04

科技爱好者周刊(第 399 期):中国 AI 大厂访问记

今年5月,一个由科技分析师组成的美国访问团赴华,拜访了 DeepSeek、字节跳动、阿里、小米、宇树等14家 AI 与机器人公司。访问报告揭示:中国算力约为美国的八分之一,但凭借4-7倍的计算效率优势将差距压缩至数月;字节跳动 Seed 团队凭借豆包的流量垄断令同行敬畏;DeepSeek 专注底层架构获业内最高尊重;中国公司大量启用二十五六岁的博士实习生,享有完整权限参与核心研发;对于 AGI 风险,中国研究人员普遍不担忧,认为安全监管应交由政府处理。
阮一峰的网络日志 2026/06/05
未读 1 → 抓取 25 → 摘要 25 · 提取: readability 22 / browser-rendering 1 / rss 2