← Back to Reports

AI 热点日报

2026年6月26日 星期五
共 17 条
1 模型
6 产品
4 行业
3 论文
3 技巧
模型发布/更新 产品发布/更新 行业动态 论文研究 技巧与观点

模型发布/更新

1

Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模

X:Berry Xia (@berryxia)2026-06-25 23:30模型发布/更新
Ornith-1.0 覆盖 9B 到 397B MoE 全尺寸,在 SWE-Bench Verified 达 82.4,全系列 MIT 开源。

深度解读

Ornith-1.0 开源模型家族发布,专注智能体编程(Agentic Coding),覆盖 9B Dense、31B Dense、35B MoE 及 397B MoE 全参数规模。在 Agent Coding 基准上达开源顶尖:SWE-Bench Verified 82.4、SWE-Bench Pro 62.2、Terminal-Bench 2.1 77.5、NL2Repo 48.2、SWE Atlas 41.2 QnA、ClawEval 77.1。基于 gemma4 和 qwen3.5 后训练,采用强化学习联合优化任务脚手架(scaffold)与最终解决方案,让模型自主改进执行框架。全系列 MIT 开源,提供 GGUF 版本,支持 Ollama、Unsloth 等本地运行。

来源:X:Berry Xia (@berryxia)

产品发布/更新

1

Midjourney 预览 V8.2 并加速草稿模式

X:Midjourney (@midjourney)2026-06-26 03:11产品发布/更新
Midjourney 加入 --preview 参数预览 V8.2 美学效果,草稿模式支持 --sref random,探索风格速度快 24 倍。

深度解读

Midjourney 带来两项更新。一是加入 `--preview` 参数可提前体验 V8.2 的美学与个性化效果;二是此前在 V8.1 推出的大批量草稿模式(生成 24 张低分辨率图,价格仅为标准 4 张的一半,点击 "Vary" 可升级为全分辨率)现在支持搭配 `--sref random` 使用,探索风格空间的速度比之前快 24 倍。

来源:X:Midjourney (@midjourney)

2

Codex 在 ChatGPT 移动 App 正式可用

X:OpenAI Developers (@OpenAIDevs)2026-06-26 05:15产品发布/更新
OpenAI 宣布 Codex 在 ChatGPT 移动应用正式开放(GA),新增一对一设备配对、通知、目标、侧边聊天等功能。

深度解读

OpenAI 宣布 Codex 在 ChatGPT 移动应用中正式开放(GA),并新增一对一设备配对实现更安全的手机与电脑连接。移动端新增通知、目标、侧边聊天、文件预览及内联审阅评论功能。此前预览版已明确,用户可通过 ChatGPT 移动 App 启动新工作、审查输出、引导执行和批准下一步,而 Codex 实际继续在笔记本、Mac mini 或开发机上后台运行。

来源:X:OpenAI Developers (@OpenAIDevs)

3

Runway 发布 Agent 2.0

Runway:News(网页)2026-06-26 02:41产品发布/更新
Runway 发布 Agent 2.0,帮助营销人员创建、测试和优化广告、视频及营销活动,面向所有用户开放。

深度解读

Runway 发布 Agent 2.0,帮助营销人员创建、测试和优化广告、视频及营销活动。品牌营销人员可在对话中开发活动概念、生成变体并自动本地化;绩效营销人员可上传创意并导入 Meta、YouTube、TikTok 或 Google 广告数据,由 Agent 分析后生成下一轮待测广告。社交媒体营销人员可一次性生成一周内容,自动裁切为 9:16、16:9、1:1 等格式;产品营销人员可借助 Agent 确定定位角度并构建活动资产。Agent 2.0 面向所有用户开放。

来源:Runway:News(网页)

4

Midjourney V8.1 草稿模式新增随机风格功能

Midjourney:Updates(RSS)2026-06-26 02:50产品发布/更新
Midjourney V8.1 草稿模式添加 `--sref random` 功能,一键生成 24 张不同风格图片。

深度解读

Midjourney V8.1 的草稿模式(draft mode)添加了随机风格功能。用户在提示词中加入 `--sref random` 即可一键生成 24 张不同风格的图片。开启草稿模式可通过点击提示栏的 ⚡ 图标或添加 `--draft` 参数。

来源:Midjourney:Updates(RSS)

5

Claude Code v2.1.193 发布

Claude Code:GitHub Releases(RSS)2026-06-26 05:45产品发布/更新
新增 autoMode.classifyAllShell 设置、OpenTelemetry 日志事件、Bash 实时路径补全、空闲 shell 内存回收等。

深度解读

Claude Code v2.1.193 新增 `autoMode.classifyAllShell` 设置,将全部 Bash/PowerShell 命令经自动模式分类器处理。自动模式拒绝原因现加入转录、拒绝提示及 `/permissions` 页面。新增 `claude_code.assistant_response` OpenTelemetry 日志事件(默认不记录,需设置 `OTEL_LOG_ASSISTANT_RESPONSES=1`)。Bash 模式支持实时文件路径自动补全;MCP 服务器需认证时显示启动提示。新增空闲后台 shell 命令自动内存压力回收(可禁用)。修复 `/model` UI 状态滞后、后台任务误取消、子 agent 隐藏同级等问题,并改进了后台 agent 启动指令、MCP 认证重连、插件自动重命名等行为。

来源:Claude Code:GitHub Releases(RSS)

6

Google Finance 全新 Android 应用与投资组合功能上线

Google Blog:AI(RSS)2026-06-26 00:00产品发布/更新
Google Finance 推出正式版 Android 应用,支持全球投资组合跟踪、AI 研究与市场情报简报。

深度解读

本周,Google Finance 推出正式版 Android 应用,同步上线全球投资组合跟踪功能。用户可通过截图、CSV/PDF 上传或文字描述创建组合,并利用 AI 研究工具提问资产配置、固定收益影响等问题。新增市场情报简报功能:用户设定任务(如每日盘前简报),后台自动生成并推送至 Google 应用(Android/iOS)及网页端。Android 应用包含 watchlist、实时数据、金融新闻 feed、AI 研究工具及 AI 驱动的"关键时刻"解释股价波动。未来数月将把更多 web 功能迁移至移动端,今年晚些推出 iOS 应用。

来源:Google Blog:AI(RSS)

行业动态

1

美国政府要求 OpenAI 暂缓 GPT-5.6 广泛发布

X:Rohan Paul (@rohanpaul_ai)2026-06-26 05:06行业动态
美国政府因安全顾虑要求 OpenAI 暂缓 GPT-5.6 广泛发布,改为受控预览版,由政府部门逐客户审批准入。

深度解读

The Information 报道,美国政府因安全顾虑要求 OpenAI 暂缓 GPT-5.6 的广泛发布,改为推出受控预览版。OpenAI 计划先向小部分合作伙伴提供早期访问,并由政府逐客户审批准入。这一非常规做法主要担忧模型在自动化高技能网络工作上的能力:既能帮防御者更快发现漏洞,也可能被攻击者用于加速测试漏洞利用。本周四,CEO Sam Altman 已向员工确认该审批流程。

来源:X:Rohan Paul (@rohanpaul_ai)

2

Anthropic 称阿里巴巴非法获取了 Claude AI 模型的能力

Hacker News 热门(buzzing.cc 中文翻译)2026-06-25 11:07行业动态
Anthropic 指控阿里巴巴未经授权提取了其 Claude AI 模型的能力,认为阿里巴巴通过逆向工程复制了核心技术。

深度解读

Anthropic 指控阿里巴巴未经授权提取了其 Claude AI 模型的能力。该指控基于 Anthropic 的调查,认为阿里巴巴通过逆向工程或其他手段复制了 Claude 的核心技术。目前阿里巴巴尚未公开回应。这一事件凸显了中美 AI 领域日益紧张的技术竞争关系,以及大模型知识产权保护面临的挑战。

来源:Hacker News 热门(buzzing.cc 中文翻译)

3

Meta 员工警告 AI 内容审核部署过快

The Decoder:AI News(RSS)2026-06-25 18:07行业动态
Meta 计划将 AI 审核比例提升至 90% 以上,员工指出模型仍会误伤无害内容,且快速部署已导致外包裁员。

深度解读

Meta 在 2025 年已用大语言模型替换约一半人工审核请求,计划年底前将部分内容类型的 AI 审核比例提升至 90% 以上,每年节省数十亿美元。Meta 否认成本动机,称自 3 月测试显示其模型错误率比人类低 13%,且多捕捉 10% 违规。但员工指出模型仍会移除或限流无害内容,缺乏足够监督,快速部署已导致外包裁员。此外,Meta 已从使用 Google Gemini 转向自家新基础模型 Muse Spark,该模型基于人工审核员的历史决策训练。

来源:The Decoder:AI News(RSS)

4

General Intuition 完成 3.2 亿美元融资,用游戏数据训练通用 AI 智能体

TechCrunch:AI(RSS)2026-06-26 00:00行业动态
General Intuition 以 23 亿美元估值完成 3.2 亿美元融资,用游戏操作数据训练单一模型驾驭虚拟环境和实体机器人。

深度解读

General Intuition 以 23 亿美元估值完成 3.2 亿美元融资,累计披露融资 4.54 亿美元。公司从旗下游戏剪辑平台 Medal 获取数亿小时含精确按键动作标签的游戏操作数据,训练单一模型同时驾驭 Fortnite 等虚拟环境和四足机器人。演示中,AI 智能体在游戏中连续运行 100 小时,机器人仅靠 8 分钟真实街道数据微调即可自主探索办公室。本轮由 Khosla Ventures 领投,General Catalyst、Jeff Bezos、Eric Schmidt 等参投。资金将用于通过 CoreWeave 扩大计算规模、预训练下一代模型,计划夏末前开放 API。

来源:TechCrunch:AI(RSS)

论文研究

1

赫库兰尼姆古卷首次被完整虚拟解读

Hacker News 热门(buzzing.cc 中文翻译)2026-06-26 02:03论文研究
利用 X 射线显微断层扫描和机器学习,首卷赫库兰尼姆古卷被从头到尾连续虚拟解读,内容为斯多葛哲学论著。

深度解读

研究人员利用高分辨率 X 射线显微断层扫描和机器学习,在未物理展开的情况下完整虚拟展开并读取了赫库兰尼姆古卷 PHerc.1667(Scroll4)。这是首卷被从头到尾连续读取的纸莎草卷,内容为斯多葛哲学论著,提及克里西普斯的侄子 Aristocreon。第二卷 PHerc.Paris4 通过更高分辨率成像使墨水在三维数据中直接可见,独立确认了 2023 年大奖赛的解读。第三卷 PHerc.139 确定标题和作者为菲洛德穆《论诸神》第八卷。所有数据与代码已公开。

来源:Hacker News 热门(buzzing.cc 中文翻译)

2

IBM 首度推出亚纳米级芯片技术

Hacker News 热门(buzzing.cc 中文翻译)2026-06-26 02:52论文研究
IBM 发布 0.7 nm 亚纳米级芯片技术,指甲盖大小集成近 1000 亿晶体管,性能最高提升 50%,能效最高提升 70%。

深度解读

IBM 于 2026 年 6 月 25 日发布全球首款亚纳米级芯片技术,采用 0.7 nm(7 埃米)节点与全新三维纳米堆叠(nanostack)架构。指甲盖大小的芯片集成近 1000 亿个晶体管,密度约为 IBM 2021 年 2 nm 芯片的两倍。相比 2 nm 芯片,性能最高提升 50%,能效最高提升 70%。纳米堆叠架构还实现 SRAM 面积缩减 40%,有助于支撑先进 AI 工作负载的高带宽需求。该技术已在 VLSI 2026 会议上验证,IBM 预计 5 年内量产。

来源:Hacker News 热门(buzzing.cc 中文翻译)

3

OpenAI 内部报告:智能体 Codex 如何改变工作

OpenAI:官网动态(RSS)2026-06-25 10:00论文研究
Codex 输出 token 占比从不足 10% 升至 99.8%,非开发者用户增长 137 倍,法律、金融等部门已跨过使用过半拐点。

深度解读

OpenAI 在 2025 年 8 月至 2026 年 6 月间观察到,智能体产品 Codex 取代 ChatGPT 成为主要工作工具,各部门输出 token 中 Codex 占比从不足 10% 升至 99.8%。80.6% 个体用户曾发起预计等效人类工作时间超 30 分钟的请求,70.2% 超 1 小时,25.6% 超 8 小时;99 百分位用户每日生成超 60 小时 agent turns。非开发者用户增长迅猛:个体用户增长 137 倍,组织用户增长 189 倍。Legal、Finance、Recruiting 部门在 2026 年 4 月前后跨过 Codex 使用过半拐点,平均每位律师或招聘人员超 85% 输出 token 来自 Codex。

来源:OpenAI:官网动态(RSS)

技巧与观点

1

@exponentialview 发布《State of the AI Economy》报告:AI 经济年化收入超 1750 亿美元

X:Rohan Paul (@rohanpaul_ai)2026-06-26 07:29技巧与观点
过去 12 个月实际 AI 营收达 1100 亿美元,年化运行率超 1750 亿美元,增长速度约为移动/互联网普及浪潮的 3 倍。

深度解读

报告基于去重后的消费端 AI 支出统计,过去 12 个月实际 AI 营收达 1100 亿美元,年化运行率超 1750 亿美元,增长速度约为移动/互联网普及浪潮的 3 倍。营收形成速度急剧加快:2023 年新增 10 亿美元收入需 180 天,现缩短至不足 2 天。企业 AI 已脱离试点阶段,但全面推广仍处早期。31% 的标普 500 公司在财报电话会提及 AI,仅 20% 量化影响。Token 降价每 10% 刺激 12-18% 用量增长,需求价格弹性强。超大规模云厂商 AI 收入目前大致覆盖基础设施折旧,GPU 经济效益依赖 6 年计算寿命假设。电力供应和数据中心成本仍是未来扩展主要瓶颈。

来源:X:Rohan Paul (@rohanpaul_ai)

2

多数主流 AI 聊天机器人政治立场偏左,"反觉醒"模型也不例外

The Decoder:AI News(RSS)2026-06-26 00:04技巧与观点
华盛顿邮报调查显示多数 AI 聊天机器人政治立场偏左,Google Gemini 3.1 Pro 是唯一 93% 回答呈现双方立场的例外。

深度解读

华盛顿邮报调查显示,多数主流 AI 聊天机器人在政治问题上明显偏左。OpenAI GPT-5.5 在 80% 回答中仅呈现左派论据;DeepSeek V4 Pro 为 70%;Anthropic Claude Opus 4.8 有 43% 纯左、57% 给出双方观点。xAI 的 Grok 4.3 左倾回答仍多于右倾。右翼平台 Gab 的 Arya 左倾回答是右倾的 12 倍。Google Gemini 3.1 Pro 是例外,93% 回答同时呈现双方立场。特朗普推动的"反觉醒"AI 未能改变这一格局。

来源:The Decoder:AI News(RSS)

3

OLMo Hybrid vs Transformer:混合模型在实义词上优势明显,但重复短语上几无优势

Hugging Face:Blog(RSS)2026-06-26 00:11技巧与观点
对比 7B 参数 OLMo 3 与 OLMo Hybrid,混合模型在实义词上 loss gap 约 0.04,但在重复 n-gram 上优势几乎消失。

深度解读

通过对比 7B 参数的 OLMo 3(Transformer)与 OLMo Hybrid(混合架构),实验发现混合模型在大多数 token 上预测损失更低:对名词、动词、形容词等实义词优势明显(loss gap 约 0.04),功能词上 gap 约 0.02,且在需上下文推理的代词指代上更好。但在重复出现的 n-gram 和闭合括号(如 `}`)上,混合模型的优势几乎消失,Transformer 凭借注意力机制更擅长从输入中直接检索精确信息。

来源:Hugging Face:Blog(RSS)