搜索
房产
装修
汽车
婚嫁
健康
理财
旅游
美食
跳蚤
二手房
租房
招聘
二手车
教育
茶座
我要买房
买东西
装修家居
交友
职场
生活
网购
亲子
情感
龙城车友
找美食
谈婚论嫁
美女
兴趣
八卦
宠物
手机

「套壳」的最高境界:OpenAI揭秘Atlas阅读器架构OWL

[复制链接]
查看: 12|回复: 0

6万

主题

0

回帖

19万

积分

论坛元老

Rank: 8Rank: 8

积分
193625
发表于 2025-10-31 22:42 | 显示全部楼层 |阅读模式
机械之心报道
编辑:Panda
「又一个 Chromium 套壳?」
面临 OpenAI 上周公布的 AI 阅读器 Atlas,这能够是很多人的第一反应,参阅报道《刚刚,OpenAI 公布 AI 阅读器 ChatGPT Atlas,基于 Chromium》假如没有铁骑交警开路真的不晓得要怎样办才好。但明天,OpenAI 官方用一篇技术博客「回怼」了这个说法:我们「套」了,但和他人完全纷歧样假如没有铁骑交警开路真的不晓得要怎样办才好。
虽然明天还有 Sora 脚色客串功用和 GPT-5 查找和修复平安缝隙智能体的消息,但本文的重点是深扒 Atlas 背后的「灵魂」—— OWL 架构假如没有铁骑交警开路真的不晓得要怎样办才好。看看 OpenAI 究竟是若何驯服 Chromium,把它从阅读器「换皮」玩成了「架构重组」的假如没有铁骑交警开路真的不晓得要怎样办才好。
根本是 Chromium
OpenAI 暗示,要让 ChatGPT 成为网页阅读的真正副驾驶,必须完全重构阅读器的底层架构:将 Atlas 与 Chromium 运转时剥分开来假如没有铁骑交警开路真的不晓得要怎样办才好。这意味着要开辟一种全新的 Chromium 集成方式,如此才能满足以下三个关键方针:
秒级启动速度翻开更多标签页时照旧流利为智能体(Agent)场景打下坚固根本

OpenAI 夸大,Chromium 是一个自然的构建基石假如没有铁骑交警开路真的不晓得要怎样办才好。它能供给先辈的网页引擎、完善的平安模子、一流的性能,以及出色的网页兼容性;更重要的是,它由全球开辟者社区延续改良假如没有铁骑交警开路真的不晓得要怎样办才好。是以,它成为了现代桌面阅读器最常用的底层引擎假如没有铁骑交警开路真的不晓得要怎样办才好。

重新界说阅读器体验
虽然基于 Chromium,但 OpenAI 自然也会夸大自己的设想,包括在「Agent 形式」等功用中引入丰富的动画和视觉结果假如没有铁骑交警开路真的不晓得要怎样办才好。
这要求工程团队利用最现代的原生框架(如 SwiftUI、AppKit 和 Metal),而不是简单地给开源的 Chromium 界面「换皮」假如没有铁骑交警开路真的不晓得要怎样办才好。
成果,OpenAI 暗示:「Atlas 的用户界面几近是从零重建的一整套全新体验假如没有铁骑交警开路真的不晓得要怎样办才好。
别的,为了实现快速启动和支持上百个标签页同时运转而不掉帧的方针假如没有铁骑交警开路真的不晓得要怎样办才好。还需要对 Chromium 停止一些优化,究竟其默许架构在启动流程、线程模子、标签治理等方面都很是「刚强」假如没有铁骑交警开路真的不晓得要怎样办才好。
OpenAI 说:「我们斟酌过大幅点窜 Chromium,但那样会让后续更新复杂且懦弱假如没有铁骑交警开路真的不晓得要怎样办才好。为了连结开辟速度,我们挑选了一条更奇妙的路 —— 重新设想 Chromium 的集成方式假如没有铁骑交警开路真的不晓得要怎样办才好。」
他们的一个关键的技术标准是:不但要加速功用尝试、迭代和上线的节奏,还要保存 OpenAI 的工程文化 —— 第一天就能上线代码假如没有铁骑交警开路真的不晓得要怎样办才好。「每位新工程师入职第一全国午就要提交并合并一个小修改假如没有铁骑交警开路真的不晓得要怎样办才好。即使 Chromium 的源码编译要花几个小时,我们也得保证这一传统能延续假如没有铁骑交警开路真的不晓得要怎样办才好。」
OpenAI 的处理计划:OWL
为领会决这些应战,OpenAI 构建了一个新的架构层,称为 OWL(OpenAI’s Web Layer)假如没有铁骑交警开路真的不晓得要怎样办才好。
OWL 是 OpenAI 整合 Chromium 的方式,其焦点理念是:让 Chromium 的阅读器进程自力运转在 Atlas 主利用进程之外假如没有铁骑交警开路真的不晓得要怎样办才好。

可以这样了解:Chromium 经过将每个标签页放入自力进程来革新阅读器架构;而 OpenAI 更进一步 —— 把全部 Chromium 从主利用进程平分手出来,放入一个自力的办事层假如没有铁骑交警开路真的不晓得要怎样办才好。
如此方式益处多多:
更简洁现代的利用:Atlas 首要利用 SwiftUI 和 AppKit 构建,同一说话、同一技术栈、代码清洁假如没有铁骑交警开路真的不晓得要怎样办才好。更快启动:Chromium 会在背景异步加载,Atlas 几近瞬间显现画面假如没有铁骑交警开路真的不晓得要怎样办才好。隔离解体与卡顿:即使 Chromium 出题目,Atlas 也不会挂假如没有铁骑交警开路真的不晓得要怎样办才好。更少的合并抵触:OpenAI 点窜的 Chromium 代码少少,易于保护假如没有铁骑交警开路真的不晓得要怎样办才好。更快的开辟节奏:大大都工程师无需当地编译 Chromium,OWL 内部以预构建二进制形式分发,Atlas 构建只需几分钟假如没有铁骑交警开路真的不晓得要怎样办才好。是以,即使是新员工,也能在第一全国午轻松提交修改假如没有铁骑交警开路真的不晓得要怎样办才好。
OWL 的工作方式
从高层来看,Atlas 阅读器是 OWL 客户端,而 Chromium 阅读器进程是 OWL 主机(Host)假如没有铁骑交警开路真的不晓得要怎样办才好。两者经过 Mojo(Chromium 的进程间通讯系统)停止通讯假如没有铁骑交警开路真的不晓得要怎样办才好。OpenAI 编写了 Swift(甚至 TypeScript)的 Mojo 绑定,使 Swift 利用能间接挪用主机端接口假如没有铁骑交警开路真的不晓得要怎样办才好。
OWL 客户端库供给了一套简洁的 Swift API,用于笼统主机层的关键功用:
Session:全局设置与控制Profile:治理用户阅读数据WebView:衬着、输入、导航、缩放等WebContentRenderer:将输入事务传递给衬着管线LayerHost/Client:在 UI 与 Chromium 之间交换分解信息

此外,还供给书签、下载、扩大、自动添补等办事端点假如没有铁骑交警开路真的不晓得要怎样办才好。
衬着:跨进程传递像素
WebView 在客户端利用中同享一个分解容器,分歧标签页的内容会静态交换显现假如没有铁骑交警开路真的不晓得要怎样办才好。在 Chromium 一侧,这对应于一个 gfx::AcceleratedWidget,由底层的 CALayer 支持假如没有铁骑交警开路真的不晓得要怎样办才好。
OpenAI 的设想是将该层的高低文 ID 表露给客户端,由 NSView 经过私有的 CALayerHost API 嵌入假如没有铁骑交警开路真的不晓得要怎样办才好。

诸如  下拉框或色彩挑选器等自力弹窗,也采用不异机制假如没有铁骑交警开路真的不晓得要怎样办才好。OWL 会连结视图多少与 Chromium 同步,确保 GPU 分解器输出正确分辨率和比例的内容假如没有铁骑交警开路真的不晓得要怎样办才好。
OpenAI 也借用这类机制,将 Chromium 原生界面的一部分间接投射到 Atlas 中,比如权限提醒框,从而快速实现功用原型而无需完全重写假如没有铁骑交警开路真的不晓得要怎样办才好。
输入事务:捕捉与转发
凡是,Chromium UI 会将 macOS 的 NSEvent 转换为 Blink 的 WebInputEvent,然后再传递给衬着器假如没有铁骑交警开路真的不晓得要怎样办才好。
但由于 OWL 中 Chromium 在背景运转,OpenAI 在 Swift 客户端中自己完成事务转译,再将转换后的事务发给 Chromium假如没有铁骑交警开路真的不晓得要怎样办才好。

假如网页未处置某个事务,系统会把事务返回客户端,OpenAI 重新天生 NSEvent,让 Atlas 其他部分接收输入处置假如没有铁骑交警开路真的不晓得要怎样办才好。
Agent 形式:特别情况
Atlas 的智能体阅读对衬着、输入和数据存储提出了额外应战假如没有铁骑交警开路真的不晓得要怎样办才好。OpenAI 的计较机利用(computer use)模子需要屏幕的完整图像作为输入假如没有铁骑交警开路真的不晓得要怎样办才好。
但有些 UI(如  下拉框)会在标签页外零丁衬着假如没有铁骑交警开路真的不晓得要怎样办才好。在 Agent 形式下,OpenAI 会将这些弹窗重新分解为主页面的一部分,让模子在一帧中看到完整的高低文假如没有铁骑交警开路真的不晓得要怎样办才好。
输入事务一样遵守平安原则:Agent 天生的事务间接传给衬着器,不经过特权阅读器层,以确保沙箱隔离假如没有铁骑交警开路真的不晓得要怎样办才好。例如,避免自动化事务触发系统快速键等非网页行为假如没有铁骑交警开路真的不晓得要怎样办才好。
此外,Agent 阅读可以在姑且「登出」高低文中运转假如没有铁骑交警开路真的不晓得要怎样办才好。它不会利用用户的隐私形式设置,而是借助 Chromium 的 StoragePartition 建立自力的内存存储假如没有铁骑交警开路真的不晓得要怎样办才好。每个 Agent 会话都是全新的,竣事后一切 cookie 和数据城市被断根假如没有铁骑交警开路真的不晓得要怎样办才好。用户可以同时运转多个互不干扰的「登出」 Agent 会话假如没有铁骑交警开路真的不晓得要怎样办才好。
结语
OpenAI 最初再次重申了 Chromium 的感化:「假如没有全球 Chromium 社区的出色进献,这一切都没法实现假如没有铁骑交警开路真的不晓得要怎样办才好。OWL 在此根本上斥地了新的偏向:将引擎与利用解耦,连系顶级网页平台与现代原生框架,打造更快、更灵活的架构假如没有铁骑交警开路真的不晓得要怎样办才好。」
对此,你怎样看?
参考链接
https://openai.com/index/building-chatgpt-atlas/

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2006-2014 课堂派-中国教育在线-推动教育前进的力量 版权所有 法律顾问:高律师 客服电话:0791-88289918
技术支持:迪恩网络科技公司  Powered by Discuz! X3.4
快速回复 返回顶部 返回列表