OpenAI花了65亿美元收购,要打造下一代AI计算机,挑战苹果?从人机交互聊起

最近用NotebookLM比较多,越来越觉得这种讨论式的播客,对信息的理解和接收,更有效,有种“听着听着就懂了”的感觉。

本期播客制作使用了几种数据来源:

- OpenAI收购io的报道

- XR输入的演变

futuretextlab.info/2025/04/22/ken-pfeuffer-19th-may

- HCI历史演进

要点概述:

Q:OpenAI收购io的目的是什么?

A: OpenAI斥资65亿美元收购io的目的是定义下一代AI计算机,抢占下一个iPhone时刻,打造AI时代的全新物种。奥特曼认为,尽管计算机已经能够看见、思考和理解,但当前的体验仍然受限于传统的屏幕产品和界面。AI需要一种全新的计算形态来发挥最大潜力,因此OpenAI与io合作,开发一款“超越屏幕”的AI设备,彻底革新人与AI的交互方式。这次收购也是为了开发、设计并制造一系列新的产品,需要一家全新的公司,并且io团队的加入,让OpenAI有足够的实力,敢于叫板苹果的硬件市场

Q:Jony Ive在苹果公司最著名的设计贡献是什么?

A: Jony Ive被认为是苹果的“设计灵魂人物” 和传奇设计师。他最著名的设计贡献包括iPhone、iPod、iPad和Apple Watch等标志性产品。他定义了如今智能手机的外观与体验。史蒂夫·乔布斯曾称他为“灵魂伙伴”。

Q:什么输入方式是XR未来发展的一个重要方向?

A: 在XR输入演变方面,研究表明将注视(gaze)与手势(gesture),特别是捏合(pinch)动作结合的交互方式,是未来发展的一个重要方向。这种组合方式能够继承直接输入和间接输入的特性,并且有望在手眼之间实现某种共生,提供新的控制电脑的方式。

这是Apple Vision Pro目前正在使用的一种方式。Apple Vision Pro(于 2024 年发布)的控制方式是用眼睛看,然后用手捏合进行选择和交互。这项技术,早在 2017 年就有相关的研究:凝视和捏合结合。

Q:在人机交互史中,哪一项创新至今仍在设计中广泛使用?

A: Brad Myers的“完成百分比”进度条是一项创新,至今仍是设计中的标准并被广泛使用。


Stuart Card等人的3D空间对数移动(3D spatial logarithmic movement)技术取得了突破性发展,并至今仍被广泛应用于改善用户导航体验。虚拟现实(VR)技术也在这一时期迅速发展。

Q:早期注视输入系统有什么特别之处?

A: Richard Bald在80年代初开发的早期注视输入系统特别之处在于,他认识到仅凭眼睛激活屏幕(比如看哪个屏幕哪个就活跃)是不可行的,因为人们会一直四处看。因此,他在系统中增加了一个手持的操纵杆(或装在椅子上),结合了手部控制,用于执行确认、缩放等操作。这可以说是早期意识到注视输入需要手部支持的尝试。

Q:注视与手势结合的交互方式有什么特点?

A: 与传统的鼠标或触摸屏输入相比,注视与手势(如捏合pinch)结合的交互方式是一个混合模式。它继承了间接输入设备(如鼠标)和直接输入设备(如触摸屏)的特性。这意味着它可以跨距离进行交互,像使用鼠标一样在远处选择目标,但同时也能像触摸屏一样立即进行操作和操纵。这种方式最大程度地减少了学习精力,对用户来说更具发现性。眼睛通常只用于锁定目标或开始手势的那一刻,之后主要由手进行控制,这有助于减少因眼睛移动带来的错误。它在某些方面几乎像直接输入设备一样快速

Q:目前,有哪些人机交互技术还未被大规模使用?

A: 目前,一些处于研究阶段或非常规的人机交互技术还未被大规模使用,例如:

  • 脑机接口(Brain-Computer Interfaces)
  • 完全没有实体设备、仅依赖身体和环境进行交互的理念(如“Dynamic Land”)
  • 眼动追踪大规模集成到智能手机等普遍设备中,实现手眼协同的交互。

  • 利用眉毛动作、嘴唇动作等身体微表情或非传统姿势作为额外的控制方式,这仍在探索阶段,并且存在假阳性问题。

许多现代技术概念在很久以前就已经出现,但可能由于技术限制、成本或当时的环境不成熟而未被广泛采用。历史研究有助于理解当前技术的基础和演变。

欢迎加入社群

加入mixlab社群

AI编程学员分享:先问AI,再看AI的理解范围,再次优化提问方式。各种手段用于清晰描述问题(什么条件,在哪里,发生了什么)

你可能感兴趣的:(人工智能,人机交互)