OpenAI前技术总监米拉·穆拉蒂携其新公司Thinking Machines重返舞台。周一,他们推出了一项名为交互模型的概念,允许用户通过持续处理音频、视频和文本,与AI进行实时协作。关键区别在于,这些系统像人类一样回应,无需等待你说完或写完。
持续交互新方法的工作原理 🤖
交互模型消除了当前系统的瓶颈,这些系统以离散方式处理输入,丢失实时上下文。Thinking Machines采用连续注意力架构,集成同步多模态流。这使得AI能够对语气变化、手势或打断做出反应,即时调整其回应。该技术基于经过修改的Transformer,以维持持续的上下文状态而无需重启。
现在AI也会在你说话时打断你 🗣️
终于有一款AI不会等你说完一句话才给出通用回应。现在,你可以与助手进行激烈讨论,它会在你话说到一半时打断你,告诉你错了。当然,至少你无需每次呼吸都重复上下文。与机器像对待你姐夫那样争论的梦想已成为现实。