Группа исследователей Apple представила ReALM (Reference Resolution as Language Modeling) – новую II-модель, которая направлена на радикальное улучшение понимания голосовых помощников и повышение реагирования на команды.
Компания говорит, что эта обширная языковая модель позволяет расшифровать неоднозначные ссылки в экранных объектах, а также справляется с пониманием разговорного и фонового контекста. ReALM может привести к более интуитивному и естественному взаимодействию с устройствами.
Под неоднозначными ссылками понимаются используемые пользователями местоимения и подобные элементы во время разговора.
Для голосовых помощников эта возможность была исторически серьезной проблемой. Система ReALM от Apple пытается ее решить, превращая сложный процесс интерпретации ссылок в задачи языкового моделирования.
ReALM реконструирует визуальный макет экрана, используя текстовые представления, включая анализ экранных объектов и их местонахождение для создания текстового формата, отображающего содержимое и структуру экрана. Исследователи Apple обнаружили, благодаря этой стратегии и специальной тонкой настройке языковых моделей значительно превосходит традиционные методы, включая применяемые в ChatGPT.
Новая II-система от Apple может позволить более эффективно взаимодействовать с цифровыми помощниками, опираясь на то, что сейчас отображается на экране, то есть не нужно будет говорить какие-либо уточняющие вещи. Это может сделать цифровых помощников более эффективно в различных ситуациях. Например, помогая водителям ориентироваться в медиасистемах авто во время вождения или помогая пользователям с ограниченными возможностями, предоставляя более простые и более точные средства косвенного взаимодействия. [MacRumors]
iPhones.ru
Группа исследователей Apple представила ReALM (Reference Resolution as Language Modeling) – новую II-модель, которая направлена на радикальное улучшение понимания голосовых помощников и повышение реагирования на команды. Компания говорит, что эта обширная языковая модель позволяет расшифровать неоднозначные ссылки в экранных объектах, а также справляется с пониманием разговорного и фонового контекста. ReALM может привести к более…
- До ←
watchOS 11 не будет поддерживать Apple Watch Series 4
- После →
iOS 17.5 позволяет загружать и устанавливать приложения на iPhone с сайтов разработчиков в ЕС