Как работают быстрые команды в умных колонках SberBoom.

Как работают быстрые команды в умных колонках SberBoom.

Как работают быстрые команды в умных колонках SberBoom и почему это удобно

Умные колонки SberBoom стали еще умнее и самостоятельнее. Теперь не обязательно звать ассистента по имени «Салют». Для простых действий достаточно одной фразы, как при общении с человеком. Рассказываем, как работают быстрые команды в умных колонках SberBoom и почему это удобно.

В привычном использовании умных колонок чтобы дать команду, нужно сначала активировать ассистента с помощью так называемого споттерного слова. Например, мы говорим колонке SberBoom «Салют, включи музыку», и она начинает слушать и выполнять команду.

Но произносить споттерное слово «Салют» перед каждой командой утомляет. Особенно для частых и простых запросов, где оно нередко кажется лишним. Чтобы решить эту проблему, разработчики придумали быстрые команды: они убирают необходимость говорить споттерное слово для самых частых сценариев.

Какие быстрые команды есть в умных колонках SberBoom

Теперь колонки SberBoom могут выполнить множество команд без споттерного слова. Это ускоряет взаимодействие с колонкой и экономит время. Так можно:

Управлять воспроизведением музыки — например, «следующий трек», «пауза», «выключи».

Настраивать громкость. Причем можно сказать не просто «громче», «тише», но и указать точное значение, например, «громкость 8», «громкость 50%».

Управлять через экран навигацией в умном телевизоре Sber или ТВ-приставке SberBox: «открой/нажми», «домой», «назад», «левее», «выше» и так далее.

Управлять умным домом. Включать и выключать умный свет, менять его цвет и яркость (например, «включи красный свет с яркостью 1%»). Управлять устройствами Sber и брендов-партнеров.

Включать и выключать Bluetooth.

Колонка понимает синонимы. Сказали «Назад!», «Предыдущий!» или «Прошлый!» — она выполнит одно и то же действие. Разработчики учли спам-команды — те, которые часто приходится говорить подряд не один раз. Например, «громче громче громче» — это спам-команды. Их теперь можно говорить с минимальными паузами. Это делает взаимодействие более естественным.

Как это работает: магия — внутри

Обычно, когда пользователь произносит споттерное слово, запрос передается в «облако» для расшифровки. Там речь автоматически распознается, текст обрабатывается, вызывается соответствующий навык или функция.

Главная особенность быстрых команд в SberBoom — это их локальная обработка, что стало возможным благодаря трем встроенным ML-моделям:

Модель распознавания речи, преобразующая голос в текст. Она не дожидается конца фразы, а начинает преобразовывать звук в текст сразу, как вы начали говорить.

Модель определения намерений, выделяющая команду и ее параметры. Анализирует поток текста от первой модели и определяет, чего именно хочет пользователь.

Модель предсказания конца команды, которая фиксирует момент, когда пользователь закончил говорить. Она решает, закончили вы говорить или просто сделали паузу, чтобы подумать. Как только она фиксирует «договорил», цепочка замыкается.

Поскольку обработка происходит локально, многие быстрые команды работают без подключения к Wi-Fi.