Сделай крутой поворот сделай алиса
Топовые фишки Яндекс.Станции, о которых вы могли не знать
Иногда кажется, что об Алисе и Яндекс.Станции мы знаем уже всё. Но разработчики постоянно развивают это устройство и сам голосовой помощник, а до некоторых фишек руки так и не доходят. Так вышло и со мной прошлым вечером: мне стало интересно, что умеет Алиса в Яндекс.Станции такого, о чем я не знал. Оказалось, что голосовой ассистент достаточно умён и всеяден. Меня настолько затянули всеовозможные навыки, что я закончил общаться с искусственным интеллектом около полуночи. Проснувшись, я понял, что просто необходимо рассказать вам о классных фишках и навыках, о которых вы, возможно, позабыли или вовсе не знали.
Рассказываем о навыках Яндекс.Станции, о которых вы могли не знать
Настроить Утреннее шоу Алиса
В последнее время я отказался от соцсетей и почти не читаю новостей о том, что происходит в мире, не считая спорта. Да и знать все подряд тоже не хочется. В этом меня выручает Яндекс.Станция: с утра я прошу Алису включить навык Утреннее шоу. Но от эфира радиостанции ее отличает возможность настройки под себя. Во-первых, будет играть только та музыка, которая нравится вам. Во-вторых, в настройках приложения Яндекс вы можете выбрать желаемые источники новостей и интересующие вас темы.
Настройте Утреннее шоу для себя: выберите источники новостей, подкасты и даже гороскоп
В списке включите темы, которые вам хочется услышать. Среди них можно найти даже короткие подкасты. В навыках для шоу я включил для себя «Цитату дня» и «Комплимент дня» — подкат от Алисы засчитан!
Яндекс.Станция уведомления
Не все знают, но на вашу Яндекс.Станцию могут приходить полезные уведомления о новых сериалах на Кинопоиске, музыкальных новинках и выпусках подкастов, на которые вы подписаны. Включить их очень просто.
Если колонка мигает зеленым, значит, вам пришло новое уведомление
Когда на колонку поступит уведомление, прозвучит короткий звуковой сигнал, а сама колонка начнет мигать зеленым. Просто скажите «Алиса, что нового?» — она зачитает вслух эти уведомления и даже расскажет, что нового появилось в ней.
Какой сериал посмотреть
Яндекс.Станция поможет выбрать похожий сериал взамен того, что вы уже посмотрели
Согласитесь, когда заканчивается сериал, есть ощущение пустоты и кажется, что жизнь уже не будет прежней без былого сюжета. Ничего страшного! Просто скажите колонке «Алиса, запусти навык «Подбор сериала». Вам нужно будет сказать название любимого сериала, а голосовой помощник предложит вам несколько аналогичных вариантов, схожих по сюжету. Например, для фанатов «Блудливой Калифорнии» Алиса предлагает сериал «Антураж» и «Футболисты». В яблочко!
Еще больше статей о голосовых ассистентах и умных колонках в нашем Яндекс.Дзен! Не забудьте подписаться!
Краткий пересказ книги
Читать полезно, но иногда жизненно необходимо быстро узнать краткое содержание
Если бы Алиса существовала в мои школьные годы, то я бы сэкономил кучу времени! Вы знали, что голосовой ассистент имеет навык «Умный пересказ»? В ней доступны две категории: Лучшее и книги школьной программы. Для этого вам необходимо сказать «Алиса, запусти умный пересказ» и далее выбрать категорию. Я, например, с удовольствием ознакомился с содержанием нескольких книг из школьной программы, которые читал очень давно.
Как отправить сообщение на электронную почту
Иногда вставать с рабочего места бывает лень — в некоторых делах мне помогает Яндекс.Станция. Точнее, навык «Говорящая почта». Это удобный способ отправить сообщение в прямом смысле без рук. Для этого скажите колонке «Алиса, запусти навык Говорящая почта»: запомните свой идентификатор и отправляйте сообщение другому пользователю.
Послушать войс можно на смартфоне, компьютере или колонке. Еще вы можете познакомиться с кем-либо, отправив голосовое сообщение на специальный номер — об этом Алиса подробно рассказывает при запуске навыка.
Куда жаловаться на управляющую компанию
Пожаловаться на работу местных служб можно с помощью Яндекс.Станции
То, что у Алисы есть навык, позволяющий пожаловаться на социально-бытовые проблемы — настоящее открытие для меня. Запустите навык «Инцидент менеджмент» и далее следуйте инструкциям. Алиса направит жалобу на дороги, благоустройство или здравоохранение в местный орган власти, отвечающий за ее решение.
Как посчитать калории для себя
Не знаете, сколько калорий в пище? Скажите Алисе: она посчитает все за вас и даже подскажет меню на следующий день
Яндекс.Станция — хороший помощник для тех, кто следит за своей фигурой. Скажите Алисе «Попроси умный счетчик калорий записать» и уточните блюдо. В ответ ассистент вам расскажет о содержании белков, жиров и углеводов в пище. Если фиксировать с помощью Алисы съеденное за день, то вечером она сообщит, сколько калорий вы употребили за день и даже рассчитает меню на следующий день. Алиса точно знает названия блюд и подскажет, что употреблять из напитков.
Остались вопросы по статье? Задать их можете в нашем Telegram-чате!
Как начать тренироваться дома
Тренажерный зал — это круто, но кто сказал, что тренировки дома чем-то хуже? Скажите: «Алиса, запусти навык фитнес-наставник«. Голосовой помощник заменит вам тренера: Алиса расскажет, как сделать упражнение, включит музыку и посчитает примерное количество сожженных калорий.
А какие классные навыки Алисы знаете вы?
Новости, статьи и анонсы публикаций
Свободное общение и обсуждение материалов
Сегодня в мире с развитыми IT-технологиями мессенджеры – это самое популярное средство общения. Конечно, по-прежнему используются и электронная почта, и телефонные звонки, но больше ситуативно или с конкретными целями, например, рабочими. А весь ежедневный поток коммуникации людей в развитых странах с широко распространенным интернетом приходится на мессенджеры.
Яндекс Алиса — твой голосовой помощник
Встречайте Алису! — Это наш русский голосовой помощник от компании Яндекс и сейчас мы расскажем что это за такой бот-ассистент и для чего он нужен.
Какие полезные функции умеет выполнять Алиса, чему она обучается, как установить её, настроить и правильно пользоваться.
Поехали!
Описание и история создания Алисы:
История Алисы начинается в с мая 2017, тогда голосовой помощник Алиса появился в бета-версии.
Официально Алиса была запущена 10 октября 2017.
Видео с анонсом Алисы загружено 9 октября 2017 — https://www.youtube.com/watch?time_continue=6&=&v=Tlq-FtxaUIM
На его вопрос «Тебя здесь не обижают?» «Алиса» ответила «О’кей, учту», после чего сотрудник «Яндекса» сформулировал близкий по смыслу вопрос, на что голосовой помощник ответила «Сегодня я рассматривала в Яндексе фото котиков и ничего лучше не видела. Надеюсь, что и у вас всё хорошо!»
Имя «Алиса» было выбрано пользователями интернет. В качестве 2-го варианта рассматривалось имя «Майя», но от него отказались из-за созвучности с названием месяца.
Возможности Яндекс Алисы:
Да, она умеет много и постоянно развивается и самообучается, так как Алиса – этой нейросеть.
Если Вам понравилось видео — поделись с друзьями:
Основные функции Алисы:
Ну и просто общение – можно общаться с Алисой на любые темы (ну почти на любые 😁). С каждым днём Алиса становится умнее и умнее.
Как работать с Алисой:
Достаточно сказать «Слушай, Алиса» и она сразу активируется.
Причём эта команда работает для всех устройств, в которые встроена Алиса – яндекс бразуер на компьютере, смартфоне, яндекс станции и др.
И теперь можно просить Алису выполнить любую функцию, которая она умеет. Или можно просто поболтать с ней.
Скачать и установить Алису
Важно: Алиса не существует как отдельная программа, она встроена в приложения Яндекса и отдельные физические вещи, например, в Яндекс Станцию.
Поэтому, чтобы скачать Алису для ПК, нужно скачивать Яндекс Браузер (Алиса в него интегрирована из коробки), а если нужна Алиса для смартфона — нужно скачивать приложение с Алисой.
💻 Алиса для компьютера:
Заходим на официальный сайт Яндекс.Браузера — https://browser.yandex.ru и скачиваем его.
Подробный обзор установки и настройки Алисы для ПК:
📱 Алиса для телефона:
Подробный обзор установки и настройки Алисы для телефонов:
Будущее Алисы и её развитие:
13 марта 2018 года Яндекс открыл платформу Алисы для всех — https://tech.yandex.ru/dialogs/alice/doc/about-docpage/
Теперь любой желающий сможет обучить Алису новым навыкам и с её помощью привлечь пользователей к своим проектам.
Исходя из динамики развития иностранных голосовых помощников Siri, Alex, Cortana – Алису ждёт светлое будущее:
Алиса будет появляться в большем количестве устройств (Яндекс Станция, Яндекс Станция Мини, детские часы Elari KidPhone 3G, беспроводная колонка Elari SmartBeat и Sony Xperia Ear Duo и другие).
Яндекс уже выпустил свой Яндекс Телефон, в котором встроена Алиса и работает она прямо с заблокированного экрана!
Ну и Алиса уже умеет управлять умным домом на русском языке!
Повторяй за мной
Краткий обзор навыка «Повторяй за мной»
Описание от разработчика
Можно попросить Алису повторить текст, написанный или сказанный пользователем.
Активация навыка
Чтобы воспользоваться навыком, скажите Алисе одну из команд:
Обратите внимание
Навык можно активировать в любом продукте Яндекса, в который встроена Алиса, и в котором доступен ввод текста — в Браузере, Алисе для Windows и т. д. Обратившись к Алисе с командой «запусти навык Повторяй за мной» и следуя инструкциям голосового помощника.
Разработка программ в области здорового питания началась в ряде стран сравнительно недавно – пару десятилетий назад. Эти программы базируются на данных эпидемиологии и современных концепциях укрепления здоровья, в них убедительно показано, что одним из факторов, активно влияющих на здоровье и смертность, является питание. Основным документом является Распоряжение Правительства Российской Федерации от 25 октября 2010 г. № 1873-р «Основы государственной политики Российской Федерации в области здорового питания населения на период до 2020 года».
В 2015 г. опубликован Национальный доклад «Государственная политика Российской Федерации в области здорового питания» с целью формирования целостного представления о состоянии и тенденциях развития политики в области здорового питания в Российской Федерации, ее эффективности и путях реализации.
В Национальном докладе представлены демографические показатели, механизмы реализации государственной политики в области здорового питания, в т.ч. их нормативно-правовое обеспечение, производство сельскохозяйственной продукции, результаты мониторинга за безопасностью пищевой продукции и состоянием питания различных групп населения, а также путей его оптимизации. Российская Федерация принимает активное участие в развитии международного сотрудничества в рамках международных организаций по вопросам продовольственной безопасности и питания, что подробно отражено в докладе. Заключительный раздел Доклада содержит некоторые итоги реализации государственной политики в области здорового питания.
Рассмотрим, что означают термины «здоровое питание» и «государственная политика в области здорового питания».
Здоровое питание – питание, обеспечивающие рост, нормальное развитие и жизнедеятельность человека, способствующее укреплению его здоровья и профилактике заболеваний. Термин употребляется как более предпочтительный эквивалент прилагательных «рациональное» или «сбалансированное».
Государственная политика в области здорового питания – комплекс мероприятий по созданию условий, обеспечивающих удовлетворение потребностей различных категорий населения в рациональном, здоровом питании с учетом традиций, привычек и экономического положения. Она строится на основе постоянного наблюдения за состоянием питания и здоровьем человека, прогнозов развития науки и техники в области производства сельскохозяйственного сырья, пищевых продуктов, минеральных удобрений, ветеринарных препаратов, витаминов, биологически активных добавок и гигиены питания.
Основополагающими и ключевыми моментами государственной политики в области здорового питания являются цели, как результат деятельности, и задачи, как план работы для достижения цели.
Целями государственной политики в области здорового питания являются сохранение и укрепление здоровья населения, профилактика заболеваний, обусловленных неполноценным и несбалансированным питанием.
Основными приоритетными задачами государственной политики в обл
Как прикольно жить с умной колонкой: топ навыков «Алисы», о которых вы могли не знать
Интерактивные фигурки из «Холодного сердца», игры с наборами LEGO Duplo и игрушками Kinder, угадывания персонажей и безумные истории, квесты на диване с друзьями и алкотестер. Собрали нескучные идеи для беседы с «Алисой» внутри вашей умной колонки.
Голосовой помощник «Алиса», который установлен внутри всех «Яндекс-станций» и в некоторых колонках от партнеров «Яндекса», многие используют для таймера, будильника и новостей о погоде. На самом деле «Алиса» умнеет с каждым днем. И немалую роль в этом играют специальные навыки, с которыми взаимодействие с колонкой становится еще интереснее.
Навыки — это такие как бы приложения, запускающиеся по голосовой или текстовой команде на всех устройствах с «Алисой». Например, вы можете сказать: «Алиса, запусти навык „Угадай персонажа“». Сразу запустится классная игра, где она будет угадывать с помощью вопросов реального или вымышленного персонажа, которого вы загадали.
Мы отобрали несколько интересных на наш взгляд навыков «Алисы», с которыми можно сгладить хмурый дождливый вечер дома. Все они собраны на специальной странице. Отдельно можно посмотреть на рейтинг самых популярных.
А если у вас дома нет своей «Алисы», то вы всегда можете найти ее в Каталоге Onlíner с бесплатной доставкой и возвратом 5% на карту «Onlíner Клевер».
Полезности, история и квесты
«Зарядка для глаз». «Алиса» помогает отдохнуть от компьютера с помощью упражнений для глаз и расслабляющей фоновой музыки.
Настройка гитары. Просто скажите: «Запусти навык „Настройка гитары“». Работает наподобие популярных гитарных тюнеров на смартфонах, только на слух и без визуализации. Если сравнивать с ними, то звучание струн у «Алисы» совпадает с их показаниями.
«Тест на алкоголь». На основании показателей тела, возраста и количества выпитого «Алиса» рассчитывает, сколько у вас в организме алкоголя и можно ли садиться за руль. Правда, ориентируется на российские законы о допустимом содержании алкоголя в крови при вождении. В любом случае навык стоит воспринимать как строго развлекательный. А за руль ни в коем случае нельзя садиться пьяным. Независимо от количества выпитого.
«День Победы». Исторический навык, созданный «Радио Маяк» о событиях последних дней войны с 24 февраля до 15 мая. Юрий Левитан зачитывает сводки Советского информационного бюро о событиях на фронтах войны. Полезно как для школьников, так и для любителей истории и всех, кто хочет вспомнить о Великой Отечественной.
«Новгородские хроники». Очень подробное погружение в средневековый город. В навыке объясняется устройство города, его ключевые объекты и звучит много исторических терминов. Сюжет строится вокруг защиты независимости Новгорода от Москвы, где игроку необходимо принимать соответствующие важные решения. Затягивающий квест получился, жаль, не очень долгий.
«Любознательный Сальвадор». Навык для разбирающихся в живописи и архитектуре. «Алиса» задает вопросы о художниках, их жизни и, конечно, об их произведениях. Есть соревновательный режим с другом через интернет. Навык в целом интересный и познавательный, но требует подготовки. Обратите внимание, что его функционал отличается при использовании на компьютере или в приложении и на колонке, где все через голос и без картинок.
Кто помнит олдскульные текстовые игры, тот полюбит навыки «Алисы», где с помощью голосовых команд необходимо проходить целые квесты и задействовать самый мощный графический процессор — ваше воображение. Например, вот очень классный навык «Пещера Времени». Нарративный квест с интересным сюжетом и хорошей вариативностью действий. В таком же духе можете попробовать «Тайну темного лабиринта 2» с многоголосой озвучкой. Один из самых популярных навыков-квестов — «Секретный Агент». У него 13 тысяч оценок в каталоге навыков «Алисы», много голосов озвучки и четыре очень увлекательные миссии, где вам нужно исследовать разные локации, изучать документы, допрашивать подозреваемых и говорить с врагами так, чтобы не себя не выдать. Каждое решение тоже имеет последствия.
«Да, милорд». Прикольный навык и тоже про важность принятия решений и их последствия. По поручению короля вы управляете некоторыми землями и решаете все вопросы и проблемы. Например, строите медную шахту и нанимаете работникам крестьян с земель, где находится добыча. Ваше богатство и влияние растут. Но как только вы говорите на допросе инквизиции, что Земля вращается вокруг Солнца, вас арестуют за веру в еретические учения Коперника и Бруно.
По ходу игры надо постоянно соблюдать баланс между богатством и влиянием. Иначе король казнит вас за растраты и глупость или из-за боязни потерять власть и зависти к богатству.
Для взрослых и вместе с детьми
«Угадай персонажа» — №1 в чарте навыков «Алисы». Работает по принципу знаменитой компьютерной игры «Акинатор». Вы загадываете реального или вымышленного персонажа, а «Алиса» наводящими вопросами пытается его отгадать. Кто не играл в «Акинатор», тот гарантированно испытает детский восторг от того, как «Алиса» медленно подходит к разгадке персонажа, которого вы не произносили даже вслух. Многие знают застольный аналог этой игры со стикерами на лбу.
Навык «Сова — угадай книгу» работает точно так же, как предыдущий, только просит загадать книгу и героя из нее. Процесс игры аналогичный, а удовольствия не меньше.
«Занимательные истории». Вы говорите «Алисе» слова, а она составляет из них безумные, астрологические и просто прикольные истории.
«Три шкатулки». «Алиса» проверит вашу внимательность и память. Она кладет монетку в одну из шкатулок и меняет их местами, озвучивая свои действия вслух. Надо определить, в какой шкатулке монетка. В реальности это не так просто, как может показаться, особенно на сложных уровнях.
«Лимонадный киоск». Попробуйте себя в роли производителя и продавца лимонада. Перед каждым вам необходимо учитывать погодные условия, стоимость производства стаканчика лимонада, затраты на маркетинг в виде количества рекламных листовок и, конечно, стоимость одного стаканчика лимонада. Игра как для взрослых, так и для детей. С колонкой прикольно в нее играть, только вам точно потребуется записывать свои показатели и сводить дебет с кредитом на бумаге.
«Самый умный». Одна из многочисленных викторин среди навыков «Алисы» и копия телевизионной игры «Слабое звено». Нехитрые вопросы, быстрые ответы и пополнение банка. В конце обязательно кто-то выбывает. На выбор несколько уровней сложности. На легком можно играть с детьми.
Для детей
В детской категории собрано много навыков для младших школьников и дошкольников. Часть из них направлена на развитие тех или иных навыков. А другая часть — игры и викторины.
LEGO Duplo. Вместе с «Алисой» вы можете с вашим ребенком построить увлекательный рассказ вокруг конструктора из серии LEGO Duplo. Например, в наборе «Животные мира» необходимо найти гостей, которых лев пригласил на свой день рождения. «Алиса» сперва попросит найти человечка, потом найти ему машину или самолет из набора и проехать большой круг. Затем надо собрать всех животных вместе, а «Алиса» будет загадывать загадки про них и по-настоящему помогать, если возникнут трудности. Очень крутой навык, открывающий с новой стороны взаимодействие с умной колонкой и конструктором LEGO. Вот все наборы из этой серии, с которыми поможет играть «Алиса».
Игра «Графический диктант». Классическое упражнение из начальной школы. Отступаете несколько клеточек сверху и слева и начинаете рисовать картинку. «Алиса» говорит, на сколько клеточек надо провести линию влево или вправо. На выбор предлагается 17 картинок, что не очень много, но зато увлекательно.
«Чистим зубки» и «Моем ручки». Музыкальные навыки, прививающие хорошие привычки детям. На деле их проверить не удалось, но у «Чистим зубки» аж 3 тыс. оценок.
«Звериная зарядка». Помимо стандартной разминки, иногда ребенку надо побыть слоном, собачкой или лягушкой, выполняя характерные для этих животных активности.
«Изучаем транспорт». Навык позволяет узнать о разных видах транспорта и его назначении. Но самое в нем прикольное — угадывать транспорт по звуку. На компьютере или смартфоне еще доступны задания с картинками.
«Игра „Магазин“». Интересная ролевая игра, где ребенок выступает продавцом игрушек. Покупатели описывают игрушку, которую хотят купить, а вам надо отгадать, т. е. как бы найти ее на полке или складе. Там много музыки и сопроводительных звуков. А в озвучке выступают разные голоса, включая несколько искусственных.
«Угадай звук». «Алиса» воспроизводит разные звуки, а ребенку необходимо определить, что это. Например, дождь, лошадь, пианино, гром, море и т. д.
«Совенок — угадай книгу». «Я это называю мош инлетекта». Навык работает точно так же, как «Угадай персонажа», только с озвучкой детским голосом и только про персонажей из детских книжек.
Умная колонка может помочь с математическими навыками. В каталоге «Алисы» их очень много. Вот, например, «Икс на игрек» — навык для повторения таблицы умножения, где «Алиса» после каждого успешного раунда раздает комплименты в виде званий «Умница», «Гордость учителя», «Прирожденный математик» и т. д. Несколько уровней сложности есть в другом навыке «Увлекательная математика».
Интерактивные игрушки
Новый формат взаимодействия с умной колонкой теперь еще включает мягких и красивых «Смешариков» и детализированные фигурки героев из «Холодного сердца». После активации игрушки «Алиса» предложит сыграть в игру с интересной историей. Например, у Кроша это поиск сокровищ в Африке. Жаль, что на каждую игрушку лишь одна история.
Как устроена Алиса. Лекция Яндекса
В этой лекции впервые рассматриваются технологические решения, на основе которых работает Алиса — голосовой помощник Яндекса. Руководитель группы разработки диалоговых систем Борис Янгель hr0nix рассказывает, как его команда учит Алису понимать желания пользователя, находить ответы на самые неожиданные вопросы и при этом вести себя прилично.
— Я расскажу, что внутри у Алисы. Алиса большая, в ней много компонент, поэтому я немного поверхностно пробегусь.
Алиса — голосовой помощник, запущенный Яндексом 10 октября 2017 года. Она есть в приложении Яндекса на iOS и Android, а также в мобильном браузере и в виде отдельного приложения под Windows. Там можно решать свои задачи, находить информацию в формате диалога, общаясь с ней текстом или голосом. И есть киллер-фича, которая сделала Алису довольно известной в рунете. Мы пользуемся не только заранее известными сценариями. Иногда, когда мы не знаем, что делать, мы используем всю мощь deep learning, чтобы сгенерировать ответ от имени Алисы. Это получается довольно забавно и позволило нам оседлать поезд хайпа.
Как выглядит Алиса высокоуровнево?
Пользователь говорит: «Алиса, какую ожидать завтра погоду?»
Первым делом мы его речь стримим в сервер распознавания, он превращает ее в текст, и этот текст затем попадает в сервис, разработкой которого занимается моя команда, в такую сущность, как классификатор интентов. Это машиннообученная штука, задача которой — определить, чего же пользователь хотел сказать своей фразой. В этом примере классификатор интентов мог сказать: окей, наверное, пользователю нужна погода.
Затем для каждого интента есть специальная модель, которая называется семантический теггер. Задача модели — выделить полезные крупицы информации в том, что сказал пользователь. Теггер для погоды мог бы сказать, что завтра — это дата, на которую пользователю нужна погода. И все эти результаты разбора мы превращаем в некоторое структурированное представление, которое называется фреймом. В нем будет написано, что это интент погода, что погода нужна на +1 день от текущего дня, а где — неизвестно. Вся эта информация попадает в модуль dialog manager, который, помимо этого, знает текущий контекст диалога, знает, что происходило до этого момента. Ему на вход поступают результаты разбора реплики, и он должен принять решение, что с ними сделать. Например, он может сходить в API, узнать погоду на завтра в Москве, потому что геолокация пользователя — Москва, хоть он ее и не указал. И сказать — сгенерируйте текст, который описывает погоду, затем его отправить на модуль синтеза речи, который с пользователем поговорит прекрасным голосом Алисы.
Dialog Manager. Здесь нет никакого машинного обучения, никакого reinforcement learning, там только конфиги, скрипты и правила. Это работает предсказуемо, и понятно, как это поменять, если нужно. Если менеджер приходит и говорит, поменяйте, то мы можем это сделать в короткие сроки.
В основе концепции Dialog Manager лежит концепция, известная тем, кто занимается диалоговыми системами, как form-filling. Идея в том, что пользователь своими репликами как бы заполняет некую виртуальную форму, и когда он в ней заполнит все обязательные поля, его потребность можно удовлетворить. Движок event-driven: каждый раз, когда пользователь что-то делает, происходят какие-то события, на которые можно подписываться, писать их обработчики на Python и таким образом конструировать логику диалога.
Когда нужно в сценариях сгенерировать фразу — например, мы знаем, что пользователь говорит про погоду и нужно ответить про погоду, — у нас есть мощный язык шаблонов, который позволяет нам эти фразы писать. Вот так это выглядит.
Это надстройка над питонячьим шаблонизатором Jinja2, в которую добавили всякие лингвистические средства, например возможности склонять слова или согласовывать числительные и существительные, чтобы можно было легко когерентный текст писать, рандомизировать кусочки текста, чтобы увеличивать вариативность речи Алисы.
В классификаторе интентов мы успели попробовать множество разных моделей, начиная от логистической регрессии и заканчивая градиентным бустингом, рекуррентными сетями. В итоге остановились на классификаторе, который основан на ближайших соседях, потому что он обладает кучей хороших свойств, которых у других моделей нет.
Например, вам часто надо иметь дело с интентами, для которых у вас есть буквально несколько примеров. Просто учить обычные классификаторы мультиклассовые в таком режиме невозможно. Например, у вас оказывается, что во всех примерах, которых всего пять, была частица «а» или «как», которой не было в других примерах, и классификатор находит самое простое решение. Он решает, что если встречается слово «как», то это точно этот интент. Но это не то, чего вы хотите. Вы хотите семантической близости того, что сказал пользователь, к фразам, которые лежат в трейне для этого интента.
В итоге мы предобучаем метрику на большой датасете, которая говорит о том, насколько семантически близки две фразы, и потом уже пользуемся этой метрикой, ищем ближайших соседей в нашем трейнсете.
Еще хорошее качество этой модели, что ее можно быстро обновлять. У вас появились новые фразы, вы хотите посмотреть, как изменится поведение Алисы. Все, что нужно, это добавить их множество потенциальных примеров для классификатора ближайших соседей, вам не нужно переподбирать всю модель. Допустим, для нашей рекуррентной модели это занимало несколько часов. Не очень удобно ждать несколько часов, когда вы что-то меняете, чтобы увидеть результат.
Семантический теггер. Мы пробовали conditional random fields и рекуррентные сети. Сети, конечно, работают намного лучше, это ни для кого не секрет. У нас там нет уникальных архитектур, обычные двунаправленные LSTM с attention, плюс-минус state-of-the-art для задачи тегирования. Все так делают и мы так делаем.
Единственное, мы активно пользуемся N-best гипотез, мы не генерируем только самую вероятную гипотезу, потому что иногда нам нужна не самая вероятная. Например, мы перевзвешиваем зачастую гипотезы в зависимости от текущего состояния диалога в dialog manager.
Если мы знаем, что на предыдущем шаге мы задали вопрос про что-то, и есть гипотеза, где теггер что-то нашел и гипотеза, где не нашел, то наверное, при прочих равных первое более вероятно. Такие трюки нам позволяют немного улучшить качество.
А еще машиннообученный теггер иногда ошибается, и не совсем точно в самой правдоподобной гипотезе находят значение слотов. В этом случае мы ищем в N-best гипотезу, которая лучше согласуется с тем, что мы знаем о типах слотов, это позволяет тоже еще немного качество заработать.
Еще в диалогах есть такое явление Анафора. Это когда вы с помощью местоимения ссылаетесь на какой-то объект, который был раньше в диалоге. Скажем, говорите «высота Эвереста», и потом «в какой стране он находится». Мы анафоры умеем разрешать. Для этого у нас две системы.
Одна general-purpose система, которая может работать на любых репликах. Она работает поверх синтаксического разбора всех пользовательских репликах. Если мы видим местоимение в его текущей реплике, мы ищем known phrases в том, что он сказал раньше, считаем для каждой из них скорость, смотрим, можно ли ее подставить вместо этого местоимения, и выбираем лучшую, если можем.
А еще у нас есть система разрешения анафор, основанная на form filling, она работает примерно так: если в предыдущем интенте в форме был геообъект, и в текущем есть слот для геообъекта, и он не заполнен, и еще мы в текущий интент попали по фразе с местоимением «туда», то наверное, можно предыдущий геообъект импортировать из формы и подставить сюда. Это простая эвристика, но производит неплохое впечатление и круто работает. В части интентов работает одна система, а в части обе. Мы смотрим, где работает, где не работает, гибко это настраиваем.
Есть эллипсис. Это когда в диалоге вы опускаете какие-то слова, потому что они подразумеваются из контекста. Например, вы можете сказать «расскажи погоду», а потом «а на выходных?», имея в виду «расскажи погоду на выходных», но вы хотите повторять эти слова, потому что это ни к чему.
С эллипсисами мы тоже умеем работать примерно следующим образом. Эллиптические фразы или фразы-уточнения — это отдельные интенты.
Если есть интент get_weather, для которого в трейне фразы типа «расскажи погоду», «какая сегодня погода», то у него будет парный интент get_weather_ellipsis, в котором всевозможные уточнения погоды: «а на завтра», «а на выходные», «а что там в Сочи» и так далее. И эти эллиптические интенты в классификаторе интентов на равных конкурируют со своими родителями. Если вы скажете «а в Москве?», классификатор интентов, например, скажет, что с вероятностью 0,5 это уточнение в интенте погода, и с вероятностью 0,5 уточнение в интенте поиска организаций, например. И затем диалоговый движок перевзвешивается scores, которые назначил классификатор интентов, который назначил их с учетом текущего диалога, потому что он, например, знает, что до этого шел разговор о погоде, и вряд ли это было уточнение про поиск организаций, скорее это про погоду.
Такой подход позволяет обучаться и определять эллипсисы без контекста. Вы можете просто откуда-то набрать примеров эллиптических фраз без того, что было раньше. Это довольно удобно, когда вы делаете новые интенты, которых нет в логах вашего сервиса. Можно или фантазировать, или чего-то придумывать, или пытаться на краудсорсинговой платформе собрать длинные диалоги. А можно легко насинтезировать для первой итерации таких эллиптических фраз, они будут как-то работать, и потом уже собирать логи.
Вот жемчужина нашей коллекции, мы называем ее болталкой. Это та самая нейросеть, которая в любой непонятной ситуации чего-то от имени Алисы отвечает и позволяет вести с ней зачастую странные и часто забавные диалоги.
Болталка — на самом деле fallback. В Алисе это работает так, что если классификатор интентов не может уверенно определить, чего хочет пользователь, то другой бинарный классификатор сперва пытается решить — может, это поисковый запрос и мы найдем что-то полезное в поиске и туда отправим? Если классификатор говорит, что нет, это не поисковый запрос, а просто болтовня, то срабатывает fallback на болталку. Болталка — система, которая получает текущий контекст диалога, и ее задача — сгенерировать максимально уместный ответ. Причем сценарные диалоги тоже могут являться частью контекста: если вы говорили про погоду, а потом сказали что-то непонятное, сработает болталка.
Это позволяет нам делать вот такие штуки. Вы спросили про погоду, а потом болталка ее как-то прокомментировала. Когда работает, выглядит очень круто.
Болталка — DSSM-подобная нейронная сеть, где есть две башни энкодера. Один энкодер кодирует текущий контекст диалога, другой — ответ-кандидат. У вас получается два embedding-вектора для ответа и контекста, и сеть обучается так, чтобы косинусное расстояние между ними было тем больше, чем уместнее данный ответ в контексте и чем неуместнее. В литературе эта идея давно известна.
Почему у нас вроде неплохо все работает — кажется, что чуть лучше, чем в статьях?
Никакой серебряной пули нет. Нет техники, которая позволит внезапно сделать классно разговаривающую нейронную сеть. Нам удалось достичь неплохого качества, потому что мы в качестве понемножку выиграли везде. Мы долго подбирали архитектуры этих башен-энкодеров, чтобы они лучше всего работали. Очень важно правильно подобрать схему сэмплирования отрицательных примеров в обучении. Когда вы обучаетесь на диалоговых корпусах, у вас есть только положительные примеры, которые когда-то кем-то были сказаны в таком контексте. А отрицательных нет — их нужно как-то генерировать из этого корпуса. Там есть много разных техник, и одни работают лучше, чем другие.
Важно, как вы выбираете ответ из топа кандидатов. Можно выбирать наиболее вероятный ответ, предлагаемый моделью, но это не всегда лучшее, что можно сделать, потому что при обучении модель учитывала не все характеристики хорошего ответа, которые существуют с продуктовой точки зрения.
Ещё очень важно, какими дата-сетами вы пользуетесь, как их фильтруете.
Чтобы по крупицам собрать из этого всего качество, надо уметь измерять все, что вы делаете. И тут наша гордость состоит в том, что все аспекты качества системы мы умеем мерить на нашей краудсорсинговой платформе по кнопке. Когда у нас появляется новый алгоритм генерации результатов, мы в несколько кликов можем сгенерировать ответ новой модели на специальном тестовом корпусе. И — померить все аспекты качества полученной модели в Толоке. Основная метрика, которой мы пользуемся, — логическая уместность ответов в контексте. Не надо говорить чушь, которая никак с этим контекстом не связана.
Есть ряд дополнительных метрик, которые мы стараемся оптимизировать. Это когда Алиса к пользователю на «ты» обращается, говорит о себе в мужском роде и произносит всякие дерзости, гадости и глупости.
Высокоуровнево я рассказал все, что хотел. Спасибо.