Опыт Dasha.ai: как технологии распознавания речи Yandex SpeechKit помогли Зарплате.ру актуализировать клиентскую базу на 100%



О Зарплате.ру
Зарплата.ру входит в Hearst Shkulev Digital Regional Network и является одной из трех крупнейших интернет-площадок в России по поиску работы и подбору персонала. База сотрудников содержит около 7 000 000 резюме по всей России. В свою очередь, специалисты могут выбирать предложения работы из 114 000 опубликованных вакансий. Каждый день работодатели добавляют более 2 500 новых вакансий.

Задачи: убедить соискателей и работодателей обновлять информацию
Чтобы поиск специалиста был удобным и быстрым, а результаты релевантными, крайне важна актуальность резюме. Они должны всегда содержать достаточно информации о специалисте, полно описывать опыт, включать все необходимые настройки. То же самое и с вакансиями. Нужно, чтобы рекрутер вовремя обновлял предложение работы.

Ранее база поддерживалась в актуальном состоянии традиционными способами. Требовалось постоянно обращаться к живым людям и побуждать их совершать действия:
  • резюме: если по истечении месяца после размещения соискатель еще ищет работу, информацию нужно обновить, если нет — архивировать или удалить;
  • вакансия: если работодатель не закрыл позицию, нужно предложить продление размещения.
К началу проекта примерный объем позиций, требовавших актуализации, дошел до 10 000 в сутки. В этом году была внедрена система для обзвона клиентов на основе технологий Yandex SpeechKit и Dasha.ai.

Почему выбрали робота-оператора
Попытка наладить обзвон силами операторов не была эффективной из-за типичных сложностей с содержанием штата и управлением. После этого были испробованы и показали себя неэффективными две существующие технологии:
  • рассылка СМС не дала отклика;
  • при использовании IVR люди не хотели долго слушать текст и разговаривать с интерактивным меню.
Поскольку ни рассылка СМС, ни использование интерактивного голосового меню не смогли заменить дорогостоящего оператора, Зарплата.ру продолжила поиск технологии, которая сможет подсказать клиентам, что им пора обновить резюме или вакансию.

Робот-оператор. Оригинальное решение для обзвона клиентов создала компания «Dasha.AI». Система состоит из трех частей.
  1. Распознавание речи — за это отвечает облачная технология Yandex SpeechKit.
  2. После распознавания происходит обработка информации с помощью фирменной технологии Dasha.ai, извлечение из нее смысла и выбор ответа согласно скрипту.
  3. Ответ собеседнику (для этого диктор записал 30 фраз).

Этапы реализации
Для компании Зарплата.ру актуализация базы вакансий и базы резюме — это две задачи, но решены они были одним и тем же путем, поэтому в данном проекте объединены два кейса.

Во время пилота шел обзвон работодателей, в процессе которого удалось решить задачу увеличения объема повторных продаж. В ходе тестов проводилось сравнение конверсии звонков от Dasha.ai с аккаунт-службой — и стало видно, что Dasha.ai показывает эффективность, лишь немного уступающую живому человеку. После этого опыт был расширен.

Основной этап реализации проекта занял около трех месяцев:
  • После получения скрипта разговора от заказчика создана тестовая модель.
  • Проведены тестовые звонки: 60% состоявшихся разговоров заканчивались успешно с первого раза, в оставшихся случаях робот не понимал собеседника или разговор шел не туда.
  • За 8 итераций модели добились снижения количества ошибок до 10%.
  • К концу трех месяцев была создана модель, эффективность которой в процессе обзвона оказалась всего на 6,7% ниже, чем у оператора, живого человека.
Модель постоянно улучшается, апдейты выходят на ежемесячной основе, при этом точность работы с соискателями улучшается быстрее, чем было запланировано. Это зависит от объемов информации. По базе резюме большие объемы, по базе вакансий — меньше, в связи с этим дольше копится статистика ответов и модель улучшается медленнее.

Технические особенности: увеличить скорость распознавания
Использование технологии Yandex SpeechKit в режиме потокового распознавания (распознавание речи в реальном времени) — это стандартный процесс, все вопросы использования API описаны в документации. Тем не менее инженеры Яндекс.Облака и «Даша.АИ» отметили важный пункт — скорость распознавания. Изначально показатель Latency на коротких фразах (ответы «Да» или «Нет») составлял до 600 мс (обычно этот показатель составляет до 200 мс). В процессе работы, с одной стороны, инженерами была проведена оптимизация настроек, с другой — серверы Dasha.ai перенесены ближе к серверам Яндекса. В итоге сейчас распознавание происходит со скоростью 0—150 мс.

Итоги
По итогам внедрения системы для обзвона клиентов на базе технологий Yandex SpeechKit и Dasha.ai. портал Зарплата.ру сумел закрыть несколько существовавших вызовов:
  • масштабировать задачи, которые было невозможно выполнить из-за нехватки людей, и сократить издержки на содержание и обучение сотрудников call-центра, при этом произошло сокращение нагрузки на операторов первой линии и перераспределение на более высокоинтеллектуальные задачи;
  • избежать влияния человеческого фактора и появления ошибок в скриптах;
  • получить всегда актуальную базу данных, а также возможность составления аналитики и прогнозирования на основе кратких настраиваемых отчетов;
  • увеличить продажи за счет обзвона всех потенциальных клиентов, в том числе сократить временные затраты менеджеров продаж за счет общения только с лидами отфильтрованными Dasha.ai.

Поводы начать использовать Yandex Managed Service for Redis



Redis используют Airbnb, Slack, Twitter и Uber, а в недавнем опросе Stack Overflow Developer Survey 2019 первое место в категории самая любимая БД разработчиков с показателем 71,3% занял именно Redis. На платформе Яндекс.Облако сервис Yandex Managed Service for Redis доступен в публичном режиме с апреля. Рассказываем о причинах популярности, планах развития и возможности начать пользоваться со скидкой.

Что умеет Redis
Redis — это система управления БД класса NoSQL. Название является сокращением от remote dictionary server, то есть это сервер словарей, работающий со структурами данных типа «ключ — значение». Система целиком работает в оперативной памяти, но при этом умеет сохранять данные на диск, написана на Си и является решением с открытым исходным кодом. Важно, что Redis очень быстрый, многие операции хорошо оптимизированы и работают константное время. Система легко справляется с нагрузкой в несколько сотен тысяч запросов в секунду. Сейчас Redis чаще всего используется в качестве хранилища. Одно из главных преимуществ по сравнению с Memcached, которое используется для кэширования данных в оперативной памяти, — поддержка множества интересных структур данных, для которых доступны богатые API. Например, можно хранить координаты и делать запрос по радиусу. Также в списке структур данных:
  • Строки
  • Словари
  • Списки
  • Множества
  • Сортированные множества
  • Битовые маски
  • Геоданные
  • Потоки
  • HyperLogLog
С точки зрения функциональности в первую очередь стоит отметить персистентость, о которой мы скажем ниже. Система поддерживает асинхронную репликацию, атомарные изолированные транзакции и пакетную обработку команд. Redis дает возможность задавать произвольное время жизни ключей и настраивать политики вытеснения ключей, что будет полезно, когда вы достигли лимита памяти. В системе реализован фреймворк типа издатель/подписчик, можно прямо в запросе посылать Lua-скрипты или использовать их как хранимые процедуры, а также есть возможность подключать расширения.

Redis в подаче Яндекса
Yandex Managed Service for Redis использует последнюю версию 5.0.4, все критически важные обновления устанавливаются своевременно. Реализованы Multi-AZ репликация (Cross-Datacenter) и автоматический failover на основе стандартного решения Sentinel. Также Sentinel используется как сервер конфигураций: клиент подключается к Sentinel и узнает, где сейчас текущий мастер. Yandex Managed Service for Redis позволяет создавать БД в нескольких конфигурациях:
  • Одноузловая (по умолчанию) — для реализации кэша или работы с не критически важными данными, например, постоянно обновляемыми счетчиками.
  • Автоматический отказоустойчивый кластер (от 3 хостов), когда требуется гарантия надежности работы.
По умолчанию в Yandex Managed Service for Redis заданы некоторые ограничения:
  • Maxmemory=75% RAM: 25% памяти зарезервированы под служебные процессы, различные агенты, клиентские буферы.
  • Rep-backlog-size=10% RAM: для кластера из нескольких хостов 10% памяти аллоцируется под буфер репликации, чтобы реплики успевали синхронизироваться с мастером. Яндекс берет на себя заботу о безопасности сервисов, и в Yandex Managed Service for Redis ей также уделено усиленное внимание, в связи чем на каждом хосте установлен firewall, используется AppArmor и стандартная аутентификация по паролю, запрещены некоторые опасные команды. На данный момент доступ дается только из виртуальной сети, которая была указана при создании, также возможен доступ по FQDN.

Yandex Managed Service for Redis для пользователя
Два самых популярных сценария использования Redis — это кэш, который помогает основному бэкэнду хранилища справляться с нагрузкой, либо хранилище сессий состояний. Но мы бы хотели обратить внимание и на такие сценарии, как брокер сообщений, сервер очередей, таблица лидеров, хранилище геоданных. В зависимости от потребностей клиентам Yandex Managed Service for Redis доступны два вида хостов:
  • Burstable (2/4 Гб) с низкими гарантиями ресурсов для сценариев, не предполагающих отказоустойчивости, например, для тестирования.
  • High-Memory (8-256 Гб) специальные классы хостов, которые оптимизированы по памяти, созданные для Redis.
Yandex Managed Service for Redis позволяет удобно масштабироваться, увеличивая или уменьшая flavor в несколько кликов.

Из настроек в настоящий момент пользователи могут менять только две:
  • Политика вытеснения ключей (eviction-policy) — важна в сценарии реализации кэша, позволяет выбирать наименее часто используемые ключи, случайные, последние и т. п.
  • Тайм-аут для спящих клиентов (timeout).
В веб-консоли Yandex Managed Service for Redis можно наблюдать за ключевыми метриками, отслеживать потребление ресурсов, количество подключенных клиентов, живость хостов. Отдельно показано потребление ресурсов каждого хоста.

Автоматическое резервное копирование осуществляется раз в сутки ночью, глубина хранения составляет 7 дней. Предусмотрена возможность выполнения резервного копирования по требованию. Бэкап представляет собой зашифрованный RDB-snapshot, который можно восстановить в новом кластере.

Планы по развитию функциональности Yandex Managed Service for Redis
Команда Yandex Managed Service for Redis постоянно работает над улучшением возможностей сервиса. В планах развитие средств диагностики, повышение удобства использования, более тонкая настройка кластера (помимо политики вытеснения ключей), гибкая работа с бэкапами, SSL/TSL шифрование. Уже в работе отказоустойчивая конфигурация с двумя хостами, а также поддержка Redis Cluster, который позволяет горизонтально масштабировать Redis не только на чтение, но и на запись.

Совет
Начните знакомство с Yandex Managed Service for Redis с изучения документации.
Вы можете получить скидку до 40% на пользование Yandex Managed Service for Redis в течение целого года. Как это сделать, читайте здесь.

Свежие новости от AWS



Вычисления

Хранение данных

Базы данных


Миграция
Сеть и доставка контента

Инструменты для разработчиков

Инструменты управления

Безопасность, идентификация и соответствие требованиям

Мультимедийные сервисы

Машинное обучение

Аналитика

Интеграция приложений

Мобильные сервисы

Эффективность бизнеса
Интернет вещей

Потоковая передача приложений для рабочего стола

Технологии блокчейн

Партнерская сеть AWS (APN)

Робототехника

Плановые технические работы



В ночь с воскресенья на понедельник в интервале 0:01 — 2:00 (МСК) будут проводиться плановые технические работы.

В это время возможен перерыв до 5 минут в работе сервисов:
  • Портал mcs.mail.ru (включая личный кабинет администратора).
  • API MCS.
  • Авторизация пользователей.
Не планируется перерывов в работе сервисов виртуальных машин, баз данных, контейнеров Kubernetes.

Если по окончании работ вы заметите какие-то проблемы — сообщите нам, мы всё починим.

Чат с техподдержкой, статистика SMTP и другие новости за август 2019




Чат с техподдержкой в приложении «Джино»
В мобильном приложении «Джино» появился раздел с чатом, в котором можно получить быстрый и исчерпывающий ответ по вопросам использования услуг. Если вам потребуется уточнить информацию или проконсультироваться, напишите в чат и наши сотрудники вам оперативно помогут.
jino.ru/about/news/articles/jinoapp-chat/


Статистика SMTP в сервисе «Джино.Почта»
Для тех, кто пользуется SMTP-сервером «Джино», стали доступны отчёты по успешности доставки писем. Теперь пользователи сервиса «Джино.Почта» могут увидеть, кому из адресатов письмо было доставлено, а кому оно не пришло. Особенно эта информация будет полезна при проведении массовых рассылок.
jino.ru/about/news/articles/smtpstats/


Совместный доступ к папкам в почтовых ящиках
Пользователи почтового сервиса «Джино» получили возможность открывать другим доступ к папкам в своих почтовых ящиках. Прежде всего, функция будет полезна для компаний: теперь не составит труда создать отдельную общую папку с письмами для нескольких сотрудников или добавить администраторов с разным уровнем прав к корпоративному адресу электронной почты.
mail.jino.ru/about/news/articles/share-mail-folders/


Добавление комментариев к базам данных, почтовым ящикам и FTP-аккаунтам
В нескольких сервисах «Джино» пользователи получили возможность добавлять комментарии к пунктам в списках. К примеру, пометки в поле для комментария у базы данных помогут понять, является ли база рабочей или тестовой и к какому сайту она относится.
Это небольшое улучшение поможет, в первую очередь, продвинутым пользователям при работе в сервисах «Джино» сразу с несколькими базами данных, IP-адресами, FTP-аккаунтами и почтовыми ящиками.
jino.ru/about/news/articles/add-comment/


Объявлен победитель розыгрыша в августе. Приз сентября — наушники Bose QC35
Подошел к концу очередной розыгрыш от «Джино». Робот-пылесос Xiaomi получает Виталий Г. из Челябинска — поздравляем с победой!
В сентябре мы разыграем беспроводные наушники Bose QuietComfort 35 II с высококлассной системой шумоподавления и встроенным помощником Google Assisitant. Не упустите возможность выиграть ценный приз!
jino.ru/about/news/all/articles/monthly-201909/

REG.RU Август 2019




Многозначная классификация с помощью Keras
www.reg.ru/blog/mnogoznachnaya-klassifikaciya-s-pomoshchyu-keras/


Как ИИ отслеживает небезопасное поведение водителей
www.reg.ru/blog/kak-ii-otslezhivaet-nebezopasnoe-povedenie-voditelej/


Стэнфордский курс: лекция 3. Функция потерь и оптимизация
www.reg.ru/blog/stehnfordskij-kurs-lekciya-3-funkciya-poter-i-optimizaciya/


Экскурсии в дата-центр: как мы провели 300 человек на закрытый объект и почему нас уже не остановить
www.reg.ru/blog/ekskursii-v-data-tsentr-kak-my-proveli-300-chelovek-na-zakrytyj-obekt-i-pochemu-nas-uzhe-ne-ostanovit/


Нейросеть описывает мир незрячим людям
www.reg.ru/blog/nejroset-opisyvaet-mir-nezryachim-lyudyam/


Как создать сайт-портфолио для творческого проекта
www.reg.ru/blog/kak-sozdat-sajt-portfolio-dlya-tvorcheskogo-proekta/


Улучшаем графику в старых играх и видео с помощью нейросетей
www.reg.ru/blog/uluchshaem-grafiku-v-staryh-igrah-i-video-s-pomoshchyu-nejrosetej/


Данные на замке: как двухфакторная аутентификация поможет обезопасить сайт
www.reg.ru/blog/dannye-na-zamke-kak-dvuhfaktornaya-autentifikatsiya-pomozhet-obezopasit-sajt/


Стэнфордский курс: лекция 4. Введение в нейронные сети
www.reg.ru/blog/stehnfordskij-kurs-lekciya-4-vvedenie-v-nejronnye-seti/


На что обратить внимание при создании сайта-галереи
www.reg.ru/blog/na-chto-obratit-vnimanie-pri-sozdanii-sajta-galerei/


Let's cook: как приготовить ИИ до золотистой нейронной корочки
www.reg.ru/blog/let-s-cook-kak-prigotovit-ii-do-zolotistoj-nejronnoj-korochki/


Всем игрокам приготовиться: обзор доменов в играх
www.reg.ru/blog/obzor-domenov-v-igrah/

Безлимитный хостинг за 29 руб. Заходите!

  • Well-Web


C 27 августа до 15 сентября Вы можете заказать хостинг по выгодной цене — 29 руб. за первый месяц использования.
На хостинге вы можете разместить свой сайт визитку, интернет магазин или свой блог. Мы бесплатно перенесем Ваши сайты к нам и Вы сможете самостоятельно оценить наши преимущества.

Промо-код — PD3C9AG2U7

Подробнее — well-web.net/limited-offers

Так же не стоит забывать о нашей акции с удвоением срока оплаты, для всех заказов VPS мы удвоим срок услуги, при оплате от 6 месяцев.

Торопитесь, срок акций ограничен!

Заказать хостинг — well-web.net/hosting
Заказать VPS — well-web.net/virt-private-serv
Аренда сервера — well-web.net/dedicated

C уважением,
Well-Web.net

Люблю красный (горячий проход / спереди назад)

Люблю красный (горячий проход / спереди назад) цвета на вкладках вентилятора и блока питания на
ArubaNetworks CX переключатели. И синий, когда вы получаете перевернутый холодный пучок прохода.


www.arubanetworks.com
www.arubacloud.com

Взгляд за кулисы Cloud Gaming



Взгляд за кулисы Cloud Gaming
Будущие игры двигаются в направлении облака (будет расти на 900% к 2023 году) и игроки могут быть взволнованы, что никогда не носить с собой большие игровыми коробками!
blog.leaseweb.com/2019/08/15/a-look-behind-the-curtain-of-cloud-gaming/

Сжатие данных в онлайн играх
Разработчики игр должны быть полны уловки для того, чтобы поставить самый лучший опыт для своих клиентов. Узнайте о преимуществах сжатия данных в играх.
blog.leaseweb.com/2019/08/06/data-compression-in-online-games/

Принимая поход в будущее
Мы следуем за фиктивным главным героем Саймону на поездку в розничный магазин, чтобы купить пару тренеров, и мы объясним роль технологии в этой истории. Эта история должна подчеркнуть, как технология резко меняет розничные и потребительские привычки. Все технологии упоминается в этой истории уже там для розничной торговли, чтобы воспользоваться.
blog.leaseweb.com/2019/08/14/taking-a-shopping-trip-to-the-future/

Контейнерные: обман или будущее?
Понятие «контейнеризации» циркулировал в ИТ-мире с 2013 года Сколько стоит реклама и сколько ваша компания должна быть обнимаются контейнеры? Мы более внимательно взглянуть на «контейнерах», и мы не говорим о еде или охладителях напитков здесь, мы говорим о технологии контейнера, используемой в разработке программного обеспечения.
blog.leaseweb.com/2019/08/02/containerization-hype-or-the-future/


SaaS Сессии серии Блог
Блог серии две части для «SaaS Sessions», который был вдохновлен недавним событием круглого стола, в котором пять голландских SaaS предпринимателей и у меня было обсуждение и общие идеи. Arno Witvliet главный директор по продажам Leaseweb обсуждает амбиции голландский SaaS компаний, шаги по расширению, расширения за рубежом и улучшение позиций на рынке за счет расширения Вашего бизнеса (на национальном и международном уровнях). Наслаждайтесь!
blog.leaseweb.com/2019/07/22/saas-sessions-part-1-ambitions/
blog.leaseweb.com/2019/08/26/saas-sessions-part-2-growth/


SaaStock приезжает в Амстердам на 5 сентября!
В мире глобальное сообщество программное обеспечение как услуга (SaaS) учредители, руководители и инвесторы теперь приземлились в каналах кремния! SaaStock Local пройдет в Амстердаме 5 сентября в нашей штаб-квартире в Luttenberweg 8, 1101 EC.

Присоединяйтесь к нам, начиная с 5:30 вечера на вечер, полный интересных сессий по метрикам SaaS, которые важны для раундов финансирования. Наши спикеры являются учредителями и ВК, которые находятся в траншеях каждый день и имеют большой опыт с Seed, серии А и серии B раундов финансирования.

Мероприятие стартует в 18:05 с выступлением по Даан Рейндерсом, генеральным директором и соучредителем из Foleon (ранее Instant Magazine). Затем, в 18:30 Даана воле привела панельную дискуссию о важных показателях SaaS с Йохана ван Милл (Пик капитал) и Элле-Jan Бруинсмом (Endeit)

Получите ваш билет, используя ссылку ниже, чтобы сохранить место. Используйте код LEASEWEB50 на 50% скидку.
local.saastock.com/events/details/saastock-amsterdam-presents-metrics-that-matter-when-funding-your-saas-company/


Зарегистрируйтесь сейчас для IBC 2019, чтобы получить бесплатный билет
В субботу 14 сентября наш управляющий директор LEASEWEB CDN, Вильфрид Dudink, пройдет демо-сессии, где он будет глубоко погружения в наше решение LEASEWEB Multi-CDN, и как это может быть полезным для вашего бизнеса. Разговор происходит в 12:00 в Театре CE Hub в павильоне 14. Кроме того, пришел встретиться с нашими специалистами CDN на стенде F32 в павильоне 14, где мы будем раздавать грузы лакомства, в том числе возможности выиграть полет в нашем Leaseweb пилотажный самолет. Зарегистрироваться с кодом 19471 требовать бесплатного билета.
ibc19.itnint.com/Online/CreateAccount.aspx


Построение решения ВГА на голых серверах металла
Читайте наш первый LEASEWEB Labs блог в нашей серии на тему контейнерных решений. Это сообщение написано Santhosh Ч, ветеран инженером с огромным опытом строительства IaaS / облачными платформами с нулем.
www.leaseweb.com/labs/2019/07/building-caas-solution-bare-metal-servers/

Как создать аутентификацию JWT с API платформы
Блог о том, как создать простую аутентификацию JWT с использованием API платформы и LexikJWTAuthenticationBundle. И, конечно же, также используя наш милый Доктрину пользователя Provider.
www.leaseweb.com/labs/2019/06/create-jwt-authentication-api-platform/