Glashkoff.com

Полезные советы и софт, создание и оптимизация сайтов на WordPress

Блог

Безопасность Яндекс.Станции: паранойю не победить?

Электронная помощница Алиса получила физическое воплощение в виде тканевого параллелепипеда с меняющимися панельками.

Первая партия Яндекс.Станции разлетелась по покупателям, в целом отзывы нейтрально-позитивные. Как-никак это не уникальный продукт, настоящего вау-эффекта не получилось. Но колонка работает так, как надо. Те, кто пользуется помощником Алисой через телефон или Яндекс.Браузер, знают, что ждать от устройства, поэтому недовольных мало.

Голоса недоверия

И всё бы ничего, но я заметил нехорошую тенденцию людей слушать голос паранойи, не разума. Мол, колонка подслушивает не смотря ни на что. Даже если игнорировать дискуссии на сайтах с желтушными новостями, где собирается определённо настроенный контингент, вопли недоверия можно встретить и на серьёзных сайтах.

Источник: vc.ru

Очевидно, что люди по-разному пользуются техникой и Станция подойдёт не всем. Умная колонка облегчает жизнь тем, кому удобно пользоваться голосовыми помощниками. Эти люди понимают: не нужно доставать телефон, не нужно искать тихое место, при любых обстоятельствах в доме можно всегда сказать «Привет, Алиса» и она услышит.

Колонка хорошо слышит, но это не значит, что она подслушивает.

Зная, что будут подозрения, с самого первого анонса Яндекс сделал акцент на уникальной функции: физическом отключении микрофона кнопкой.

Источник: блог Яндекса

Заявление производителя о том, что микрофоны обесточиваются физически, легко проверить, вооружившись мультиметром и сняв внешний кожух (кстати, колонка легко разбирается — вот он, отечественный подход!). Параноики подумали логически и поумерили пыл? Неа.

Источник: Ютуб

Можно пойти ещё дальше и вовсе отрицать существование отключающей кнопки:

Источник: 4pda.ru

Это, конечно, явный бред.

Вот же она!

Думаем логически

Некоторые пользователи сосредотачиваются на другой параноидальной идее: что при включенных микрофонах колонка отправляет всё услышанное на сервера Яндекса, чтобы распознать момент, когда вы скажете фразу активации Алисы. Таким образом колонка якобы всё время шпионит за владельцем.

Если бы это оказалось правдой, то…

  1. Все устройства с Алисой (телефоны и ПК с приложениями Яндекс и Яндекс.Браузер) постоянно слали бы звуковой поток на сервера, расходуя трафик, что заметили бы владельцы лимитных тарифов. Я вот что-то этого не вижу.
  2. Яндекс бы оплачивал счета за электричество, которые пожирали сервера в попытке вычленить из окружающего шума ту заветную фразу, и платил за хранение всех сделанных записей.

Постоянный поток звуковых данных сразу бы заметили энтузиасты, любящие посмотреть, какие данные шлют приложения на их телефонах. Да и Яндекс не благотворительная компания. Им, между прочим, деньги зарабатывать надо.

Всё гораздо проще: в Яндекс.Станции есть электронные «мозги», которые слушают окружающие звуки для того, чтобы распознать команду активации (и только её!). Софт автономен, интернет для этого не нужен вовсе. Вы можете легко проверить мои слова, переведя телефон в «режим самолёта» (все коммуникации отключатся полностью) и сказав фразу «Привет, Алиса» в приложении Яндекс:

Алису можно активировать голосом при отключенном интернете

Приложения-ассистенты не могут, слушая, переводить всё сказанное в текстовый вид. Для полноценного распознавания текста, не только определённого звука, никакого заряда аккумулятора не хватит, да и нагрузка на процессор сразу станет заметна, не говоря уже о том, что это тоже можно отследить. Не могу утверждать, как в режиме ожидания ведёт себя Станция, но вряд ли разработчики стали применять сильно разные алгоритмы.

Все последующие запросы, действительно, улетают на сервера Яндекса и на основе этих запросов система узнаёт ваши предпочтения. Но пока вы не активировали Алису — никто вас не услышит.

Откуда растут ноги

Многие люди, даже обладающие техническими навыками, верят, что устройства их подслушивают. Например, чтобы точнее подбирать рекламу. Ведь известно, что рекламные сети изо всех сил стараются определить интересы конкретных людей, чтобы показывать цепляющую рекламу.

В интернете полно историй о том, как человек пообщался с супругой/супругом/коллегой/подругой/другом/продавцом о, например, работе банков, просто положив телефон рядом с собой, а потом на сайтах начинает появляться реклама кредитования.

Как так? Неужели какое-то приложение на телефоне подслушало и слило информацию кому надо?

На самом деле это феномен Баадера-Майнхоф, подслушивание не при чём.

Наш мозг каждую секунду обрабатывает множество данных — звуков, визуальных образов, запахов и ощущений. Часть этого бесполезна, она нам не нужна, поэтому до нашего сознательного «Я» доходит немногое. Система фильтрации так работает, что из-за обсуждения цен на квартиры некоторые время вы будете обращать внимание на объявления о продаже, риелторские агенства, даже если это вам не нужно. Потом всё приходит в норму, но факт совпадения запомнится и, в зависимости от верований и убеждений, обретёт какой-то смысл.

Если вы думаете, что в вашей жизни происходит много странных совпадений, не думайте о мистике или судьбе. Просто так работает мозг.

Любые попытки устройств записать действия пользователей достаточно легко обнаруживаются. И опасаться следует не того, что вас подслушают, а того, что вас подсмотрят, сделав скриншоты экрана или даже записав видео (см. «Исследователи изучили более 17 000 приложений для Android, чтобы убедиться в отсутствии слежки«, «Burger King и тайная запись экрана вашего телефона«).

Напоследок

Если вы боитесь покупать новый телефон, мучаясь с кнопочным, опасаясь быть подслушанным кем-то, или опасаетесь купить умную колонку только потому, что про вас кто-то может что-то узнать, мой вам совет: уделите этому вопросу пару часов своего времени, разберитесь в ситуации. В качестве источника информации используйте Хабр, Securitylab, Компьютерру, да хотя бы то, что предлагают Яндекс.Новости, но никак не желтушные сайты с «разоблачающими» вбросами.

Вы узнаете, что в случаете с телефонами лучше покупать устройства от известных производителей, потому что в безымянных телефонах с Алиэкспресса действительно встречается нехороший софт. Узнаете, что социальные сети любят торговать вашими данными. Узнаете, как много приватных данных сливается в сеть из-за взломов онлайн-сервисов. Узнаете, что без антивируса жить нельзя, но только его для защиты недостаточно. Что поисковикам совершенно необязательно вас подслушивать — вы и так своими поисковыми запросами сообщаете свои предпочтения.

А бредни про запись разговоров оставьте конспирологам.

7 комментариев

  1. mikhvita

    Колонка прослушивает и без активации для того, чтобы узнать о предпочтениях и научится вести беседу. Это я знаю из личного опыта. Кроме того того, колонку можно научить подслушивать избирательно того кого нужно через обновления. Обновления пользователем не контролируются.

    Ответить

    • Дмитрий Глашков

      mikhvita, расскажете поподробнее о своём опыте? Быть может, с момента выхода заметки что-то поменялось. Про индивидуальные обновления не спорю, такое зависит только от добросовестности производителя устройства.

      Ответить

      • mikhvita

        Опыт личный, поэтому не расскажу. Опыт не богатый — два три случая. Но насколько я знаю для обучения нейросети нужно тысячи событий. Сейчас разговор с Алисой (без браузера, в который она выдает результаты поиска, если не знает) напоминает разговор с блондинкой. Чем больше она разговаривает, тем умнее становится. Будь я на месте разработчиков, мне трудно было бы удержаться от соблазна включать ее для обучения даже если об этом не просят?

        Ответить

      • Дмитрий Глашков

        Эм, нейросети чатботов не так «обучаются». Иначе бы Алиса давно ругалась матом, услышанным от пользователей. От разговоров с Алисой улучшается качество ответов только для вас, потому что заполняется специальная форма с вашими потребностями. Об этом рассказали сами разработчики Алисы на Хабре. Там же в комментариях представитель Яндекса утверждает, что попросту нерентабельно прослушивать все разговоры, т.к. потребуются слишком большие мощности, ибо распознавание идёт на серверах. Добавлю: даже если бы распознавание проводилось софтом колонки и подслушанные разговоры отправлялись текстом, то возросшее энергопотребление давно бы заметили, как и спонтанный трафик в моменты бездействия устройства.

        Ответить

  2. mikhvita

    О каком трафике идет речь, если я слушаю музыку с серверов Яндекса целый день, а иногда и ночь. А кто-то еще и видео с Яндекс.Эфира качает. Яндекс колонка мини втыкается в сеть 220В и потребляет 5 Ватт (у колонки нет аккумуляторов). Где энергопотребление и трафик? Про текст я вообще молчу — одна страница в книге 2 кБайта, том из 500 страниц — 1 МБайт. Вы прочтете книгу за день? — а для интернета это меньше секунды.
    А если вдруг все владельцы Яндекс колонки и телефонов с Алисой одновременно захотят с ней поговорит, что будет с серверами и энергопотреблением Яндекса? Будут даны простые ничего не значащие ответы. Если нет запросов — тогда можно и послушать в свое удовольствие и Алиса становится умнее.

    Ответить

    • Дмитрий Глашков

      mikhvita, вообще-то, говоря о сетевом трафике, надо помнить не только про объёмы данных, но и про то, куда данные отсылаются. Даже один байт вне запроса к Я.Музыке уже будет виден, если имеется желание всё это отследить. Я вот из-за того, что пользуюсь Pi-Hole, частенько смотрю, куда стучатся мои устройства. Конечно, не считаю, что так делают все, но и единственным и неповторимым быть не могу.
      Поэтому я не понимаю вашей категоричности по поводу невидимости действий Яндекс.Станции. Паттерны использования колонки бывают разные. Кто-то слушает музыку целыми днями, кто-то спрашивает о погоде и пробках утром и колонка целый день бездействует, а кто-то ради интереса анализирует логи устройств, подключённых к домашней сети, и просматривает показания мультиметров-регистраторов.

      Будут даны простые ничего не значащие ответы.

      Так бывает только в художественных произведениях. Разработчикам незачем продумывать разные ответы при разной нагрузке оборудования. Проще поставить запросы в очередь или вовсе отфутболить. Более того — пользователей Я.Станции меньше, чем пользователей приложений Яндекс с Алисой на устройствах, поэтому активность Станций не должна вызвать каких-либо проблем. В любом случае, это вопрос сугубо теоретический и не имеет отношения к энергопотреблению Станции.

      Про текст я вообще молчу

      В колонке ЦПУ Allwinner R18. Не сильно производительный, но для распознавания речи, наверное, хватит. Вот только это будет заметно. При нагрузке устройство ощутимо нагревается. Конечно, никто в обнимку с такой штукой целый день сидеть не будет, но о том, что колонка горячая во время просмотра фильмов, отзывы есть. Значит — трогают, проверяют, и если бы она постоянно грелась как при нагрузке, кто-нибудь бы точно это заметил и уличил бы в подслушивании.

      Если нет запросов – тогда можно и послушать в свое удовольствие и Алиса становится умнее.

      Вы упоминаете обучение за счёт подслушивания уже трижды. Как, по-вашему, это должно работать? Программное обеспечение получит по сути поток фраз, зачастую без контекста. Ещё и с возможными искажениями, ибо распознавание речи работает не идеально (да ещё и голоса различает не умеет, нельзя получить диалог). Более качественного контента предостаточно в интернете, причём в структурированном виде — книги, форумы, блоги и так далее. Зачем откуда-то ещё получать информацию?
      Можно поставить вопрос иначе: а что именно таким образом улучшать? Для того, чтобы повысить качество распознавания речи (что к самой Алисе имеет крайне опосредованное отношение), для заданий в Я.Толоке берутся обезличенные семплы из самих бесед — этого достаточно. Типовые запросы вроде обсуждения погоды работают по скриптам: ответы зафиксированы, а способы добавить навыки — документированы и открыты для всех желающих. Чтобы лучше понимать контекст? Так опять-таки проще брать готовые тексты, чем какие-то обрывки разговоров. Алисе ведь нужно отвечать на реплики, а не вставлять фразы в монологи.
      Уже за час-два беседы с Алисой можно понять, что набор фраз у неё ограничен. Это подтверждает то, что говорят разработчики и об Алисе, и о Станции. Они явно не хотят пойти по стопам создателей чат-ботов от Microsoft и Тинькофф, чьи творения быстро научились оскорблять собеседников как раз из-за заимствования фраз.
      Подчеркну: я не заинтересован защищать честь и достоинство Яндекс.Станции, Алисы и компании Яндекс в целом, но стараюсь смотреть на вещи объективно. Поэтому с вами не согласен по вышеозначенным вопросам.

      Ответить

Написать комментарий

Правила:
  • 1. Уважайте стороннее мнение. Токсичные комментарии удаляются.
  • 2. Комментарии со ссылками видны после проверки модератором.
  • 3. Обсуждение нелицензионного софта и других незаконных тем запрещено.

Тема Rowling от Anders Norén. Копирование материалов сайта разрешается только с указанием автора и активной ссылкой на источник.