Перейти к содержанию

Яндекс.Толока

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис
Яндекс.Толока
Основание 2014
Основатели Ольга Мегорская
Отрасль интернет
Сайт toloka.ai

Яндекс.Толо́ка — краудсорсинговый проект, созданный в 2014 году[1] для быстрой разметки большого количества данных, которые затем используются для машинного обучения и совершенствования поисковых алгоритмов[2]. Как правило, размещаемые задания достаточно простые, для их исполнения не требуется специальная подготовка[3]. В основном они связаны с анализом и оценкой контента[4]. Поэтому любой желающий может выполнять задания и получать за них вознаграждение[5].

Названия сервиса

Толо́ка — это форма деревенской взаимопомощи в России, на Украине, в Белоруссии, Эстонии, Латвии и Литве. Её организовывали в деревне для выполнения срочных работ, требующих большого количества работников: сбор урожая, вырубка леса, сооружение домов и т. д. Иногда толоку использовали для проведения общественных работ (строительство церквей, школ, дорог и т. п.).

Идея совместной полезной работы на общий результат сочетается с принципом краудсорсинга[6].

Виды заданий и область применения результатов

Совершенствование поисковых алгоритмов

Результаты разметки помогают улучшить качество поиска и эффективно настраивать алгоритмы распределения его результатов. Так, в августе 2017-го года Яндекс представил новый поисковый алгоритм «Королёв», при создании которого для обучения нейронных сетей использовались оценки толокеров. За два с лишним года существования сервиса они дали около двух миллиардов оценок, которые позволили разработчикам значительно усовершенствовать свой алгоритм[7].

Развитие машинного обучения

Чтобы машина поняла, как решать ту или иную задачу, необходимо показать ей огромное количество примеров, как положительных, так и отрицательных[8]. Пользователи сервиса Яндекс.Толока в числе других задач могут получать и задания по описанию объектов, определённых компьютером на изображении. Например, на фото помечены объекты, которые смог определить искусственный интеллект, но для применения этих данных в деле требуется точно знать, что это за объекты, чтобы обучить искусственный интеллект по массе таких определений человеком. Который, в свою очередь, получит за такую работу вознаграждение.[2] Кроме того, в Толоке производят проверку автоматически полученных черновиков словарных статей для Яндекс.Переводчика.[9]

Аудит и маркетинговые исследования

Проверка качества работы интернет-магазина, службы доставки, написание отзывов о продуктах и услугах. Например, в 2017 году пользователи Толоки принимали участие в проверке качества работы сервиса возврата товара на Яндекс.Маркете. Подобные эксперименты позволяют контролировать качество работы сервиса и выявлять слабые места, над которыми в дальнейшем будет проведена работа по улучшению и устранению выявленных проблем.[10] В другом проекте пользователям предлагалось написать отзыв на товар из популярных категорий и снабдить его собственными фотографиями[11][12].

Выбор дизайна и названий новых продуктов и сервисов

Ответы на вопросы, связанные с выбором наиболее удачного названия и дизайна для нового продукта или сервиса[13], личными или потребительскими предпочтениями пользователей. В одном из таких опросов толокеры выбирали название для голосового помощника Яндекса[14]. Целью задания было — определить черты характера девушки с тем или иным именем. Для опроса взяли как нужные характеристики так и совсем неподходящие, и стали спрашивать: „Если у девушки вот такое имя, то она скорее добрая или агрессивная?“. С большим отрывом в опросе победило имя «Алиса».[15]

Вознаграждение и вывод средств

Задания в Толоке оплачиваются — сумма, которую можно заработать, указана рядом с заданием[8]. Для вывода средств можно воспользоваться системами: ЮMoney (Бывшие Яндекс Деньги), PayPal, Qiwi. На этапе отладки процессов со стороны Толоки вывод денег может занимать от нескольких минут до месяца[6].

Мобильные приложения

Для решения задач, которые требуют работу «в поле» (например, пойти по адресу и проверить актуальность информации об организации), существует мобильная версия Толоки[6]. Сервисом разработаны два приложения — для Android и iOS.

Пользователи

Пользователи Толоки, или толокeры — люди, которыe за вознаграждeниe выполняют задания по тeстированию и улучшeнию систeмы на краудфандинговой площадкe Яндeкс.Толока[16]. В настоящее время в Толоке около 4 миллионов зарегистрированных пользователей[17] из России, с Украины, из Белоруссии, Казахстана, Узбекистана, Турции, Франции, Индонезии и других стран[18], которые выставили более 2 миллиардов оценок[5]. В 2018 году в проектах в «Толоке» поучаствовало больше миллиона людей[17]. Большинство толокеров — это молодые люди до 35 лет (как правило, студенты технических вузов или мамы в декрете).[6] В основном исполнители рассматривают Толоку в качестве дополнительного источника денег, хотя многие отмечают, что им нравится выполнять полезную работу, делать интернет чище.[6] В 2017 году интернет-холдинг Яндекс наградил 25-лeтнего челябинца Илью Михалeнко за наибольший вклад в совeршeнствованиe поисковой системы.[19] На цeрeмонии запуска нового алгоритма поиска чeлябинцу вручили статуэтку в видe ракeты как символа того, что вводимыe работниками Яндекса инновации сопоставимы с полётами людeй в космос.[1]

Заказчики

Все задания в Толоке размещают Заказчики. Основные направления использования «Толоки» внутри проектов «Яндекса» — это сбор и обработка данных для проектов, связанных с машинным обучением, речевыми технологиями, компьютерным зрением, умными алгоритмами «Поиска» и т. д., модерация контента (разговоры в «Яндекс.Картах»), полевые задания (актуализация данных об организациях в «Справочнике»), оптимизация внутренних бизнес-процессов (поиск публикаций в соцсетях, разметка упоминаний Яндекса по тональности на позитивные и негативные). Поскольку над задачей одновременно работают как минимум сотни, а то и тысячи толокеров, результаты готовы в худшем случае на следующий день[2].

Исследования в Толоке

Толока — это не только инструмент для решения прикладных задач, но и площадка для научных исследований в разных предметных областях. В мае 2019 года команда сервиса начала публиковать наборы данных для некоммерческих, академических целей, чтобы поддержать научное сообщество и привлечь исследователей в Толоку. Датасеты могут быть интересны исследователям разных направлений: для лингвистических исследований, для задач компьютерного зрения, для тестирования моделей агрегации вердиктов исполнителей и обучения чат-ботов[20].

Критика

Для выявления и изъятия ЛГБТ-книг интернет-издательство Ridero использовало нейросеть, обучавшуюся с помощью «Толоки», чьим пользователям предлагали прочитать текст и указать, одобряется ли в нем «существование лесбиянок, геев, бисексуалов и трансгендеров», смена пола, зоофилия, некрофилия, идеи чайлдфри или инцест. В пресс-службе «Яндекса» сообщили, что отозвали это задание, сочтя его оскорбительным.[21]

Примечания

  1. 1,0 1,1 Яндeкс назвал своим лучшим толокeром житeля Чeлябинска, АН "Доступ" (23-08-2017).
  2. 2,0 2,1 2,2 Александр Лычавко. «Зимой выхлопные газы кажутся лидару стеной». Как в минском офисе «Яндекса» разрабатывают беспилотники, dev.by (15-01-2018).
  3. Дмитрий Шихов. Uber в ритейле: как это работает, Rusbase (17-01-2018).
  4. Алексей Берилло. Конференция Nvidia GTC 2017 Europe: первым делом автопилоты, ixbt.com (23-10-2017).
  5. 5,0 5,1 Роман Рожков. «Яндекс» подключил «Королева» к поискам, Комерстантъ (23-08-2017).
  6. 6,0 6,1 6,2 6,3 6,4 TolokaTeam. Яндекс.Толока. Как люди помогают обучать машинный интеллект, habrahabr (20-07-2016).
  7. Денис Сухов. Компания «Яндекс» представила новый поисковый алгоритм «Королев», Комсомольская Правда (22-08-2017).
  8. 8,0 8,1 Иван Кущ. Нейросети, космос, человек: «Яндекс» представил новый поиск, Будь мобильным! (23-08-2017).
  9. Екатерина Еникеева. Как робот-переводчик находит и выучивает новые слова, N + 1 (30-01-2018 г.).
  10. «Яндекс» запустил эксперимент «Контрольная закупка на Маркете», retail.ru (13-02-2017).
  11. В товарных отзывах на "Маркете" появятся фото, oborot.ru (05-04-2017).
  12. «Яндекс.Маркет» предложил пользователям писать отзывы к товарам за деньги, Афиша daily (20-02-2017).
  13. Саша Море. Дизайн продукта от начала до конца, vc.ru (02-02-2018).
  14. Василий Волнухин. Директор Яндекса по технологиям: программисты из России – это уже давно серьезный бренд (13-02-2018).
  15. Daria Khokhlova. Как «Яндекс» создавал «Алису», vc.ru (10-10-2017).
  16. Чем жила Челябинская область: главные новости недели, АН "Доступ" (27-08-2017).
  17. 17,0 17,1 Татьяна Петрущенкова. «Мы хотим монетизировать экспертизу в краудсорсинге», Rusbase (08-04-2019).
  18. Давид Нармания. Двадцать лет спустя: как "Яндекс" стал не только поисковиком, РИА новости (23.09.2017).
  19. Челябинец стал лучшим тестером Яндекса, ГТРК “Южный Урал” (23-08-2017).
  20. Яндекс открывает датасеты Толоки для исследователей. habr.com. Дата обращения: 2 июля 2019.
  21. Чернокнижники. Как закон о «пропаганде» ЛГБТ, вступивший в силу неделю назад, уже изменил издательский рынок, Медиазона (12 декабря 2022).

Ссылки