Яндекс.Толока — Или всё же обойдёмся силами пользователя?

Привет. Думаю, каждый из вас уже знает, что Google супер активно эксплуатирует своих Юзверов для обучения Machine learning моделей. Теперь же и Яндекс начал так делать. В общем-то, это очень здорово.

yandex

В общем, если вы последние 10 лет сидели в переще, давайте я вам всё поясню. У гугла есть много инструментов, которые позволяют пользователю улучшить качество продуктов этой корпорации. Самым первым таким инструментом стал Google Translate. Любой пользователь может улучшить перевод на свой язык, присоединившись к программе — https://support.google.com/translate/answer/2534530?hl=en.

Гораздо более назойливым способом попросить помощи у пользователя является Гугл.Капча. Это когда вам показывают 9 картинок и просят выделить дороги, машины и дорожные знаки. Вы же понимаете, что картинки связаны по тематике не случайно? Очевидно, гуглу нужно уметь распознавать объекты из этих категорий для Self-driving cars.

google

На самом деле, в такой калобарации нет ничего плохого. Это Win-Win. Гуглу в любом случае нужно время от времени показать вам капчу. Это мог бы быть рукописный текст (когда Гугл тренировал нейронки для распознавания текста), а могли бы вообще быть какие-нибудь бесполезные для вас Интегралы (есть и такая капча, да-да!). Так что, угадывать Машины — это для вас ещё хороший выбор. А гугл сделает быстрее беспилотные машины — главную мечту моей жизни.

Давайте теперь поговорим За Яндекс. У Яндекса на обучение Моделей был всегда свой собственный Вижн. Хотя Яндекс, как и Гугл, предлагает пользователям улучшить качество Переводчика, раньше на этом всё заканчивалось. Для Обучения моделей классически использовалась платная собственная платформа — Яндекс.Толока.

Краткая справка. Толока — это ресурс, куда вы можете закинуть пачку денег и попросить Людей поразмечать ваши Дата-сеты, либо поделать какую-то другую тупую работу. Это, как rucaptcha, где пользователям платят за распознование капчи. Только Толока — более серьезный уровень, там не кинут с деньгами, и задания могут быть значительно интереснее.

Теперь же, как вы можете видеть на картинке выше, Яндекс начинает использовать пользователей (и капчи для них) для тренировки своих моделей. Правда, пока не ясно, почему на этом примере нам предлагают разгадать, где находятся Юбки, и прочие предметы одежды.

Возможно, Яндекс готовит что-то интересное для нас в области Ритейла (например, в рамках совместного со Сбером проекта — Маркетплейса Беру.Ру). Я бы вообще был супер рад, если бы можно было, например, загрузить яндексу все мои физические данные, и чтобы мне подобрались всякие футболки и штаны. Я бы нажал одну кнопку, и получил мешок одежды. И не пришлось бы идти в этот ужасный магазин тряпок. А вы бы были готовы разгадывать Капчу за такую Фичу?

Категории: О жизни