Монополизация машинного обучения

Появление монополий почти всегда идёт во вред, но до всеобъемлющей цифровизации у людей оставались варианты защиты от шантажа отбором товаров или услуг.

С переводом жизни в цифру, средств защиты остаётся всё меньше, отказ от цифровых услуг откатывает уровень жизни на неприемлемые для большинства позиции.

До расцвета машинного обучения проблема IT монополий с трудом, но решалась созданием альтернативного ПО. Его авторами могли выступать как небольшие предприятия, так и сообщества энтузиастов, ратующие за свободное и открытое ПО.

Сначала альтернативный софт можно было создавать в одиночку. Затем группами всё большего размера.

Стоимость разработки росла, но альтернативы продолжали появляться, поскольку основная стоимость производства ПО определялась оплатой труда разработчиков. Люди всегда могут затянуть пояса ради идеи или будущего дохода.

Machine Learning, в его текущем виде, меняет расклад.

State of the art софт начал требовать не только компетентных специалистов, но и бюджет на сбор данных и аренду железа. Позволить себе такое удовольствие могут только корпорации, правительства развитых стран и стартапы, которые те спонсируют.

Какими бы мотивированными и талантливыми не были разработчики альтернативного ПО, они не могут получить стабильный доступ к вычислительным ресурсам и данным необходимого масштаба. Исключения есть, например, университеты, но это тот случай, когда исключения подтверждают правила.

Настолько мощная зависимость возможностей ПО от бюджета создаёт положительную обратную связь, которая ведёт к полной монополизации рынка ПО, а значит и всех сфер нашей жизни.

Купировать этот риск, на сколько я вижу ситуацию, может только разработка дешёвых технологий Feature Programming — машинного обучения, если его ничто не заменит.

К сожалению, в области удешевления ML прогресс откровенно слабый. Да и организации вроде FSF не уделяют этой проблеме достаточно внимания.

Теоретически, open source сообщество может организоваться и создавать общедоступный софт сравнительного качества. Например, на базе распределённых вычислений. Вот недавно Яндекс выпустил инструмент для распределённого обучения сетей. Но пока эта перспектива выглядит призрачной — необходимо вытянуть большое количество выигрышных билетов в лотерее «это физически и социально возможно». Общественных проектов распределённых вычислений за всё время было не так уж много.

Плюс, для утилизации общественных ресурсов необходимо быть не только хорошим разработчиком, но и агитатором, заметной публичной персоной. Для многих это сложнее, чем писать крутой код.

Вы уже выбрали корпорацию, нейронки которой будут контролировать вашу жизнь?

Читать далее

2021-08-27

, , , , , , , , ,