Как вы знаете, одна из фич моей читалки новостей — автоматическая генерация тегов с помощью LLM. Поэтому я периодически занимаюсь prompt engineering — хочу чтобы теги были лучше, а платить было меньше.
И вот дотюнил я промпты до состояния, когда вроде всё работает, но осадочек какой-то остаётся: правильные теги определяются, но кроме них создаётся ещё 100500 бесполезных, а иногда даже совсем неверных.
Вариантов действий в таких случаях кот наплакал:
На варианты 1 и 2 нет ни денег не времени. Моя текущая стратегия — использовать только готовые ИИ решения, так как в одиночку за отраслью не угнаться. Поэтому пришлось браться за третий.
Дело шло туго, но после недавнего поста про генеративные базы знаний в голове что-то щёлкнуло, задача вывернулась наизнанку, и за утро я накатал новый промп. который пока что показывает себя значительно лучше.
Давайте расскажу в чём была проблема со старым промптом и как её исправил новый.
Продолжаю заметки об ИИ на конец 2024 года.
Сегодня хочу поговорить о подрывной технологии, на которой стоят современные достижения в области ИИ. Или о концепции, или о мета-технологии — как вам будет удобнее.
Скорее всего вы не встречали в интернетах описанную далее логику (за исключением введения про подрывные технологии) — у технарей и математиков может слегка подгореть из-за упрощения и срезания углов. Но это та призма, через которую я смотрю на отрасль, сужу о возможном и маловозможном в ней и так далее. Мой блог — мои правила — мои термины :-D
В общем имейте в виду — это мой личный взгляд, не общепринятый.
Года полтора назад я опубликовал большой прогноз об искусственном интеллекте. Почитайте, если ещё не читали — пока что он хорошо себя показывает.
Недавно решил его дополнить, но большой целостный пост всё никак не выходит, поэтому будет серия заметок.
Начну с прозрачности индустрии: у текущей движухи с ИИ есть несколько крутых особенностей, о которых я хочу поговорить.
Нашёл отличный разбор вглубь закона Гудхарта (когда мера становится целью, она перестает быть хорошей мерой).
Cedric Chin раскладывает закон на составляющие и приводит примеры из практики Амазона, как они работают с ними.
Кратко: всё не так однозначно и не так плохо.
Когда люди оказываются под давлением целевой метрики, у них есть три стратегии поведения:
Например, если у вас есть фабрика, производящая штуки и план по производству штук.
Тогда возможные стратегии ваших сотрудников:
Соответственно, задачи руководителя:
В оригинальном посте есть интересные примеры адаптации Амазон под эти принципы.
Например, они переключились с оптимизации результирующих метрик на оптимизацию входящих метрик через эволюционное уточнение эвристик о них. Потому что входящими метриками сложнее манипулировать, а их влияние на результирующие можно оценить эмпирически.
Утрируя, вместо оптимизации метрики «количество продаж», можно оптимизировать «количество холодных звонков», «количество рекламы», итерационно уточняя формулировки на основе данных о бизнесе.
Для примера вот эволюция метрики для одной из команд Амазона:
- Количество страниц с информацией о товарах
- Количество просмотров страниц с информацией о товарах (вы не получаете очки за создание страниц ненужных вещей)
- Процент просмотров страниц товаров с товарами на складе (вы не получаете очки, если товара нет в доступности)
- Процент просмотров страниц товаров с товарами на складе и готовыми быть доставленными за 1-2 дня
За подробностями рекомендую идти в оригинальный пост.
Приятно пообщались про разработку «Сказки»: историю, сложности, полученный опыт, почему решили останавливать игру в конце 2024.