Эссе о разработке игр, мышлении и книгах

Prompt engineering: строим промпты от бизнес кейсов

Понечки строят промпт (с) ChatGPT

Понечки строят промпт (с) ChatGPT

Как вы знаете, одна из фич моей читалки новостей — автоматическая генерация тегов с помощью LLM. Поэтому я периодически занимаюсь prompt engineering — хочу чтобы теги были лучше, а платить было меньше.

И вот дотюнил я промпты до состояния, когда вроде всё работает, но осадочек какой-то остаётся: правильные теги определяются, но кроме них создаётся ещё 100500 бесполезных, а иногда даже совсем неверных.

Вариантов действий в таких случаях кот наплакал:

  1. Собрать обучающие данные и дообучить модель делать только правильные теги.
  2. Построить цепочку акторов, где один будет создавать теги, а другой — отсеивать лишние.
  3. Попытаться как-то радикально переработать промпт.

На варианты 1 и 2 нет ни денег не времени. Моя текущая стратегия — использовать только готовые ИИ решения, так как в одиночку за отраслью не угнаться. Поэтому пришлось браться за третий.

Дело шло туго, но после недавнего поста про генеративные базы знаний в голове что-то щёлкнуло, задача вывернулась наизнанку, и за утро я накатал новый промп. который пока что показывает себя значительно лучше.

Давайте расскажу в чём была проблема со старым промптом и как её исправил новый.

Далее

Заметки об ИИ в 2024: Генеративная база знаний

Продолжаю заметки об ИИ на конец 2024 года.

  1. Прозрачность индустрии
  2. Генеративная база знаний

Сегодня хочу поговорить о подрывной технологии, на которой стоят современные достижения в области ИИ. Или о концепции, или о мета-технологии — как вам будет удобнее.

Скорее всего вы не встречали в интернетах описанную далее логику (за исключением введения про подрывные технологии) — у технарей и математиков может слегка подгореть из-за упрощения и срезания углов. Но это та призма, через которую я смотрю на отрасль, сужу о возможном и маловозможном в ней и так далее. Мой блог — мои правила — мои термины :-D

В общем имейте в виду — это мой личный взгляд, не общепринятый.

Далее

Заметки об ИИ в 2024: Прозрачность индустрии

Года полтора назад я опубликовал большой прогноз об искусственном интеллекте. Почитайте, если ещё не читали — пока что он хорошо себя показывает.

Недавно решил его дополнить, но большой целостный пост всё никак не выходит, поэтому будет серия заметок.

  1. Прозрачность индустрии
  2. Генеративная база знаний

Начну с прозрачности индустрии: у текущей движухи с ИИ есть несколько крутых особенностей, о которых я хочу поговорить.

Далее

Разбор вглубь закона Гудхарта

Нашёл отличный разбор вглубь закона Гудхарта (когда мера становится целью, она перестает быть хорошей мерой).

Cedric Chin раскладывает закон на составляющие и приводит примеры из практики Амазона, как они работают с ними.

Кратко: всё не так однозначно и не так плохо.

Когда люди оказываются под давлением целевой метрики, у них есть три стратегии поведения:

  1. Они могут работать, чтобы улучшить систему.
  2. Они могут саботировать/исказить работу системы.
  3. Они могут саботировать/исказить данные.

Например, если у вас есть фабрика, производящая штуки и план по производству штук.

Тогда возможные стратегии ваших сотрудников:

  1. Улучшать технологии и процессы, чтобы выполнять план.
  2. Скрывать излишки производства в одном месяце, чтобы приписывать их в другом (саботирование производства).
  3. Забирать готовую продукцию со склада, чтобы повторно положить на конвейер и накрутить счётчик (подделка данных).

Соответственно, задачи руководителя:

  1. Создавать условия, чтобы улучшать систему было возможно, комфортно и выгодно. Например, задавать реальные объективные строки и планы.
  2. Делать сложным подрыв производства.
  3. Делать сложным подделку данных.

В оригинальном посте есть интересные примеры адаптации Амазон под эти принципы.

Например, они переключились с оптимизации результирующих метрик на оптимизацию входящих метрик через эволюционное уточнение эвристик о них. Потому что входящими метриками сложнее манипулировать, а их влияние на результирующие можно оценить эмпирически.

Утрируя, вместо оптимизации метрики «количество продаж», можно оптимизировать «количество холодных звонков», «количество рекламы», итерационно уточняя формулировки на основе данных о бизнесе.

Для примера вот эволюция метрики для одной из команд Амазона:

  • Количество страниц с информацией о товарах
  • Количество просмотров страниц с информацией о товарах (вы не получаете очки за создание страниц ненужных вещей)
  • Процент просмотров страниц товаров с товарами на складе (вы не получаете очки, если товара нет в доступности)
  • Процент просмотров страниц товаров с товарами на складе и готовыми быть доставленными за 1-2 дня

За подробностями рекомендую идти в оригинальный пост.

Сходил в гости в подкаст «Две Столицы — Уютный подкаст IT панков»

Запись подкаста на YouTube

Приятно пообщались про разработку «Сказки»: историю, сложности, полученный опыт, почему решили останавливать игру в конце 2024.