LLM агенты всё ещё не подходят для реальных задач

AI агенты показывают результат своей работы программисту (с) ChatGPT & Hieronymus Bosch.

На этой неделе протестил LLM на реальных задачах из своего программирования. Опять.

2025-11-08

, , , ,

Хотите крутой open source проект себе в портфолио?

Запрос ко вселенной на человечный auth proxy (с) ChatGPT & Hieronymus Bosch.

Как промежуточный итог моих мытарств с OAuth2/OIDC могу сказать, что столько текущих абстракций и частичных реализаций, как в современных open source аутентификационных прокси, я не встречал, как-минимум, давно. Может быть даже никогда не встречал.

И вот, конечно, хорошо, что они хотя бы есть и есть из чего выбрать. И ясно, что их делали энтерпрайзные разработчики для закрытия своих очень специфических энтерпрайзных болей, скорее всего, как параллельные проекты к основным продуктам. Но, всё-таки, её-моё…

Если вы вдруг хотите получить крутой open source проект в портфолио, то берите Rust или Go, пилите с нуля небольшой auth proxy с поддержкой OIDC и OAuth2, который тупо работает. Чтобы он был ориентирован не на корпорации с кубернетисами, а на небольшие компании и инди-разработчиков, которым нужно быстро закрыть пробел в фунцкиональности не изменяя код своих приложений. Ситуация когда вы правите код бэкенда, чтобы прокси заработал, — это дичь какая-то.

Вам в ноги кланяться будут :-) тем более, что сейчас OAuth2 резко всем стал нужен ещё больше, так как требуется в Model Context Protocol.

2025-11-07

, , ,

Стрёмная архитектура аутентификации Ory

Tiendil пытается понять как работает Ory (c) ChatGPT & Hieronymus Bosch.

Пожалуюсь вам, так как либо сюда писать, либо в спортлото.

Я тут погружаюсь в тему аутентификации чуть глубже, чем мне хотелось бы, и столкнулся с тем, что сейчас чуть ли не best-practice это со своего auth проксика делать запросы в сторонние сервисы, чтобы наполнить запрос дополнительной инфой для бэкенда.

Например, если есть API, которое доступно одновременно для аутентифицированных и анонимных пользователей, то Ory Oathkeeper (auth proxy) не может добавить заголовок с id пользователя: либо надо закрыть api от анонимных пользователей либо не добавлять заголовок.

Решать советуют через создание своего микросервиса (!): проксик обращется к микросервису (на каждый запрос!) микросервис обращается к Ory Kratos (!) — это хранилка сессий (среди прочего), получает сессию и возвращает инфу для проксика. Т.е. чтобы добавить 1 заголовок, надо делать цепочку из двух запросов по инфре на каждый запрос к api. (или из трёх, в теории Kratos может в базу или кэш сходить).

Это нонсенс какой-то.

2025-11-06

, , ,

Reasoning LLMs are Wandering Solution Explorers

На arXiv появилась интересная статья в пользу того, что современные Reasoning LLM занимаются скорее «случайным блужданием в пространстве решений», чем «систематическим поиском решений».

Основной текст статьи — около 10 страниц довольно простого текста, рекомендую почитать.

Что сделали авторы:

Формализовали понятия «систематического исследования пространства решений» и «случайного блуждания в пространстве решений».
Построили очень простую и показательную модель как эти штуки работают.
На основе этой модели показали, что случайное блуждание можно легко перепутать с систематическим исследованием, если у вас много вычислительных мощностей.
Также показали, что эффективность случайного блуждания очень быстро деградирует, если сложность задачи выходит за рамки доступных ресурсов.
Формализовали проблемы из реального мира в строго определённые задачи со структурированной областью решений.
Протестировали на этих задачах современные LLM и показали, что их поведение скорее напоминает случайное блуждание.

Я скорее согласен с идеей авторов, но не могу утверждать, что статья безупречна. Есть вероятность, что LLM они используют не совсем корректно и задачи формализованы неудобным для них образом.

Однако основная ценность статьи не в финальных выводах, а в отличной формализации процесса поиска решений, концепциях «случайного блуждания» и «систематического поиска», и особенно в упрощённой модели их поведения.

Если вам интересен вопрос «мыслит ли LLM» (и шире — методики поиска решений), рекомендую изучить подход этой статьи, как перспективный угол атаки на проблему.

2025-10-22

, , , ,

Взгляд на управление: Инженерия — это наука — это инженерия

Наглядная иллюстрация инженерного и научного подходов.

Точки зрения на продукт
Цикл проверки гипотез
Что почитать, когда и почему
Нет инструкций для инженерии
Инженерия — это наука — это инженерия

В предыдущем посте мы обсудили, что инженерия — это творческая деятельность, которая не сводится к исполнению инструкций. Поэтому для управления инженерными коллективами необходимо использовать практики, созданные для творческих коллективов.

А что может быть более творческим, чем ~~вокально-инструментальный ансамбль~~ наука?

Поэтому в этом посте я попытаюсь показать, что инженерия концептуально значительно ближе к науке, чем может показаться на первый взгляд. А также, что в современном мире эти дисциплины всё больше сближаются. Я бы даже поставил на то, что граница между ними сотрётся.

2025-10-21

, , , , ,

Нашли эссе: 265

[146]
[137]
[123]
[113]
[66]
[52]
[51]
[49]
[46]
[37]
[36]
[35]
[34]
[32]
[31]
[29]
[28]
[26]
[24]
[24]
[24]
[22]
[21]
[21]
[20]
[18]
[16]
[15]
[14]
[13]
[13]
[13]
[11]
[11]
[10]
[10]
[9]
[9]
[8]
[8]
[7]
[7]
[6]
[6]
[6]
[6]
[6]
[6]
[5]
[5]
[5]
[4]
[4]
[4]
[4]
[4]
[3]
[3]
[3]
[3]
[2]
[2]

Лицензия: CC BY-NC-ND 4.0
Исходники постов: https://github.com/Tiendil/tiendil-org-content
Сайт создан с помощью Brigid
Сайт использует Tabler Icons, лицензированные под лицензией MIT