Yan Lukashin

Карта устарела

Третий за неделю спросили у меня одно и то же. Один — собственник производственной компании, 200 человек. Второй — директор по операциям в банке. Третья — руководитель образовательного проекта в регионе. Все трое дослушали меня про внедрение, про сценарии, про метрики, и в конце спросили почти буквально одинаково:

«Ян, дайте методичку. Регламент. Стандарт. Где это лежит?»

Я отвечаю: его нет. Он не лежит ни в Минцифры, ни в McKinsey, ни в ISO. Потому что устарел бы за квартал.

Они смеются. Я серьёзен.

Это не моя личная позиция и не риторический жест. Это констатация. В апреле 2026 вышел Stanford AI Index Report 2026 — самый цитируемый годовой отчёт по состоянию ИИ. Открывающая фраза отчёта звучит так:

> «the data does not point in a single direction — it reveals a field scaling faster than the systems around it can adapt»

Перевожу: технология растёт быстрее, чем институты вокруг неё успевают адаптироваться. Образование, регулирование, бенчмарки, прозрачность — всё это инфраструктура, которая должна была догнать. И не догнала. Не потому что «они там в Стэнфорде ленятся», а потому что догнать в текущем темпе нельзя.

Это и есть третий зазор в [нашем цикле]: после когнитивного (что происходит с мозгом человека) и [рыночного] (что происходит с экономикой) — системный. Который про институты.

И про то, что внешний стандарт зрелости, на который раньше можно было опираться, исчез как опция.

Четыре слоя институциональной карты

Чтобы говорить предметно, нужно зафиксировать, какие институты вообще должны были догонять. Их четыре.

Образование — формальная система передачи знаний. Школы, университеты, профессиональные курсы. Её роль — готовить людей к технологическому ландшафту.

Регулирование — государственные и надгосударственные правила, которые определяют рамки применения технологии. От законов о персональных данных до AI Act.

Бенчмарки — стандарты оценки самих моделей. Способ для бизнеса понять, какая модель подходит для каких задач.

Disclosure — прозрачность лабораторий, разрабатывающих frontier-модели. Что мы знаем о моделях, на которых строим продукты.

Все четыре — медленные feedback loops. Они эволюционировали для среды, где технологический сдвиг занимал десятилетия. Электрификация фабрик заняла 40 лет. Компьютеризация офисов — 30. Интернет в массы — 15. У ИИ цикл — около двух.

Дальше — что показывают данные по каждому из четырёх слоёв. Цифры из AI Index 2026 и независимых трекеров. Разговор не общий, а по конкретике.

Слой 1: образование

Первый разрыв — самый длинный.

В 2025 году 80% студентов в 15 странах использовали ИИ для учёбы. В США 53% учителей и 54% учеников использовали ИИ. При этом школьную политику по ИИ имеет около половины средних и старших школ — и только 6% учителей называют её ясной. 41% учителей прямо говорят: «не готов преподавать с ИИ».

Это AI Index 2026, базируется на данных RAND American Educator Panels.

Преподаватели вузов — та же картина. Опрос AAC&U / Elon University (ноябрь 2025, n=1057): 68% преподавателей говорят, что их институция не подготовила их к работе с ИИ. 63% считают свежих выпускников «не готовыми» применять ИИ на работе.

Параллельно — обвал классической CS-программы в США. AI-магистратуры выросли на 82% за 2022–2024, AI PhDs — на 22%. А общий computer science упал на 11.2% в 2025–26 учебном году. Это самое сильное падение среди всех направлений.

Что это значит на практическом уровне.

Студент 2026 года, который пришёл в IT-специальность, через четыре года выйдет из университета с навыками, которые сформировались до его поступления. Frontier ИИ за это время сдвинется на 4–5 поколений моделей. Между тем, чему учат, и тем, что есть на рынке, — структурный лаг от 18 месяцев до трёх лет.

Это не «университеты плохие». Это устройство университета. Curriculum review проходит через комитеты. Учебники переписываются годами. Преподаватели сами не имеют compute, чтобы обучать frontier-модели — у них нет ни H100-кластеров, ни бюджета на эксперименты. Пишут о тех технологиях, которые помещаются в их собственный 2022 год.

Только четыре страны мира ввели обязательную AI literacy на уровне K-12: Китай, ОАЭ, Индия, Сингапур. Остальные — обсуждают.

Связь с [моделью эволюции специалиста] прямая: университет 2026 года в лучшем случае готовит к L1 — пользователю. Иногда — к L2 — оператору. Перелом L3→L4, от делегатора к архитектору, происходит за пределами образовательной инфраструктуры. Через частные курсы, корпоративные программы, личные проекты, статьи в блогах. Образование как институт — не догнало.

Слой 2: регулирование

Тут парадокс. Регуляторов стало кратно больше, а зазор всё равно расширяется.

В 2025 году в США внесено 1208 биллов про ИИ на уровне штатов. Из них принято 145 в 38 штатах. На уровне ЕС — AI Act вступает поэтапно, основная волна — август 2026. В мире — 47 стран имеют активное ИИ-законодательство. По данным AI Index 2026, число enforcement actions выросло в 3.6 раза за год.

Цифры впечатляют, пока не смотришь, что именно регулируется.

Большая часть этих законов — про синтетический контент. Deepfakes, выборы, маркировка AI-сгенерированных материалов, защита детей. Это важно, я не спорю. Но это узкие срезы.

Системного внедрения ИИ в бизнес-процессы регулирование почти не касается. Когда юридический отдел использует Copilot для проверки договоров — никакая статья закона про это не пишется. Когда бухгалтерия в среднем бизнесе автоматизирует ввод первички через GPT — регуляторов поблизости нет. Когда саппорт работает через RAG-агентов — это серая зона.

Где регулирование пыталось закрыть системный слой — там получилось дорого. EU AI Act для high-risk систем требует Quality Management System стоимостью до €400K, минимум €50K на старте. Эти правила работают для крупной индустрии. Для среднего бизнеса они недосягаемы по цене.

В России единого федерального закона об ИИ к маю 2026 нет. Действует 123-ФЗ от 2020 года про экспериментальные правовые режимы в Москве. К весне 2025 функционировало 14 ЭПР, каждый своим постановлением. Концепция регулирования вышла в августе 2025, единый закон — в финальной стадии согласования. Полное вступление — 2026–2027 с переходным периодом.

Если ваш бизнес не банк, не нефтегазовый сектор и не госконтракт — на вас по части ИИ напрямую не действует никакой специальный закон. Действует общая рамка: 152-ФЗ о персональных данных, ГК, КоАП. Это регулирование информации в целом. ИИ как новый субстрат в этой рамке не описан.

И главное: доверие к самим регуляторам — низкое. AI Index 2026 фиксирует, что в США доверие к федеральному правительству в части регуляции ИИ — 31%. Самый низкий показатель среди опрошенных стран.

Карта регулирования есть. Территория, которую она описывает — 2022 года.

Слой 3: бенчмарки

Тут разрыв самый быстрый.

Бенчмарки — это стандартизированные тесты, на которых лаборатории сравнивают модели. MMLU, GPQA, HumanEval, SWE-Bench, ARC-AGI, HLE. Когда выбираете модель для продакшна — теоретически смотрите эти цифры. Видите, что у GPT-5 на MMLU 92%, у Claude Opus 4.6 — 91%, и принимаете решение.

Так это работало в 2023 году. В 2026 — сломалось.

AI Index 2026 фиксирует прямой цитатой: «SWE-bench coding scores jumping from 60 to nearly 100 percent in a single year». За 12 месяцев бенчмарк, который в 2024 был жёстким, превратился в saturated. Лидеры — выше 90%. Разница между ними — статистический шум.

Humanity's Last Exam, релиз январь 2025. По AI Index — рост с 8.8% до 38.3% за то время, что отчёт собирался. К маю 2026 — Claude и Gemini уже выше 50% на разных подмножествах теста. Год до того этот бенчмарк позиционировался как «последний экзамен человечества».

ARC-AGI 2 вышел в марте 2025. Стартовая планка — около нуля. Через 13 месяцев — 77% у Gemini 3.1 Pro.

Что это значит для меня как архитектора, выбирающего модель?

Ничего хорошего. К моменту, когда я смотрю на цифры, они уже неинформативны. 92% против 94% на MMLU не говорит ничего о том, как эти две модели поведут себя в моём конкретном workflow. Бенчмарк превратился в шкалу без делений в верхней части.

И вторая цитата из AI Index 2026, ключевая:

> «The frontier is jagged — models that win gold at the International Mathematical Olympiad read analog clocks correctly only 50.1 percent of the time. Headline benchmarks are a poor proxy for how a model will behave on the work you actually care about.»

Фронтир — рваный. Модель берёт золото на International Mathematical Olympiad, и читает аналоговые часы с точностью 50.1%. Случайно угадать — 50%. Карта бенчмарков показывает рост, но в той задаче, которая нужна вам, может быть провал.

Что значит «нужно делать»: внутренние эвалы. Своя метрика на своих данных. Это требует архитекторской позиции — а её, как мы только что выяснили, образование не даёт.

Слой 4: disclosure

Четвёртый слой — самый незаметный, но самый болезненный.

Stanford CRFM с 2023 года ведёт Foundation Model Transparency Index — оценку прозрачности крупнейших ИИ-лабораторий по 100 параметрам. Данные о модели, источниках обучения, методах alignment, безопасности.

В 2024 году средний балл был 58. В 2025 — 41. Минус 17 пунктов за год.

OpenAI потерял 14 баллов. Meta — 29. Mistral — 37. Шесть из тринадцати ведущих компаний имеют ноль баллов в субдомене Model Information — параметры, размер, архитектура, источники модальности.

AI Index 2026 пишет: 80 из 95 «notable models», вышедших в 2025 году, появились без сопровождающего training code. 84%.

Конкретика. GPT-5 System Card (август 2025): нет размера модели, нет training compute, нет dataset composition. Описание router-архитектуры, safety evaluations, и снижение галлюцинаций. Параметры — закрыты.

Claude 4.5 / Opus 4.5 (Anthropic): cutoff раскрыт, общая crawler-политика описана. Параметры, FLOPs, dataset size — нет.

Gemini 3 Pro (Google DeepMind, декабрь 2025): класс архитектуры — sparse MoE — указан. Размер, compute, конкретные источники данных — нет.

Один контраст — Llama 4 (Meta, апрель 2025). Раскрыто всё: 17 миллиардов активных параметров для Scout, 40 триллионов токенов претрейна, 7.38 миллиона GPU-часов на H100-80GB. Но Meta здесь — open weights исключение. Норма индустрии другая.

Сравним с GPT-4 Tech Report 2023: уже тогда OpenAI отказался раскрывать «architecture, including model size, hardware, training compute, dataset construction, training method», ссылаясь на конкуренцию и safety. В 2026 это превратилось в норму индустрии. То, что три года назад требовало отдельного оправдания, сегодня просто опускают.

Бизнес принимает критичные решения с моделью, про которую вы знаете меньше, чем про модель 2023 года. Workflow построен на чёрном ящике, чьё поведение может измениться через минорный апдейт. Никакого технического отчёта, по которому можно было бы предсказать изменение, у вас нет.

Прозрачность падает обратно пропорционально capability. Чем мощнее модель — тем меньше про неё известно публично.

Что это значит

Раньше технология шла в индустрию через институциональный буфер. Лаборатории публиковали; академия осмысляла; регуляторы прорабатывали правила; ассоциации формировали стандарты; McKinsey выпускали best practices. На это уходило 5–10 лет. К моменту, когда средний бизнес прикасался к технологии, у него был контур опор: курсы в университетах, регламенты, проверенные методики.

Этот буфер схлопнулся. Между релизом GPT-4 в марте 2023 и тем, как ChatGPT оказался в каждой второй компании, прошло около 18 месяцев. Стандартные методички за это время не успели даже написать черновик.

Сейчас цикл такой: лаборатория выпускает frontier-модель → через три месяца другая лаборатория обогнала → через полгода появляется первый вменяемый разбор → через ещё три месяца модель снимают с продакшна, потому что вышла следующая. McKinsey пишет лонгрид про предыдущее поколение, когда уже стартовало следующее.

Это и есть «scaling faster than the systems around it can adapt». Структурное описание состояния: ритм технологии и ритм институтов разошлись на порядок.

Из этого следует одна неудобная вещь.

Когда собственник приходит ко мне за регламентом, он не получит его не потому, что я зажимаю ценную информацию. Он не получит его, потому что регламент в смысле «готовый внешний документ» не существует и не может существовать в текущем темпе. И ждать, пока появится, — стратегия отстать.

Возврат к C0–C5

Что делать в системе, где внешнего стандарта нет.

Ответ скучный, как все правильные ответы. Строить внутренний.

[Модель эволюции компаний C0–C5], вокруг которой я строю курс, — это и есть собственная метрика зрелости. Компания, которая держит свой уровень, не зависит от того, успели ли институты догнать. C0 — отрицание. C1 — витринный ИИ. C2 — фрагментированный. C3 — оркестрированный. C4 — агентная операционная модель. C5 — инфраструктурная позиция.

Эта шкала собрана через наблюдение того, как компании проходят путь внедрения. Она описывает поведение — поэтому работает. Она описывает архитектурные паттерны — поэтому не устаревает за квартал.

Это и есть переход от Individual AI к [Institutional AI]. Когда компания перестаёт спрашивать «какая методичка?» и начинает строить свою: что у нас уже работает, что не работает, какие процессы версионируются, какие evals у нас стоят, какие метрики мы отслеживаем.

Это требует архитекторской позиции внутри. Кто-то должен держать рамку. Не обязательно технический директор — иногда это собственник, иногда product owner процесса. Но кто-то один должен быть тем, кто чертит карту, потому что внешней нет.

Те компании, которые в 2024–2025 уже начали этот переход, к 2026 имеют критичное преимущество. Они адаптируются со скоростью технологии. Регулятор как опора им уже не нужен.

Архитектор — это тот, кто чертит

Возвращаюсь к собственнику с регламентом.

Когда я говорю «методички нет», на лице у него обычно сначала недоверие, потом раздражение, потом — если разговор пошёл — облегчение. Облегчение от того, что ждать больше не нужно. Что путь не в том, чтобы найти готовое, а в том, чтобы построить своё. Свою метрику, свой стандарт, свой контур.

Институты не догонят в обозримом окне. Это не их вина. Это устройство feedback loop с шагом в годы, столкнувшееся с технологией с шагом в недели.

Те, кто будут ждать, пока институты догонят, окажутся через пять лет на C1 — независимо от того, сколько ИИ-инструментов они купили за это время. Потому что без внутреннего стандарта зрелости любая покупка — это [витринный ИИ].

Курс [AI Architect] — это сборка такого внутреннего стандарта. Рамка, в которой вы собираете свой регламент. Своя метрика, свой контур контроля, свои evals — потому что внешних нет и не появится в ближайшие годы.

Карта устарела. Архитектор — тот, кто перестал её ждать и начал чертить свою.

Источники и данные

- Stanford HAI, 2026 AI Index Report (Opening Message, цитата «scaling faster than the systems around it can adapt»): https://hai.stanford.edu/ai-index/2026-ai-index-report
- Stanford HAI, Inside the AI Index: 12 Takeaways from the 2026 Report (цитаты про SWE-Bench и HLE, «the frontier is jagged»): https://hai.stanford.edu/news/inside-the-ai-index-12-takeaways-from-the-2026-report
- Stanford HAI, AI Index 2026, Education chapter (данные по K-12 и высшему образованию): https://hai.stanford.edu/ai-index/2026-ai-index-report/education
- Stanford HAI, AI Index 2026, Policy and Governance chapter: https://hai.stanford.edu/ai-index/2026-ai-index-report/policy-and-governance
- Stanford HAI, AI Index 2026, Responsible AI chapter: https://hai.stanford.edu/ai-index/2026-ai-index-report/responsible-ai
- Stanford CRFM, 2025 Foundation Model Transparency Index (декабрь 2025): https://crfm.stanford.edu/fmti/December-2025/index.html
- RAND, AI Use in Schools (2025): https://www.rand.org/pubs/research_reports/RRA4180-1.html
- AAC&U / Elon University, National Faculty Survey on AI (ноябрь 2025): https://www.aacu.org/newsroom/national-survey-95-of-college-faculty-fear-student-overreliance-on-ai-and-diminished-critical-thinking-among-learners-who-use-generative-ai-tools
- NCSL, Artificial Intelligence 2025 Legislation Summary: https://www.ncsl.org/technology-and-communication/artificial-intelligence-2025-legislation
- EU AI Act Implementation Timeline: https://artificialintelligenceact.eu/implementation-timeline/
- 123-ФЗ от 24.04.2020 «Об эксперименте в Москве», КонсультантПлюс: https://www.consultant.ru/document/cons_doc_LAW_351127/
- Концепция регулирования ИИ в РФ (август 2025), CNews: https://www.cnews.ru/news/top/2025-08-20_v_rossii_poyavilas_kontseptsiya
- OpenAI, GPT-5 System Card (август 2025): https://cdn.openai.com/gpt-5-system-card.pdf
- Google DeepMind, Gemini 3 Pro Model Card (декабрь 2025): https://storage.googleapis.com/deepmind-media/Model-Cards/Gemini-3-Pro-Model-Card.pdf
- Meta, Llama 4 model card (апрель 2025): https://github.com/meta-llama/llama-models/blob/main/models/llama4/MODEL_CARD.md

Исследования AI Architect

Актуальные исследования внедрения ИИ в процессы бизнеса и отдельно человека
Friday, April 10
Три зимы. Как ИИ трижды обещал всё изменить — и только с четвёртого раза начал
История ИИ — это три цикла, в которых технология работала в лаборатории, но не становилась бизнес-ценностью. Каждый раз причина одна: Individual AI работал, Institutional AI — нет. Символисты 1960-х пытались перепрыгнуть с уровня моделей сразу в приложения, не имея ни инфраструктуры, ни данных, ни вычислений. Экспертные системы 1980-х — это C2 (фрагментированный ИИ): блестящие решения в отдельных доменах, которые невозможно оркестрировать и масштабировать. В обоих случаях бизнес ставил электрический мотор вместо парового — и не перестраивал цех. Текущий цикл (2022–2026) — первый, в котором все пять слоёв отрасли (энергия → чипы → инфраструктура → модели → приложения) существуют одновременно, а технология дешёвая и встраиваемая. Но большинство компаний по-прежнему на C1–C2: покупают инструменты, не перестраивая процессы. Тот, кто знает историю зим, видит: единственная страховка — переход от инструментов к процессам, от Individual AI к Institutional AI.
Sunday, April 12
Шестой этаж. Почему нейроинтерфейсы — финальный выход из словесной клетки
Bottleneck в работе с ИИ — не качество модели и не качество промпта. Bottleneck — сам факт, что между мыслью и машиной стоит язык. Язык эволюционно отлажен под голосовые связки приматов: канал шириной в десятки бит в секунду, с потерей ~99% исходного многомерного представления. Пока язык — единственный мост, потолок задаёт не модель, а пропускная способность канала. Brain-Computer Interface убирает этот мост: мысль попадает в машину до того, как её приходится сжать в слова. Это не «улучшение интерфейса» — это вычёркивание целого этажа перевода. И это переопределяет архитектора: уже не тот, кто умеет писать спеки, а тот, кто умеет держать чистый внутренний образ. Тренировка внимания становится главным skill следующих десяти лет — и она работает уже сейчас, без всякого BCI.
Хочешь разобраться системно?
AI Architect — программа менторства для тех, кто строит ИИ-системы, а не промпты. От индивидуального использования к институциональному внедрению.
Made on
Tilda