Школа вышла из плоскости: почему одной оценки больше не существует

Образование долго было плоским.

Не в метафорическом, а почти в физическом смысле. Доска была плоскостью. Тетрадь была плоскостью. Учебник был плоскостью. Контрольная работа была плоскостью. Даже школьная или университетская оценка была плоской: одна цифра, один балл, один итоговый знак, в который сжимались понимание, память, аккуратность, логика, самостоятельность, случайность, страх, подсказка, ошибка и иногда просто удача.

Ученик решал пять задач — и получал одну оценку. Студент писал эссе — и получал один балл. Будущий инженер сдавал код — и получал отметку за работоспособность программы. Система делала удобное допущение: если результат выглядит убедительно, значит, за ним стоит соответствующее мышление.

Искусственный интеллект разрушил именно это допущение.

В мае 2026 года Игорь Чириков, исследователь Центра исследований высшего образования Калифорнийского университета в Беркли, опубликовал работу Artificial Intelligence and Grade Inflation. В ней проанализированы более 500 тысяч оценок в крупном исследовательском университете за 2018–2025 годы. Исследование сравнивает курсы с высокой и низкой «подверженностью ИИ» — то есть курсы, где значительная часть заданий связана с письмом, кодом и другими форматами, с которыми генеративный ИИ справляется особенно хорошо. После появления ChatGPT доля оценок A на таких курсах выросла на 13 процентных пунктов, или примерно на 30% относительно уровня 2022 года.

На поверхности это выглядит как очередная история о том, что студенты стали чаще использовать нейросети и получать более высокие оценки. Так эту тему легко свести к разговору о списывании, академической честности, прокторинге, запретах и детекторах ИИ. Но это слишком бедное объяснение.

Проблема не только в том, что студент может использовать ИИ при выполнении домашней работы. Проблема в том, что старая система оценки продолжает вести себя так, будто этого ИИ не существует.

Чириков использует метод «разница в разницах»: сравнивает динамику оценок до и после появления ChatGPT на курсах, где ИИ особенно применим, и на курсах, где его возможности ограничены. В пересказе исследования подчёркивается важная деталь: рост оценок был сильнее там, где домашняя работа имела больший вес в итоговой оценке. Иными словами, эффект проявился именно в тех местах, где преподаватель видит готовый продукт, но не видит процесс его производства.

Это и есть главный разлом.

Старая оценка была оценкой артефакта. Есть текст — оцениваем текст. Есть решение — оцениваем решение. Есть программа — оцениваем программу. Но в эпоху ИИ готовый артефакт всё хуже доказывает, что за ним стоит самостоятельное мышление ученика или студента.

Текст может быть написан машиной. Код может быть создан машиной. Решение может быть подсказано машиной. Презентация может быть собрана машиной. И если образовательная система продолжает оценивать только этот внешний результат, она всё чаще оценивает не обучение, а качество взаимодействия с внешним инструментом.

Причём само по себе это не обязательно плохо. Умение работать с ИИ действительно становится частью современной грамотности. Студент, который умеет поставить задачу модели, проверить ответ, исправить ошибку, адаптировать результат и встроить его в собственную работу, обладает важным навыком. Но это уже другой навык. Его нельзя честно оценивать старой отметкой, которая делает вид, что перед нами просто «самостоятельная работа студента».

ИИ участвует в образовании уже с двух сторон.

Со стороны студента он становится инструментом производства результата: текста, кода, решения, гипотезы, структуры, объяснения. Со стороны школы, университета и преподавателя он должен стать инструментом анализа образовательного процесса. Не автоматическим судьёй, который ставит отметку вместо человека, а аналитическим контуром, который помогает увидеть то, что раньше почти не фиксировалось: ход мысли, тип ошибки, устойчивость стратегии, уровень самостоятельности, качество самопроверки, зависимость от подсказки, способность к переносу.

Именно поэтому простой ответ «надо менять задания» недостаточен.

Да, задания будут меняться. Но они будут меняться не сами по себе. Они подтянутся за новой оценкой. Делать задания, которые невозможно осмысленно измерить, становится всё менее разумно. Если система умеет измерять только правильность ответа, она будет производить задания на правильный ответ. Если система умеет измерять ход рассуждения, она начнёт проектировать задания, где важен ход рассуждения. Если система умеет измерять работу с ошибкой, ошибка перестаёт быть мусором и становится диагностическим материалом. Если система умеет измерять взаимодействие с ИИ, использование ИИ перестаёт быть тайной зоной и становится частью образовательного действия.

В новой системе задание — это не просто упражнение. Это датчик мышления.

Вот здесь начинается настоящая трансформация.

Раньше ученик решил пять заданий и получил одну отметку. Теперь он может решить те же пять заданий, но получить двенадцать показателей: по формализации, логической дисциплине, контролю ошибок, самостоятельности, устойчивости стратегии, работе с подсказкой, качеству объяснения, способности к переносу, уровню рефлексии, характеру взаимодействия с ИИ, динамике после ошибки и степени зависимости от внешнего инструмента.

Одна отметка говорит: «четыре».

Многомерная оценка говорит: «формализация растёт, логика нестабильна, контроль ошибок слабый, зависимость от подсказки высокая, но после разбора ученик способен переносить способ на близкую задачу».

Это принципиально разные языки образования.

И здесь появляется ещё одно измерение — время.

Оценка в одной контрольной точке даёт профиль. Оценка в пятнадцати контрольных точках даёт траекторию. А траектория уже позволяет видеть не просто текущий уровень, а развитие: какие параметры растут первыми, какие блокируют движение, где возникает скачок, после какого типа заданий происходит срыв, какие сочетания метрик предсказывают будущий успех или будущую деструкцию.

Именно в этом направлении сейчас развивается научно-методическая и научно-исследовательская работа, которую мы ведём в рамках образовательного проекта. Уже собираются данные, позволяющие анализировать не только итоговые баллы, но и связи между психологическими паттернами и когнитивными треками: ригидностью, импульсивностью, дефицитами самоконтроля, формализацией, логической дисциплиной, динамикой ошибок и изменением качества решения от работы к работе. В присланной рабочей переписке эта линия уже сформулирована как переход к корреляционным данным между психологическими паттернами и когнитивной динамикой ученика.

Это важно не как внутренняя методическая деталь, а как возможный ответ на общий кризис оценки.

Если ИИ раздувает старые оценки, то новая система должна не просто «ловить ИИ». Она должна понимать, что именно произошло в образовательном действии. Ученик использовал ИИ вместо мышления? Ученик использовал ИИ как тренажёр? Ученик проверил ответ ИИ? Ученик смог объяснить полученный результат? Ученик после помощи ИИ стал решать лучше самостоятельно? Или, наоборот, стал выглядеть сильнее внешне, но потерял внутреннюю дисциплину?

Старая отметка этого не различает.

Она видит только поверхность.

Новая оценка должна работать как образовательная томография. Она не отменяет итоговый результат, но перестаёт считать его единственным доказательством знания. Она показывает слои: правильность, способ, ошибку, самоконтроль, самостоятельность, перенос, динамику, зависимость от подсказки, качество взаимодействия с ИИ.

Именно поэтому исследование Чирикова важно не только для университетов США. Оно показывает симптом, который очень скоро станет общим для всей системы образования. Если оценки растут там, где ИИ легче всего помогает выполнить оцениваемую работу, значит, информационная ценность оценки снижается. Сам Чириков формулирует это как проблему надёжности оценок: генеративные инструменты могут подрывать способность оценок быть сигналом о реальных навыках студента.

Американская дискуссия уже реагирует на это в логике защиты: больше очного контроля, больше прокторинга, больше ограничений. Например, The Wall Street Journal связывает рост A-оценок после появления ChatGPT с тем, что работодателям становится сложнее использовать GPA как простой индикатор качества выпускника. Princeton, по данным WSJ, даже меняет давнюю традицию непроверяемых экзаменов из-за тревоги вокруг ИИ и академической честности.

Но защитная реакция — только первый этаж.

Можно усилить контроль. Можно вернуть наблюдателя в аудиторию. Можно запретить телефон. Можно заставить писать от руки. Можно требовать устную защиту. Всё это частично полезно, но не решает главного вопроса: что именно мы теперь считаем образовательным результатом?

Если образовательный результат — это готовая работа, ИИ будет постоянно нарушать систему.

Если образовательный результат — это развитие мышления, ИИ может стать частью системы измерения.

Виртуальная и дополненная реальность уже вывели обучение из плоскости. Ученик может не только смотреть на схему, но входить внутрь модели, вращать объект, изменять параметры, видеть последствия. Образовательная среда стала пространственной. ИИ добавил к этому аналитическое измерение. Теперь можно видеть не только объект обучения, но и траекторию ученика внутри этого обучения.

Поэтому одной оценки больше не существует.

Точнее, она может существовать административно — в журнале, ведомости, дипломе, отчёте. Но методологически она уже недостаточна. Одна отметка слишком бедна для мира, где образовательное действие стало многослойным: ученик, задание, цифровая среда, ИИ-помощник, преподаватель, аналитическая система, динамика и прогноз.

Новая школа и новый университет будут оценивать не только ответ. Они будут оценивать способ действия. Не только результат, но и изменение. Не только факт использования ИИ, но и качество этого использования. Не только сегодняшнее состояние, но и вероятность будущего роста.

Именно здесь открывается перспектива НИРа: перейти от интуитивного преподавательского наблюдения к строгой системе когнитивных измерений, где каждая работа ученика становится не только проверкой, но и источником данных. Не данных ради данных, а данных, которые помогают преподавателю принимать решения: какую задачу дать дальше, где нужна коррекция, какой дефицит первичен, какой параметр тянет остальные, а какой блокирует развитие.

В этом смысле ИИ не отменяет преподавателя. Он отменяет плоскую роль преподавателя как человека, который просто проверяет готовую работу и ставит балл.

Преподаватель становится архитектором образовательной среды, интерпретатором данных, диагностом мышления и проектировщиком траектории. А ИИ — не заменой преподавателя, а аналитическим инструментом, который помогает увидеть развитие ученика в тех измерениях, которые раньше оставались невидимыми.

Школа действительно вышла из плоскости.

И теперь главный вопрос не в том, как вернуть её обратно к доске, тетради и одной отметке. Главный вопрос — как построить систему оценки, соответствующую новой реальности.

Потому что в мире, где текст может написать машина, код может написать машина и решение может подсказать машина, образование больше не может спрашивать только: «Правильный ли ответ?»

Оно должно спрашивать иначе:

кто здесь думал;
как он думал;
как менялось его мышление;
что сделал ИИ;
что сделал человек;
и стал ли человек после этой работы сильнее.

И если система сможет на это отвечать, то ИИ станет не причиной распада образования, а поводом наконец построить оценку, которая измеряет не поверхность знания, а его глубину.

Изображение сгенерировано нейросетями

Продолжаем разговор во ВКонтакте — обсуждение, споры и позиции.
Подписывайтесь и включайтесь.