Harno изучает возможность использования ИИ при оценивании заданий на э-экзаменах

Представители организующего экзамены Департамента по делам образования и молодежи (Harno) вместе с учеными Таллиннского университета изучают возможности использования при оценивании заданий на э-экзаменах искусственного интеллекта (ИИ). Решение будет принято после того, как такой метод оценивания будет тщательно протестирован, отметила глава языкового отдела Harno Неле Тойме.
На прошлой неделе ученые ТТУ на встрече с представителями Harno пояснили, какие возможности можно предложить для оценивания заданий по эстонскому языку как родному, экзамен по которому с 2027 года планируется проводить в основных школах в форме э-экзамена.
"Обсуждались как технические решения, так и возможные сценарии использования, в том числе то, при оценивании каких заданий можно было бы применять машинное оценивание на основе ИИ. На встрече был дан хороший обзор того, какие шаги необходимо предпринять перед возможным более широким внедрением машинного оценивания", – рассказала "Актуальной камере" Тойме.
Хотя у Harno пока нет четкой позиции, следует ли и как продолжать внедрение оценивания на основе ИИ, по словам Тойме, машинное оценивание могло бы использоваться при различных типах заданий.
"Например, его можно было бы использовать в случае заданий с длинными открытыми ответами, которые оцениваются на основе четкой и заранее согласованной модели. В таком случае ИИ может анализировать содержание ответов и сравнивать его с критериями оценивания", – пояснила Тойме, добавив, что окончательное решение о применении машинного оценивания можно будет принять только после тщательного тестирования, позволяющего убедиться в надежности и прозрачности системы.
По оценке Harno, одним из главных преимуществ машинного оценивания является возможность сэкономить время проверяющих, что позволило бы быстрее публиковать результаты экзаменов. Кроме того, автоматизированное оценивание помогло бы снизить число ошибок, возникающих из-за человеческого фактора, и сделать процесс оценивания более единообразным.
"В то же время машинное оценивание не должно стать единственным способом. Роль человека всегда будет центральной. ИИ будет отводиться роль вспомогательного инструмента", – подчеркнула Тойме.
Чиновники Harno пока не знают, когда такой способ оценивания мог бы быть введен на э-экзаменах, поскольку внедрение подобных решений помимо тестирования предполагает широкое обсуждение с участниками сферы образования, прежде всего с учителями.
Исследование, проведенное учеными Таллиннского университета по собственной инициативе, показало, что оценки, выставляемые за экзамены языковыми моделями, довольно схожи с теми, которые ставят люди.
По словам руководителя исследования, лектора прикладной лингвистики Таллиннского университета Мерилин Арувеэ, языковая модель особенно хорошо подходит для оценивания экзаменационных заданий, при помощи которых проверяется умение использовать исходный текст.
Редактор: Евгения Зыбина





















