© Сучкова Ольга, группа э620 экономического факультета МГУ им. М. В. Ломоносова
За 30 лет исследований, посвящённых сфере образования, были созданы модели, оценивающие сравнительную эффективность школ. Наиболее популярными являются «многоуровневые модели» (Multilevel Models - MLM), поскольку они позволяют анализировать данные с иерархической структурой, с двумя и более «уровнями» (например, ученики и школы). Однако, несмотря на свою сложность, MLM не объясняют причинно-следственные связи исследуемых явлений. В таком случае альтернативой могут стать агент-ориентированные модели (agent-based models - ABM), учитывающие взаимодействия индивидов друг с другом и с внешней средой (например, учеников в классе и вне школы). Авторы статьи ( Salgado, Marchione and Gilbert) оценивают эффективность школ с помощью MLM, затем предлагают объяснения с помощью ABM и сравнивают полученные результаты.
Применение MLM основано на предположении, что достижения учеников могут быть обусловлены двумя эффектами (на двух «уровнях»): характеристиками самих учеников (независимо от школы) и эффектом школы. Рассматриваются две версии MLM:
1) Простая модель с неслучайными коэффициентами:
yij = β0 + β1xij + uj + eij, (1)
где yij - зависимая переменная (результат), xij - объясняющая переменная (предыдущие достижения учеников), индекс i соответствует ученику, j – школе, β0 , β1 – оцениваемые коэффициенты модели, uj ~ N(0,σu2) - индивидуальный эффект школы (организация, качество преподавания), eij ~ N(0,σu2) – случайная ошибка, причём uj и eij не коррелируют.
2) Модель со случайными коэффициентами:
(2),
которая строится в предположении, среднее значение зависимой переменной (β0ij) может состоять из постоянной части, эффекта школы и случайной ошибки, а коэффициент при регрессоре (β1j) - из постоянной части и случайного эффекта школы.
Наиболее важной представляется группового эффекта (эффекта школы), определяемая как отношение «дисперсии эффекта школы» к общей дисперсии:
(3)
В расчётах использовались данные проекта органов образования Лондона по оценке младшей школы (The London Education Authority's Junior School Project) об успехах детей в математике в течение трёх лет. Данные имеются по 887 ученикам из 48 школ.
Переменные:
-
School ID – идентификационный номер школы (от 1 до 48);
-
Social class – фиктивная переменная, принимающая значение 1, если отец ребёнка – работник умственного труда, 0 – иначе;
-
Gender – пол ребёнка (1 – мальчик, 0 – девочка);
-
Math3 - результат теста по математике на третьем году обучения;
-
Math5 – результат теста по математике на пятом году обучения (зависимая переменная).
По результатам оценки модели (2), 12% дисперсии объяснялось эффектом школы. После проведения теста на надёжность группового среднего в выборке были оставлены 22 школы. Для них были оценены 4 модели:
-
Модель 0 – базовая – содержит только случайные групповые эффекты;
-
Модель 1 - содержит предыдущие результаты ученика (Math3) и случайные групповые эффекты;
-
Модель 2 - Модель 1 + пол и социальный класс;
-
Модель 3 – предыдущие результаты, пол, социальный класс, но коэффициенты наклона случайные.
По критериям Акаике, Шварца и логарифмическому правдоподобию выбор был сделан в пользу Модели 3. результаты оценки представлены в таблице:
Table 1: Parameters of Random Slope Model for Maths Attainment in Year 5 | |||
| |||
Parameters (Outcome Variable: Math 5) |
|
|
|
|
|
Random Effect Parameters
| |
St. Dev. (σ) |
Intercept (u0j) |
6.04 | |
|
Math 3 (u1j) |
0.14 | |
Cov. (σu01) |
Math 3 * Intercept |
–0.98 | |
|
Residual (eij) |
5.17 | |
|
|
Fixed Effects | |
|
|
Estimate |
St. Error |
Coefficients (βn) |
Intercept (β0) |
12.65*** |
1.79 |
|
Math 3 (β1) |
0.60*** |
0.05 |
|
Nonman (β2) |
1.17* |
0.53 |
|
Boy (β3) |
–0.02 |
0.44 |
Note: *** = p<0.001, ** = p<0.01, * = p<0.05
Значимыми на 5% уровне оказались константа, результаты теста по математике и социальный статус. Модель обладает достаточно хорошими характеристиками для прогнозов. В качестве пример берётся мальчик из школы № 32, с результатом предыдущего теста в 22 балла, отец ребёнка не работник умственного труда. Прогнозный балл за тест на 5-м году обучения равен 29,5 балла.
На Рисунке 1 представлена зависимость (из Модели 3) результата теста по математике на 5-м году обучения в зависимости от результата 3-го года по 22 школам (для каждой школы наклон линии разный):
Figure 1. Scatterplots for each of the 22 schools
Однако MLM не позволяют судить о причинно-следственных связях, поэтому авторы далее предлагают использовать агент-ориентированную модель, введя две предпосылки:
1)Изучение метематики – процесс из 1 000 уроков с момент поступления в школу до написания теста в 5-й год обучения, причем тест Math3 пишется, когда пройдена половина уроков.
2) Обучение зависит от процесса социализации в школе – вхождения в устойчивые группы школьников (кто с кем общается в классе). Устойчивой считается группа, члены которой не хотят ее покинуть.
Для моделирования групп были введены три параметра толерантности:
-
образовательная – принятие детей с иным уровнем учебных достижений;
-
половая – принятие детей противоположного пола;
-
социальная – принятие детей из другого социального класса.
Возможные уровни толерантности 0,3, 0,5, 0,7 и 0.9. На Рисунке 2 представлены группы в школе №32 с уровнем образовательной, половой и социальной толерантности 0,9, 0,3, 0,9. В этой школе образовалось 15 групп. Мальчики обозначены тёмно-серым, девочки – светло-серым. Квадраты – низший социальный класс, круг – высший. Цифры рядом с фигурами – результаты теста Math3.
Обозначив k – номер стабильной группы, авторы вводят следующие показатели:
, где Math3k – средний результат теста по математике в k-той группе,
, где - число уроков, прошедших для группы k,
- модельный результат финального теста по математике.
Качество модели оценивается по полусумме отклонений модельных результатов теста Math5 в школе j от реальных результатов:
Figure 2. Simulated Students' Social Network in School #32.
Для школы № 32 показатель d32=2.231, то есть средний модельный результат теста по математике отличается от реального на 2.231 балла.
Сравнение точности MLM и ABM для разного числа групп и разного уровня толерантности представлено в следующей таблице:
Table 2: Calibration Results | |||||||
|
|
|
|
|
Tolerance Levels | ||
School Id |
Num. Pupils |
MLM (dj) |
ABM (dj) |
Final Num. of Groups |
Edu. |
Gender |
Occ. Class |
1 |
25 |
2.88 |
3.36 |
13 |
0.90 |
0.50 |
0.30 |
4 |
24 |
2.26 |
3.12 |
12 |
0.90 |
0.90 |
0.50 |
5 |
25 |
1.53 |
2.26 |
12 |
0.90 |
0.70 |
0.90 |
8 |
26 |
1.41 |
2.82 |
12 |
0.90 |
0.70 |
0.30 |
9 |
21 |
1.67 |
2.91 |
12 |
0.90 |
0.70 |
0.30 |
11 |
22 |
1.21 |
3.10 |
12 |
0.90 |
0.30 |
0.70 |
12 |
19 |
3.03 |
3.55 |
12 |
0.90 |
0.50 |
0.30 |
20 |
28 |
1.60 |
2.62 |
12 |
0.90 |
0.30 |
0.70 |
22 |
18 |
2.18 |
3.63 |
10 |
0.90 |
0.30 |
0.70 |
23 |
21 |
1.43 |
3.19 |
12 |
0.90 |
0.90 |
0.50 |
25 |
20 |
2.60 |
3.50 |
11 |
0.90 |
0.30 |
0.50 |
26 |
19 |
1.85 |
2.79 |
12 |
0.90 |
0.70 |
0.50 |
29 |
20 |
2.30 |
3.36 |
12 |
0.90 |
0.70 |
0.30 |
30 |
35 |
1.03 |
2.56 |
14 |
0.70 |
0.90 |
0.70 |
31 |
22 |
2.30 |
3.60 |
12 |
0.90 |
0.70 |
0.50 |
32 |
39 |
1.72 |
2.71 |
15 |
0.90 |
0.30 |
0.90 |
33 |
25 |
1.22 |
3.04 |
12 |
0.90 |
0.30 |
0.90 |
35 |
27 |
1.01 |
2.44 |
13 |
0.90 |
0.70 |
0.30 |
41 |
38 |
2.46 |
3.25 |
16 |
0.90 |
0.30 |
0.70 |
45 |
30 |
1.58 |
2.62 |
12 |
0.90 |
0.30 |
0.70 |
46 |
62 |
2.24 |
2.96 |
15 |
0.90 |
0.90 |
0.70 |
47 |
22 |
1.85 |
3.61 |
12 |
0.90 |
0.50 |
0.90 |
Как видно из таблицы, более точные прогнозы дают MLM, однако ABM учитывают возможные причины, влияющие на результаты теста школьников. Авторы статьи отмечают, что знание причинно-следственных связей необходимо для будущих исследований и делают вывод, что данные, полученные по более сложным агент-ориентированным моделям, могут быть включены в состав переменных многоуровневых моделей.
Оригинал статьи: Mauricio Salgado, Elio Marchione and Nigel Gilbert (2014) «Analysing Differential School Effectiveness Through Multilevel and Agent-Based Modelling» // Journal of Artificial Societies and Social Simulation 17 (4) 3.