Что общего между школьными учителями и борцами сумо?

В данном случае все необходимые для изучения материалы предоставили сами общественные школы Чикаго. Они разрешили доступ к ответам на вопросы теста всех учеников от третьего до седьмого класса с 1993 по 2000 год. Это примерно тридцать тысяч учеников каждого класса в год — более семисот тысяч наборов ответов теста и около ста миллионов отдельных ответов. Полученные данные, объединенные по классам, включали ответы каждого ребенка на вопросы тестов по чтению и математике. (Сами листочки с ответами задействовать не удалось, поскольку они уничтожаются вскоре после окончания каждого теста.) Данные также включали сведения о каждом учителе и демографическую информацию по каждому ученику. Содержали они и результаты предыдущих и последующих тестов, доказавших свою важность для определения мошенничества учителей.

Теперь можно было составлять алгоритм, способный выделить из этого массива данных самое главное. Итак, каким образом можно определить классы, учителя которых мошенничают?

Первая вещь, которую нужно искать, — необычные конструкции ответов в отдельно взятом классе. К примеру, это могут быть блоки идентичных ответов большого количества учеников, особенно на сложные вопросы. В то же время здесь просто необходим избирательный подход. Если десять отличников (что доказали предыдущие и последующие тесты) правильно ответили на первые пять вопросов (обычно самых простых), это не считается подозрительным. Но если десять двоечников правильно ответили на последние пять вопросов (самых сложных), это должно вызывать сомнения. Еще одним сигналом будет необычная компоновка ответов любого ученика —например, правильные ответы на сложные вопросы и неправильные на простые. Это особенно подозрительно на фоне тысяч учеников из других классов, которые отвечали на тот же тест примерно одинаково и предсказуемо. Более того, алгоритм определяет класс, результаты учеников которого были гораздо хуже во время предыдущих и последующих тестов. Конечно, резкий скачок успеваемости в один год можно приписать хорошему учителю, но когда он так же резко обрывается, высока вероятность, что он был вызван искусственно.

Теперь давайте рассмотрим ответы, которые дали ученики двух шестых классов школ Чикаго на вопросы идентичного теста по математике. Каждая строка представляет ответы одного ученика. Буквы a, b, c и d обозначают правильные ответы, а цифрами отмечены неправильные, причем 1 соответствует а , 2 — b и так далее. Нуль обозначает отсутствие ответа. В одном из этих классов учительница явно жульничала, а в другом — нет. Попробуйте определить мошенничество сами, но хотим сразу предупредить, что сделать это невооруженным глазом не так уж просто.

Класс

А

112a4a342cb214d0001acd24a3a12dadbcb4a0000000

d4a2341cacbddad3142a2344a2ac23421c00adb4b3cb

1b2a34d4ac42d23b141acd24a3a12dadbcb4a2134141

dbaab3dcacb1dadbc42ac2cc31012dadbcb4adb40000

d12443d43232d32323c213c22d2c23234c332db4b300

db2abad1acbdda212b1acd24a3a12dadbcb400000000

d4aab2124cbddadbcb1a42cca3412dadbcb423144bc1

1b33b4d4a2b1dadbc3ca22c000000000000000000000

d43a3a24acb1d32b412acd24a3a12dadbcb422143bc0

313a3ad1ac3d2a23431223c000012dadbcb400000000

Перейти на страницу: 2 3 4 5 6 7 8 9 10 11 12