ВІКІСТОРІНКА
Навигация:
Інформатика
Історія
Автоматизація
Адміністрування
Антропологія
Архітектура
Біологія
Будівництво
Бухгалтерія
Військова наука
Виробництво
Географія
Геологія
Господарство
Демографія
Екологія
Економіка
Електроніка
Енергетика
Журналістика
Кінематографія
Комп'ютеризація
Креслення
Кулінарія
Культура
Культура
Лінгвістика
Література
Лексикологія
Логіка
Маркетинг
Математика
Медицина
Менеджмент
Металургія
Метрологія
Мистецтво
Музика
Наукознавство
Освіта
Охорона Праці
Підприємництво
Педагогіка
Поліграфія
Право
Приладобудування
Програмування
Психологія
Радіозв'язок
Релігія
Риторика
Соціологія
Спорт
Стандартизація
Статистика
Технології
Торгівля
Транспорт
Фізіологія
Фізика
Філософія
Фінанси
Фармакологія


Педагогические измерения. Шкалирование результатов тестирования

 

Измерение– это процесс определения значения какого-либо признака. Значением может быть не только число, но и имя. Измерение выполняют путем непосредственного наблюдения измеряемого признака или при помощи аппаратуры.

Если в точных науках измерение сводится к сравнению данной величины с однородной ей величиной, принятой за единицу (эталоном), то для психолого-педагогических параметров таких эталонов не имеется. Более того, большинство психолого-педагогических параметров (признаки, качества, свойства, факторы) являются скрытыми (латентными), о которых можно судить лишь косвенно, по их проявлениям, т. е. весьма приближенно.

Педагогическое измерение - это операция присвоения чисел объектам и их свойствам в соответствии с определенными правилами.

Обычно измерение подразделяется на прямое и косвенное. Прямое измерениезаключается в непо­средственном сравнении измеряемого объекта с ка­ким-нибудь нормативом, эталонным измерителем. В педагогических исследованиях оно встречается редко, например при определении физического развития учеников (полнота, рост).

Чаще всего исполь­зуется косвенноеизмерение. Уровень знаний или уме­ний учеников, их моральные качества, дисциплини­рованность и т. п. могут быть измерены только косвенно, на основе работы учеников, их ответов на воп­росы, решения проблемных задач, числа ошибок в диктанте, на основе разных проявлений в поведе­нии.

Задача фактиче­ского измерения различных сторон педагогического явления на сегодняшний день остается неопределенной, так как в учебно-воспитательном процессе выделяется как педа­гог, так и обучаемый, которые могут описываться большим набором свойств.

Шкалирование

Шкала – это средство фиксации результатов измерения свойств объектов путем упорядочивания их в определенную числовую систему, в которой отношение между отдельными результатами выражено в соответствующих числах. В процессе упорядочивания каждому элементу выборки ставится в соответствие определенный балл (шкальный индекс), устанавливающий положение наблюдаемого результата на шкале.

Шкалирование — это операция упорядочивания исходных эмпирических данных путем перевода их в шкальные оценки. Шкала дает возможность упорядочить наблю­даемые явления, при этом каждое из них получает количественную оценку (квантифицируется). Шкали­рование помогает определить низшую и высшую сту­пени исследуемого явления. Выбранная шкала определяет тип получающихся данных и множество операций, которые можно с этими данными осуществлять.

Например, при исследо­вании учебных интересов учеников мы устанавлива­ем их границы: очень большой интерес — очень сла­бый интерес. Между этими границами определяется ряд ступеней. В результате складывается следующая шкала учебных интересов: очень большой интерес (1); большой интерес (2); средний (3); слабый (4); очень слабый (5). Рекомендуется вводить и экстремальные обозначения крайних границ шкалы.

В психолого-педагогических исследованиях применяют классификацию шкал, предложенную С.Стивенсоном, согласно которой четыре основных способа измерения, связанные с различными правилами, называют измерительнымишкалами (номинальная, порядковая, интервальная и шкала отношений).

1. Номинальная шкала (шкала наименований), которую правильнее было бы считать классификацией, а не измерением, делит все объекты на группы по какому-либо признаку (различию). Этим признакам присваиваются определенные числа (код), что создает удобства при дальнейшей обработке экспериментальных данных. Никакого количественного соотношения между объектами в номинальной шкале нет. Такая шкала фактически уже не связана с понятием «величина» и используется только с целью отличить один объект от другого. Например, фамилии учеников, номера автомобилей, телефонов и т.д.

Примеры:

Группы нарушителей дисциплины и их обозначение (кодирование): на уроке - 4, на улице – 2, дома - 6.

В процессе проверки соответствия подготовки выпускников школ требованиям ГОС появляется группа аттестованных и не аттестованных учеников.

2. Шкала порядка (порядковая, ранговая, ординальная) предназначена для измерения (обозначения) степени различия какого-либо признака или свойства у разных объектов. Самым ярким примером порядковой шкалы является пятибалльная система оценки ЗУН учащихся. Для нее разработаны критерии и различные методы измерения. 3начительно труднее применять порядковую шкалу для количественных оценок других качеств личности (в воспитательном процессе). Имеется несколько разновидностей порядкового шкалирования (измерения):

· ранжирование (в ряд),

· группировка (ранжирование по группам),

· парное сравнение,

· метод рейтинга,

· метод полярных профилей.

Ранжирование. Изучаемые объекты располагаются в ряд (упорядочиваются) по степени выраженности какого-либо качества. Первое место в этом ряду занимает объект с наиболее высоким уровнем данного качества, и ему присваивается наивысший балл (числовое значение выбирается произвольно). Затем каждому объекту ранжированного ряда присваиваются более низкие оценки, соответствующие занимаемым местам.

Группировка всей совокупности объектов наблюдения в несколько рангов, достаточно ясно отличающихся друг от друга по степени измеряемого признака.

Пример: учащиеся класса согласно пятибалльной системе оценки ЗУН делятся на отличников, хорошистов и т. д.

Парное сравнение. Учащиеся сопоставляются друг с другом (каждый с каждым) по какому-либо качеству. Если они одинаковы, то каждый получает по баллу. Если у одного этого качества больше, чем у другого, первый получает два балла, второй – 0 (как при спортивных играх по круговой системе). Суммируя полученные каждым баллы, получаем количественное выражение уровня развития данного качества у каждого учащегося (его ранг).

Рейтинг. В этом приеме оценка объекта производится путем усреднения оценочных суждений группой компетентных экспертов. Имея общие критерии оценки (в порядковой шкале, в баллах), эксперты независимо друг от друга (в устной или письменной форме) выносят свои суждения. Усредненный результат экспертной оценки является достаточно объективным и называется рейтингом.

Метод полярных профилей. Этот прием предполагает применение для оценки условной шкалы, крайними точными которой являются противоположные значения признака (например, добрый - злой, теплый - холодный и т. п.). Промежуток между полюсами делится на произвольное количество частей (баллов).

Пример. Оценка степени доверия кандидату на выборную должность дается в полярной шкале:

(Доверяю полностью) 10 – 9 – 8 – 7 – 6 – 5 – 4 – 3 – 2 – 1 (Совсем не доверяю).

3. Интервальная шкала (интервальное намерение) - это такое присвоение чисел объектам, когда определено расстояние между объектами и предусмотрена общая для всех объектов постоянная единица измерения. Иначе говоря, в интервальной шкале вводится единица и масштаб измерения. Нулевая точка шкалы выбирается произвольно. Такая шкала применяется достаточно редко.

Примеры: температурные шкалы; шкалы стандартизированного тестирования интеллекта.

Интервальная шкала – количественная. В ней возможны все арифметические действия над числами, кроме операции деления. Таким образом, в интервальной шкале нельзя определить во сколько раз один объект больше или меньше другого. Например, если ученик ответил правильно на 30 заданий, то это не означает, что он знает вдвое больше ученика, ответившего на 15 заданий теста.

4. Шкала отношений отличается от интервальной только тем, что ее нулевая точка не произвольна, а указывает на полное отсутствие измеряемого свойства. В педагогических измерениях шкала отношений будет иметь место, например, когда измеряется время выполнения того или другого задания (в минутах, секундах и т.д.), количество ошибок или правильно решенных задач.

Допустимые преобразования

Результаты измерений необходимо анализировать, а для этого нередко приходится строить на их основании производные показа­тели, то есть, применять к экспериментальным данным то или иное преобразование. Используемая шкала определяет множество пре­образований, которые допустимы для результатов измерений в этой шкале.

Начнем с наиболее слабой шкалы - шкалы наименований, ко­торая выделяет попарно различимые классы объектов. Например, в шкале наименований измеряются значения признака "пол": "де­вочки" и "мальчики". Эти классы будут различимы независимо от того, какие различные термины или знаки для их обозначений будут использованы: "лица женского пола" и "лица мужского пола", или "girls" и "boys", или "А" и "Б", или "1" и "2", или "2" и "3" и т.д. Следовательно, для шкалы наименований применимы любые взаимно-однозначные преобразования, то есть сохраняю­щие четкую различимость объектов (таким образом, самая слабая шкала - шкала наименований - допускает самый широкий диапа­зон преобразований).

Отличие порядковой шкалы (шкалы рангов) от шкалы наиме­нований заключается в том, что в шкале рангов классы (группы) объектов упорядочены. Поэтому произвольным образом изменять значения признаков нельзя - должна сохраняться упорядоченность объектов. Следо­вательно, для порядковой шкалы допустимым является любое монотонное преобразование. Например, если ученик Иванов на­брал 5 балов, а ученик Сидоров - 10, то их упорядочение не изме­нится, если мы число баллов умножим на одинаковое для всех учеников положительное число, или сложим с некоторым одина­ковым для всех числом, или возведем в квадрат и т.д. (например, вместо "1","2", "3", "4", "5" используем соответственно "3", "5", "9", "17", "102"). При этом изменятся разности и отношения "бал­лов", но упорядочение сохранится.

Для шкалы интервалов допустимоуже не любое монотонное преобразование, а только такое, которое сохраняет отношение разностей оценок, то есть линейное преобразование – умножение на положительное число и добавление постоянного числа.

И, наконец, в наиболее мощной шкале - шкале отношений - возможны лишь преобразования подобия - умножение на положи­тельное число. Содержательно это означает, что, например, отно­шение масс двух предметов не зависит от того, в каких единицах измерены массы - граммах, килограммах и т.д.

Суммируем сказанное в таблице 1, которая отражает соответ­ствие между шкалами и допустимыми преобразованиями.

Из этой таблицы видно, что переход от одной шкалы к другой сопровождается расширением класса допустимых математико-статистических операций, о которых подробно будет рассказано в следующей главе.

Таблица 1.

Шкала Допустимое преобразование (математические и статистические величины, вычисление которых допустимо на данном уровне)
Номинальная Взаимно—однозначные (мода, процентные частоты, доли, корреляция)
Порядковая Строго монотонное (Мода, медиана, квартили, коэффициент корреляции, дисперсионный анализ).
Интервальная Линейное (мода, медиана, квартили, коэффициент корреляции, ранговые критерии, средняя, дисперсия, стандартное отклонение, коэффициент корреляции).
Отношений Подобия (все арифметические операции, все понятия и методы математической статистики).

Как отмечалось выше, результаты любых измерений относят­ся, как правило, к одному из основных (перечисленных выше) типов шкал. Однако получение результатов измерений не является самоцелью - эти результаты необходимо анализировать, а для этого нередко приходится строить на их основании производные показатели. Эти производные показатели могут измеряться в других шкалах, нежели чем исходные. Например, можно для оцен­ки знаний учащихся применять 100-балльную шкалу. Но она слишком детальна, и ее можно перестроить в пятибалльную ("1" -от "1" до" 20"; "2" - от "20" до "40" и т.д.), или двухбалльную (например, положительная оценка - все, что выше 50 баллов, отрица­тельная - 50 и меньше). Следовательно, возникает проблема -какие преобразования можно применять к тем или типам исходных данных. Другими словами, переход от какой шкалы к какой явля­ется корректным. Эта проблема в теории измерений получиланазвание проблемы адекватности.

Для решения проблемы адекватности можно воспользоваться свойствами взаимосвязи шкал и допустимых для них преобразова­ний, так как отнюдь не любая операция при обработке исходных данных является допустимой. Так, например, такая распространен­ная операция, как взятие среднего арифметического, не может быть использована, если измерения получены в порядковой шкале. Общий вывод таков - всегда возможен переход от более мощной шкалы к менее мощной, но не наоборот (например, на основании оценок, полученных в шкале отношений, можно стро­ить балльные оценки в порядковой шкале, но не наоборот).

Кроме того, необходимо подчеркнуть, что проблема адекватности возникает не только при переходе от одной шкалы к другой, но и при выборе шкалы для получения первоначальных оценок - непо­средственной информации об объекте. И здесь опять справедлив вывод о том, что шкала должна быть адекватна - если она слиш­ком мощная, то возможен большой произвол (например, при изме­рении качественных характеристик в шкале отношений), если слишком слабая, то происходят потери информации (например, при измерении количественных показателей в номинальном шка­ле). Например, наверное, нецелесообразно, с одной стороны, оце­нивать результаты решения одной задачи в 100-балльной шкале, а с другой стороны, результаты решения 100 задач в двухбалльной шкале.

 

© 2013 wikipage.com.ua - Дякуємо за посилання на wikipage.com.ua | Контакти