Створення надійних тестів: особистісні опитувальники, розробка завдань







Особистісні опитувальники - широко використовувані методики виміру особистісних якостей, оскільки вони можуть розроблятися так, що їм будуть притаманні багато атрибути ефективних тестів: надійність, дискриминативность і стандартизованность. Однак, в силу природи особистісних змінних, важче за все буває встановити валідність саме цих методик.

Проблеми конструювання особистісних опитувальників

Як і в разі тестів здібностей, якість окремих завдань (питань, тверджень) є визначальним для всього опитувальника, і тому в цьому розділі будуть розглядатися труднощі, що виникають при формулюванні завдань, а також переваги різних типів завдань.

При розробці завдань для особистісних опитувальників необхідно враховувати наступні проблеми, які, якщо їх не обійти, неминуче призведуть до низької валідності тестів.

(1) Установка на згоду (response set of acquiescence). Це тенденція випробуваного не погоджуватися з твердженнями або відповідати на питання "так" незалежно від їх змісту. Найчастіше проявляється, згідно Guilford (1959), коли затвердження (питання) неоднозначні і невизначені.

(2) Установка на соціально схвалювані відповіді (response set of social desirability). Це тенденція піддослідних відповідати на питання тесту так, щоб виглядати "соціально позитивним": якщо можливий "соціально бажаний" відповідь, то досить імовірно, що випробовувані будуть його давати. Ця установка, як показав Edwards (1957), надає, зокрема, вплив на результати тесту ММРI (Minnesota Multiphasic Personality Inventory).

(3) Установка на невизначені або середні відповіді (response set of using the uncertain or middle category). Якщо в опитувальнику представлена середня категорія відповідей, що відображає нерішучість або невпевненість у відповіді (напр., "Не впевнений", "не знаю", або "важко відповісти"), то багато випробовувані схильні до неї вдаватися, як до безпечного компромісу. Це призводить до зниження валідності завдань, оскільки більшість методів аналізу питань грунтується на крайніх значеннях показників.

(4) Установка на "крайні" (розташовані по краях шкали) відповіді (response set of using the extreme response). Ця установка може проявлятися при використанні багатоелементної рейтингової шкали. Деякі випробовувані, незалежно від змісту питань, воліють вибирати крайні відповіді (Vernon, 1964).

(5) Очевидна валідність (face validity) питань (тверджень). Безсумнівно, в тестах особистості необхідна впевненість у тому, що відповіді на питання можуть розглядатися як правдиві. Cattell і Kline (1977) розглядають дані опитування як дані Q і Qi. Дані з першого безлічі розглядаються так, як якщо б вони відображали поведінку випробуваного, дані з другого - як відповідь на окреме питання, відповідь, який або навантажений деяким чинником, або ні, незалежно від того, чи відображає він поведінка випробуваного.

(6) Вибірка з генеральної сукупності питань. У тестах інтелекту і спеціальних здібностей, яке обговорювали в попередньому розділі, відносно легко переконатися в тому, що завдання належать або з високим ступенем ймовірності виглядають належать до неявної для них генеральної сукупності. Лінгвістичні завдання нелегко переплутати з математичними або будь-якими іншими. Однак, в області особливостей особистості і темпераменту все набагато складніше.

Справді, іноді навіть досвідчені і вправні розробники питань (наприклад, Cattell, 1957) бувають здивовані тим, що питання завантажені не тими факторами, для виявлення яких вони були створені, а також тим, що питання взагалі не навантажені жодним із чинників. Ця проблема з точки зору класичної теорії тестів полягає у труднощі визначення конкретної вибіркової сукупності питань. В результаті виникає проблема підбору адекватної вибірки з вибіркової сукупності питань чи тверджень для тесту, а без цього тест не може бути дійсним.

(7) Вибірка з генеральної сукупності піддослідних. Як зазначено вище, в особистісних тестах важче забезпечити адекватність вибірки з вибіркової сукупності, ніж у тестах здібностей. При використанні тестів здібностей зазвичай відома цілком певна категорія осіб (населення), для якої даний тест призначений, і таким чином, по крайней мере в принципі, можна ефективно підбирати вибірки. Однак, в особистісних тестах, на відміну від тестів, що розробляються для піддослідних з тією чи іншою патологією, в ідеалі потрібні вибірки із загальної популяції (тобто всього населення країни), в якій зустрічаються всі можливі показники. Такі вибірки, як показано, повинні бути великими, і їх зазвичай важко отримати.

(8) Проблеми у встановленні адекватного критерію валідності. Існує, як вже докладно обговорювалося в розділі про валідності, значні труднощі в знаходженні адекватного критерію. Наприклад, якщо ми намагаємося виміряти авторитаризм, то будемо змушені покладатися на рейтинги, оскільки немає ніяких інших зовнішніх міряв (на відміну від, наприклад, шкільних іспитів в разі діагностики здібностей). Рейтинги - це неадекватний інструмент, а якби вони підходили, тест був би не потрібен. Аналогічно, якщо існують високоефективні тести авторитаризму, які можуть бути використані в якості критерію валідності, ймовірно, в новому тесті немає необхідності.

Таким чином, ми змушені обмежуватися дослідженнями конструктной валідності, зазвичай базуються на мультивариативном аналізі розроблюваного тесту в порівнянні з іншими змінними, а також дослідженнями спеціальних груп, що мають за припущенням контрольні показники по даній змінної.

Такі основні складнощі, що виникають при конструюванні особистісних опитувальників, і слід чітко їх собі уявляти, перш ніж ви приступите до формулювання питань або тверджень. Дві останні проблеми, хоча вони і є визначальними, виходять на перший план вже після того, як підібрані завдання тесту.


Формулювання питань (тверджень) для особистісних опитувальників

Практично немає необхідності особливо говорити про те, що для тестів особистості має велике значення те, щоб відповіді на питання могли бути об`єктивно і з високою надійністю оцінені. Отже, ми повинні зробити це можливим шляхом розробки форми питань. Нижче наведені форми питань, використовуваних в найбільш відомих анкетах - тих, які виявилися найбільш ефективними на практиці.

(1) Питання з відповіддю типу "так-ні". Такі питання використовувалися автором цієї книги в розроблених ним тестах особистості, AI3Q (Kline, 1971), OOQ і OPQ (Kline and Storey, 1978). Їх легко формулювати, вони зрозумілі піддослідним і відповіді на них даються швидко. Така форма питань особистісних тестів Айзенка. Типовий дихотомический питання: "Чи любите ви засмагати на пляжі?"

(2) Питання з відповідями типу "да -? - немає", "да-затрудняюсь ответить - немає". Це варіант питань на кшталт "так-ні", описаних вище, з додаванням категорії невизначеності, тому що деякі випробовувані стають дратівливими до незговірливими, якщо їх змушують відповідати або "так", або "ні" на питання, у відповідях на які вони не дуже впевнені.

Труднощі з такими питаннями полягає в тому, що ця "середня" категорія дуже приваблива для піддослідних і рідко буває інформативною. Bendig (1959) показав це на прикладі тесту МРI (Maudsley Personality Inventory - ранньої версії EPI, Eysenck Personality Inventory), в якому не робилося різницю між дихотомічної і трихотомической формою питань, і зробив висновок про те, що дихотомічні питання більш кращі, оскільки вони змушують долати небажання робити вибір. З моєї точки зору між запитаннями на кшталт "так-ні" і "так -? - немає" відмінність така невелика, що питання про те, яку форму вибере розробник тесту, стає не більше, ніж справою особистих уподобань. Cattell і його колега використовують трихотомическую форму для деяких з питань в своїх факторних тестах особистості.

(3) Альтернативні завдання (з відповідями типу "правда-брехня"). Ці завдання складаються з тверджень (часто від першої особи), які випробувані повинні відзначити як вірні або невірні для них. Прикладом альтернативного завдання є: "Я ненавиджу втискуватися в переповнений автобус". Це форма тверджень, яка використовується в ММРI. По суті, вона не набагато відрізняється від дихотомічних питань, хоча формулювання їх як альтернативних тверджень, а не як дихотомічних питань, може до деякої міри вплинути на мовну представленість завдання.

(4) Завдання з відповідями типу "подобається-не подобається" (одне слово або фраза). Це досить оригінальна форма завдання, яка в даний час використовується у Grygier (1961) в динамічному тесті особистості (DPI - Dynamic Personality Inventory), тесті, заснованому на шкалі особистісних переваг Кроут (Krout Personal Preference Scale) (Krout and Tabin, 1954). Прикладами таких завдань можуть бути: (1) "ліхтарники" - (2) "коміри з бобрового хутра" - (3) "бас-барабан". Піддослідні мусять чесно вказати, подобається їм запропоноване або не подобається. Grygier і Grygier в своєму керівництві по DPI стверджують, що ці завдання є суто проектними за своєю природою, a DPI - це по суті проективний опитувальник. Однак, так це чи ні, такі завдання не обов`язково повинні бути проектними, і може виявитися, що це надзвичайно корисна, хоча і незвичайна, форма завдань.

(5) Завдання з рейтинговими шкалами. Ці завдання складаються з пропозицій, до яких додаються рейтингові шкали. Cornrey (1970) - найбільш видатний дослідник, котрий використовував ці завдання - віддавав їм перевагу тому, що в них долаються труднощі, пов`язані з коррелирующими дихотомическими завданнями (див. Обговорення далі, в гол. 6), а також тому, що випробуваним вони здаються більш разумнимі- ніж дихотомічні завдання, хоча і може проявитися установка на крайні відповіді (див. вище). Cornrey використовує дві семибальною шкалою, крайніми значеннями яких є: "завжди-ніколи" і "виразно так - безумовно ні", в залежності від формулювання завдання. Типовим прикладом може бути: "Мені подобається бувати з друзями в кафе: завжди, дуже часто, часто, від випадку до випадку, рідко, дуже рідко, ніколи". Очевидною проблемою для цієї шкали є різна інтерпретація індивідуумами термінів частоти.

(6) Різноманітні трихотомической завдання. Насправді це варіанти трихотомической форми питання типу "так-ні" (тип 1 в даному списку). Cattell, наприклад, в тесті 16PF використовує ці завдання, тому що вони більш підходять за змістом щодо деяких тверджень, ніж "так - важко відповісти - немає". Прикладами трихотомії є: "зазвичай - іноді - ніколи", "вірно - не знаю - невірно", "згоден - впевнений-не згоден". Ці варіанти надають велику гнучкість при формулюванні завдань, ніж жорстких форм типу "так-ні" (дихотомическая) або альтернативні.

(7) трихотомической завдання з вибором. Це варіанти типу (6), що дозволяють вкласти в лаконічну форму завдання майже будь-яку думку. У них використовуються три завершальних пропозицію фрази, одну з яких випробуваний повинен вибрати. Ось типовий приклад: "Коли мені нема чого робити, я можу: (а) подзвонити другу, щоб поболтать- (б) зайнятися розгадуванням важкого кроссворда- (в) піти на джазовий концерт". Деякі розробники тестів використовували такі завдання (наприклад, Myers-Briggs, 1962) з двома, трьома і більше варіантами вибору. Вони можуть бути згадані як окрема категорія завдань.

(8) Завдання з вимушеним вибором. У таких завданнях, як уже говорилося вище, випробовувані примушують до вибору того, яке з (зазвичай двох) тверджень точніше можна застосувати до них або більш вірно для них, хоча може бути і більше варіантів вибору. Однак, завдання з вимушеним вибором включені в даний список як окрема категорія не тому, що вони концептуально відрізняються від трихотомических завдань з вибором, а тому, що Edwards (1959) розробив досить багато завдань із вимушеним вибором, які були спеціально сконструйовані в пари, врівноважені по тенденції до соціально схвалюваних відповідей, ніж намагався усунути вплив цієї установки.

(9) Інші форми. Основні типи завдань, описані в пунктах (1) - (8), - це ті, які в основному використовуються в найбільш відомих особистісних анкетах. Всі вони, з точки зору форми (на відміну від змісту), досить легко формулюються, для них існує кілька правил, які буду обговорені, нижче, вони лаконічні, нарешті, прості в роботі, а також для підрахунків.

Очевидно, можливі й інші типи завдань) і в Myers-Briggs Type Indicator (MBTI), наприклад, знаходимо тип завдань, які більш нагадують проективний тест, хоча вони оцінюються об`єктивно. Піддослідні мусять чесно вказати, яке з пари слів привабливіше для них. Ймовірно, їх краще розглядати як варіант завдань "подобається-не подобається" (тип 3 в даному списку).

Cattell і ін. (1970) використовують аналогічні завдання в тесті MAT (Motivational Analysis Test - тест аналізу мотивів), хоча можна було б заперечити, що це завдання об`єктивного тесту, а не тесту особистості-розробка об`єктивних тестів описана в розділі 4.

Все які розглядалися досі види завдань вимагає від піддослідних самостійної роботи. Піддослідні мали відповідати настільки правдиво, наскільки можливо, хоча, як я вже вказував, є такі методи конструювання тестів, в яких передбачається, що це не обов`язково. Деякі завдання в них, хоча за формою і є такими ж, як в наведених восьми пунктах, відрізняються по супроводжуючим їх інструкціям. Так, в особистісному опитувальнику Едвардса (Edwards, 1967) випробувані повинні відповідати на питання завдань так, як ніби вони дивляться на себе з боку (як вони вважають, інші бачать їх). Це, як можна сподіватися, усуває, принаймні частково, тенденцію до соціально позитивним відповідей.

Хоча є й інші типи завдань, які використовуються в особистісних опроскіках, немає ніякого сумніву, що серед наведених восьми типів можна знайти завдання, добре апробовані в практиці тестування особистості. Більш того, фактично немає такого змісту, яке не могло б бути ефективно сформульовано у вигляді завдання одного з цих типів.

Правила для формулювання завдань

Отже, у нас є перелік типів завдань, наведених вище, і тепер слід обговорити деякі прийоми, прийняті розробниками тестів з метою подолати описані вище проблеми.

Більшість з того, що буде сказано, очевидно і виходить із здоровим глуздом. Незважаючи на це, вивчення багатьох опублікованих тестів, а також тестів, які використовуються для внутрішнього підбору кадрів в великих організаціях, переконало автора в тому, що все це повинно бути сказано. Занадто часто розробники тестів, засліплені блискучої методикою аналізу завдань, забувають про те визначальному факті, що тест не може бути краще (але може бути гірше), ніж його завдання. Guilford (1959), особистісні опитувальники якого були серед перших, розроблених за допомогою факторного аналізу (правда, на шкалах, вже добре вивчених за сорок років досліджень), робить кілька припущень, корисних для розробників завдань в тестах особистості. З нашого досвіду, ці правила показали себе як дуже ефективні.

(1) Усувайте можливість проникнення піддослідних в суть того, що вивчається за допомогою даних завдань. Це робиться не заради того, щоб ввести їх в оману, а тому, що якщо випробовувані здогадаються, що деякий завдання призначене для вимірювання риси X, то відповіді відображатимуть їх точку зору по вираженості у себе цієї риси, а не реальний стан справ. Уявлення ж деяких піддослідних про свою особистість можуть бути значно перекрученими. Як стверджує Guilford (1959), ідеальним було б оцінювати випробуваного за рисами, про які він не знає, задаючи йому питання про те, що він знає добре.

(2) Формулюйте зрозумілі, недвозначні питання (затвердження). Це важливо для того, щоб зменшити похибку, що виникає через неправильне розуміння питань. Висока надійність залежить, до певної міри, від цього якості тесту.

(3) Завдання повинні відображати конкретні, а не загальні аспекти досліджуваної області поведінки. Так, завдання виду: "Чи подобається вам спорт?" - є занадто загальним: термін "спорт" - невизначений, як і термін "подобається". Необхідно поставити більш конкретне запитання: "Ви граєте регулярно в будь-яку спортивну гру?" або "Ви регулярно стежте за грою вашої улюбленої спортивної команди?", "Чи стежите ви за результатами перегонів?" На ці питання, відповіді на які навряд чи будуть фальсифікувати або відносно яких реальне поведінка навряд чи зміниться, випробовувані відповідатимуть однаково, коли б ви їх не тестували.

(4) У кожному завданні слід ставити лише одне запитання чи робити тільки одне твердження. Розглянемо приклад: "Думаю, слід змусити чорних і представників інших рас емігрувати". Якщо це завдання призначене для вимірювання расизму, то воно буде поганим. Є расисти (такі, як південно-африканські), які проводять різкі відмінності між чорними і людьми інших рас. Інші вважають всіх, хто не є англо-саксами, що не відносяться до людей. Отже, деякі расисти можуть позитивно відповісти на це питання, тоді як інші - ні (тільки чорних слід примушувати до еміграції). Більш злісні расисти можуть бути готові залишити чорних і представників інших рас, але бачити їх виключно в якості рабів. А, наприклад, німці, які проживають в Англії, знову-таки дадуть "немає", виходячи зі своєї інтерпретації поняття "інші раси" (див. П. 2 вище). Це завдання. явно марно: у нього занадто невизначена формулювання і одночасно задаються два питання. Варто було б дати твердження більш точно: "Думаю, слід змусити негрів емігрувати". Зараз воно більш зрозуміло (вираз "чорні і представники інших рас" замінено на більш точне), і в ньому залишилося тільки одне питання.

(5) Уникайте, наскільки це можливо, слів, що визначають частоту дій. Вони зазвичай настільки суб`єктивні, що вносять велику невизначеність. Це положення прояснять приклади.

Приклад А. "Чи часто вам сняться сни?" Тут все залежить від значення слова "часто". Деякі випробовувані можуть відчувати таке відчуття, що бачити сон раз на місяць - це часто, і дадуть відповідь на питання ствердно. Інші можуть заперечити, що один сон за ніч - це не часто, тому що дослідження показали, що людям сняться три-чотири сну за ніч, і дадуть відповідь "ні". Питання, таким чином, стає безглуздим. Відповіді вказують протилежне тому, що відбувається насправді. Покращений питання буде звучати: "Чи сняться вам сни двічі на тиждень або частіше?"

Приклад Б. "Чи відчуваєте ви іноді безпричинне занепокоєння?" Очевидно, що це питання породжує ту ж проблему, що і попередній. Однак, він ще гірше, оскільки "іноді" буквально означає "частіше, ніж один раз". Отже, практично всі випробовувані змушені, якщо вони відповідають щиро, відповісти на це питання позитивно. Однак, це питання міг би бути дуже корисним, оскільки всім відомо, що люди дійсно розрізняються по частоті безпричинного занепокоєння. Справа не в змісті, а в формі питання, яка не витримує критики. Як же можна більш точно сформулювати питання, в якому частота така важлива? У покращеному вигляді це може виглядати: "Чи відчували ви занепокоєння без особливих причин в останні дві (чотири) тижні?"

(6) Наскільки це можливо, уникайте термінів, виражають почуття. Замість цього, спробуйте уявити завдання в контексті поведінки. Це правило було проілюстровано в пункті (3) вище, в якому завдання було сформульовано конкретніше з метою підвищення надійності при тестуванні після закінчення деякого часу. Для цього слово "подобається" було замінено на "граєте". Важливим для нас тут є те, що випробуваний не вагаючись відповідає, грає він чи ні, а зі словом "подобається" виникає ціла проблема. Кмітливі, високоосвічені, точно виражають свої думки випробовувані можуть довго вагатися у виборі значення цього слова: "Так, їм подобається це, але, ймовірно," насолоджуватися "буде трішки точніше" знаходити задоволення "-так, але ...", - і т.д. Звичайно, і для такого завдання, як у вищому пункті (5), в якому досліджується почуття занепокоєння, ця проблема також існує. Однак, висловлювати це завдання в поведінкової формі, наприклад: "Б`ється чи ваше серце швидко і пересихає в роті без жодних причин?", Здається занадто штучним. Особливість полягає в наступному. Якщо тільки завдання може бути сформульовано так, щоб невизначені слова про почуття могли бути замінені на опис поведінки, це повинно бути зроблено. Коли це неможливо, звичайно ж, варто спробувати скласти завдання, в яких описуються почуття. Їх придатність або непридатність буде виявлено на етапі аналізу завдань.

(7) За допомогою інструкцій забезпечте, щоб випробовувані давали перші приходять на розум відповіді. Не дозволяйте випробуваним довго роздумувати над значенням завдань. Ефективне завдання особистісного тесту, яке дійсно має відношення до поведінки випробуваного, повинно викликати негайну і точну реакцію. В іншому випадку ймовірно, що завдання не виявляються ту область поведінки, яка має суттєве відношення до вимірювання особистісних якостей. Деякі приклади прояснять цей момент.

Приклад А. "Чи подобається вам спостерігати за Щеглов?" Це питання у випробовуваних, за винятком орнітологів, не викличе, ймовірно, нічого, крім сміху над його очевидною ексцентричністю. Більшість людей це просто не цікавить.

Приклад Б. "Чи любите ви хліб з маслом?" Це явно не ексцентричний питання. Багато випробовувані, по крайней мере на Заході, де не бракує в основних продуктах харчування, не будуть відчувати з цього приводу скільки-небудь сильних почуттів, сприймаючи це як даність.

Приклад В (узятий з пробних завдань для розробленого автором тесту А130- Kline, 1971). "Чи дозволяєте ви вашої собаці лизати вам обличчя?" Це завдання було призначено для виявлення порядності, і ключовим відповіддю для нього є "немає". Очевидно, ті люди, у яких немає собаки, дадуть відповідь "ні", але можна заперечити, що часто охайність не є причиною відсутності домашніх тварин. На мій подив, це питання викликало виключно значимі відповіді. Деякі індивідууми, дійшовши до цього питання, відмовлялися зовсім відповідати на питання тесту, кажучи, що все це взагалі отвратітельно- один випробуваний навіть говорив мені, що він ніколи не був так ображений, і ніколи б не допустив подібної гидоти, тощо в тому ж дусі.

Немає ніякого сумніву, що це питання зачіпає щось приховане і пригнічуване. Доречність вищезгаданої інструкції до тесту тепер зрозуміла. Саме перший відповідь, цілком ймовірно, є індикатором певного особистісного якості. Як тільки випробовувані починають роздумувати над питаннями, включаються не тільки захисні процеси, а й свідомі спотворення, такі як бажання справити враження, догодити експериментатору, - все це негативно впливає на результати тесту.

І ось що ще більш важливо: багато завдань не можуть витримати критичної оцінки в основному через цілком виправданого бажання дослідників вкласти занадто багато інформації в коротку форму завдання. Ось чому особливе значення при створенні завдань тестів надається зрозумілості та конкретності.

Можна було б поміркувати над наведеними вище прикладом У, і тоді не було б ніяких проблем. Хтось або дозволяє, або не дозволяє собаці лизати його обличчя. Немає ніяких складнощів у вирішенні того, що: (а) собака є собака-(б) що вона саме ліжет- (в) і що саме вона лиже - обличчя або що-небудь інше. Однак, більшість тестів особистості не є такими однозначними. Між іншим, варто відзначити, що це питання виявилося невдалим і його довелося видалити.

Приклад Г. "Чи бувають у вас яскраві сни?" Цей приклад добре ілюструє наше вказівку. Більшість випробовуваних, ймовірно, зможуть дати негайну відповідь - або "так", або "ні". Однак, при уважному розгляді це питання виявляється неприйнятним. "Врешті-решт, наскільки яскравими можуть бути сни? Мої сни здаються мені яскравими, але це моя суб`єктивна думка. Я дійсно бачу яскраві сни, але я також іноді бачу кілька одноманітні і сірі сни," - такі думки ускладнюють відповіді.

Приклад Д. "У вас багато друзів?" Як і в першому прикладі, на це питання, по міркуванні, надзвичайно важко дати точну відповідь. Проблема знову залежить від значенні певних слів, в даному випадку "багато" і "друзів". З цими труднощами зіткнуться уважні, вдумливі і сумлінні випробовувані. Вони можуть міркувати так: "Думаю, у мене багато друзів, але що значить" багато "? Скільки насправді в середньому друзів мають люди? Без цієї інформації, а також без знання про розкид навколо середнього значення, неможливо відповісти, багато їх у мене, чи ні. "

Хоча всі ці думки безсумнівно правильні, на практиці це питання в багатьох піддослідних викликає автоматичний відповідь. Слово "друзі" теж може породити проблеми. Випробовувані можуть міркувати: "Що таке друг, ніж він відрізняється від знайомого, чи є взагалі будь-які відмінності? Візьмемо А, чи є він мені другом? Деяким чином, нам подобається бувати разом, але якби він мені був потрібен, він був б практично не потрібен. Тепер б ... ", - і так далі.

З цих прикладів зрозуміло, що в інструкціях необхідно просити піддослідних виконувати завдання настільки швидко, наскільки це можливо. Звичайно, не можна уникнути того, що таким інструкціям який завжди йдуть, і в дослідженні нав`язливості, виконаному автором книги, одне з питань, що стосується того, швидко чи випробовуваний вирішується на що-небудь і дотримується цього рішення, ясно показав можливість багатьох різних відповідей, хоча на нього і відповідали ствердно "так".

Це останнє спостереження підводить нас до тієї критики, яка спрямована проти особистісних опитувальників, що ми зараз і обговоримо.

Заперечення: завдання особистісних опитувальників по суті безглузді

Це стає очевидним з наведених вище прикладів Г і Д. Розраховувати на те, що випробовувані-інтелектуали відповідатимуть швидко, - це не тільки образливо для піддослідних (так стверджує Alice Heim у зв`язку з обговоренням деяких тестів інтересов- Heim and Watts, 1966), але більш того, у таких досліджуваних з`являються серйозні сумніви в тому, що такі завдання можуть взагалі що-небудь вимірювати.

На ці критичні зауваження отримано емпіричний відповідь: аналіз завдань будь-якого роду показує, що наше безліч завдань вимірює однорідний чинник, в той час як дослідження валідності демонструють, що ж це за фактор. Той факт, що завдання мають сумнівне значення, стає несуттєвим, якщо відповіді на ці завдання фактично є ефективно Діскрімінатівность або корелюють із зовнішнім критерієм. Вищенаведена критика, хоча і може здатися серйозною, не має, таким чином, великого значення.

Такі правила формулювання завдань, описані Guilford (1959), і вони сприяють забезпеченню того, що підготовлені питання будуть забезпечувати вирішення тих завдань, які стоять перед ними. Автору цієї книги при конструюванні власних завдань для особистісних тестів завжди вдавалося створити надійні і, як я вважаю, валідність методики, коли він прямував з цими правилами. Чи вдалося б йому це без уже відомої нам методології, невідомо.

Усунення впливу установок на відповідь

Крім того, що при розробці завдань слід завжди пам`ятати про перерахованих вище правилах, необхідно, звичайно, послабити, наскільки це можливо, вплив найбільш істотних установок на відповідь. Нижче описано, як це слід робити.

Установка на згоду (acquiescence)

Установки на відповіді (response sets) були визначені Кронбаха (Cronbach, 1946) як стилістична послідовність, яка стимулюється формою відповідей на завдання особистісного опитувальника. Як зазначалося раніше, однією з найбільш істотних є установка на згоду (див. Messick, 1962), тобто тенденція погоджуватися з твердженням незалежно від його змісту.

збалансовані шкали

Messick (1962) стверджує, що збалансована шкала - це один із способів мінімізації впливу установки на згоду. Збалансованої називається така шкала, для якої рівне або приблизно рівну кількість завдань мають ключові відповіді "так" або "ні", "вірно" або "невірно".

Однак, тут заслуговують на увагу два моменти. По-перше, збалансована шкала не усуває повністю тенденцію: установка на згоду все ж може проявитися, але, як показує Knowies (1963), така шкала не дозволить сплутати "мириться" випробуваного з тим, у кого реально високі показники, а це важливо. Звичайно, можна заперечити, що "погоджується" випробовуваний з потенційно високими показниками не буде виявлено при збалансованої шкалою. Якщо це відбувається частіше, ніж в декількох окремих випадках, то наступне дослідження валідності тесту буде приречене на невдачу.

По-друге, спотворює впливу цієї установки на показники по тесту можна уникнути тільки в тому випадку, якщо будуть сформульовані в рівній мірі змістовні, недвозначні і спонукають до певної відповіді завдання, які мають як позитивні, так і негативні ключові відповіді. Якщо ви зможете сформулювати лише дуже невелика кількість завдань з ключовим відповіддю "немає", то ці завдання будуть сприяти низькою валідності шкали. Кілька прикладів пояснять це.

Приклад 1. Розглянемо питання на екстравертірованность: "Вам подобаються вечірки?" Зворотною формою цього питання буде: "Вам не подобаються вечірки?" У цих завданнях стилістичні звороти мови задовільні, тому що прийнято говорити, що вечірки подобаються чи не подобаються. Вони також задовільні, тому що, як це і трапляється, випробуваному з високим показником по параметру екстраверсії подобаються вечірки, а випробуваному з низьким показником - не подобаються. Таким чином, полярність цих завдань ефективна. Однак, часто спроба отримати зворотний форму питання стає джерелом помилок.

Приклад 2. Наступне завдання було створено, щоб виявити задоволення, одержуване від статистики - як стверджують, воно відноситься до рис нав`язливості: "Чи ви одним з тих людей, хто знаходить статистичні дані і таблиці цілком нудними?" Це зворотна форма питання з ключовим відповіддю "немає". Однак, очевидно, (перш ніж перше випробування тесту показало, що це питання не працює), можна не брати до уваги статистику нудною, але і не захоплюватися нею. Таким чином, звернення питань, коли вони відносяться до деяких крайніх проявів у поведінці, швидше за все не дасть результату в силу континуальности, що лежить в основі багатьох відповідей на завдання. Звернення питань зазвичай передбачає дихотомичность відповіді. Іншими словами, якщо відповідь на питання є дихотомічний, то звернення питання для збалансованої шкали можливо-якщо ж використовуються крайні (граничні) значення з континууму, звернення не буде вдалим.

Приклад 3. Аналогічно, можемо розглянути питання про те, чи подобається випробуваним віддавати розпорядження. Зворотній форма питання, така як: "Ви не відчуваєте задоволення, коли вам ставиться в обов`язок віддавати розпорядження?" - не може бути вдалою, тому що можливі випадки, коли заперечення ворожості до розпоряджень, наказів зовсім не означає отримання задоволення від цього. В основі цієї відповіді лежить континуум, а не дихотомія. Це питання не може бути звернений.

Приклад 4. У цьому завданні розглядається акуратність: "У школах сильно перебільшують значення акуратності". Можна стверджувати, що нав`язливо акуратний індивідуум вважатиме, що значення цієї особливості поведінки неможливо перебільшити. Отже, дане завдання було написано так, щоб негативна відповідь справді виявляв досліджувану межу. Таким чином, з точки зору розробки завдань, це життєздатне "негативний" завдання.

У цих прикладах проілюстровані два найбільш важливі моменти в формулюванні завдань з негативними ключовими відповідями: вони можуть бути сформульовані, по-перше, якщо негативна відповідь відповідає реальній поведінці, і по-друге, якщо в основі відповідей лежить дихотомія, а не континуум, як в наведеному вище прикладі 1.


Зрозумілі, недвозначні твердження

Хто має значення в контексті нашої роботи питання було піднято Guilford (1959) при спробі усунути установку на згоду з особистісних опитувальників. Він стверджує, що згода найменш ймовірно тоді, коли завдання зрозумілі, недвумисленни і відносяться до конкретного поведінці. Оскільки ці якості вже були вказані серед тих, які, за моїм припущенням, повинні бути притаманні розробляються завданням, я не буду більше говорити про них, а лише проілюструю це положення кількома прикладами.

Так, питання: "Чи граєте ви на якомусь музичному інструменті?", - є настільки конкретним, що індивідуум мав би мати гранично виражену установку на згоду, щоб ствердно відповісти на це питання, якщо це не відповідає істині. З іншого боку, питання: "Чи подобається вам музика?" - настільки невизначений (в тому, де ж критерій того, що музика подобається?), Що згоду ймовірно буде фактором, що впливає на позитивні відповіді в цьому питанні. В останньому прикладі є дві особливості. Перш за все, зверніть увагу, що дане питання непорівнянний з питанням: "Чи подобаються вам вечірки?" У цьому питанні критерій того, чи подобаються вечірки, відомий кожному: часті відвідування з бажанням і ентузіазмом. Отже, це питання - практично скорочена форма питання: "Чи відвідуєте ви багато вечірок?" Таким чином, для нього ймовірність піддатися впливу установки на згоду менше, ніж для питання: "Чи любите ви музику?"

До цієї особливості відноситься і невизначене твердження "подобається музика". Цей вислів марно в завданні. Так, слово "подобається" може відповідати різноманітним почуттям: від тих, які відчувають великі композитори і виконавці, коли слухають, пишуть чи виконують музику, до почуттів людини, яка любить слухати популярні пісеньки, здійснюючи суботні покупки. Подібно до цього, термін "музика" означає величезне розмаїття різних напрямків: наприклад, джаз, поп, народна музика, рок, бароко, доклассическая, класика, романтизм, модерн, неокласицизм, - а, крім того, може мати відношення до слухання і виконання, так що ідентичні відповіді на питання можуть відображати абсолютно різну поведінку. Наприклад, "так" для випробуваного 1 може відбивати насолоду від співу контр-тенора у ранній поліфонічною венеціанської церковної музиці. А для випробуваного 2 це може відбивати задоволення прослуховування мотивчика типу "Танцюй зі мною", коли він сидить за кермом своєї машини. Будь-яке завдання, в результаті оцінки якого виявляється, що настільки різні області поведінки будуть віднесені до одного і того ж класу, з очевидністю є марним.

Перевірка впливу установки на згоду

До сих пір всі наші зусилля були спрямовані - за допомогою збалансованих шкал і формулювання гранично ясних і конкретних завдань - на зменшення впливу установки на згоду або на те, щоб зробити менш імовірним отримання за рахунок тенденції до згоди високих показників по змінної, для вимірювання якої призначений тест. Однак, як уже говорилося, дія цієї установки можливо навіть при збалансованих шкалах, і далеко не завжди можна створити настільки зрозумілі питання, щоб бути впевненим, що вплив установки усунуто. Тому розроблені методики, призначені для перевірки того, чи була установка на згоду фактором, що впливає на відповіді. Ці методики будуть описані в розділі 6.

Соціально схвалювані відповіді

Edwards (1957) показав на матеріалі із завданнями ММРI, що спостерігається висока позитивна кореляція між ступенем соціальної бажаності тверджень, оценивавшейся експертами, і кількістю реальних соціально схвалюваних відповідей на них випробуваними. Тому він стверджує, що дана установка повинна детермінувати відповіді на завдання і, отже, є основним джерелом невалидности тестів. Хоча, очевидно, неможливо повністю усунути вплив установки на соціально схвалювані відповіді, є різноманітні прийоми, корисні для зменшення її впливу. Ці прийоми описані нижче.

Завдання з вимушеним вибором, підібрані по їх соціальної бажаності

У списку особистісних переваг (Personal Preference Schedule) Едвардса (EPSS) (Edwards, 1959), як ми вже відзначали в обговоренні типів завдань (див. П. 8 на стор.95), завдання складаються з двох тверджень, підібраних по соціальної бажаності, одне з яких випробуваний повинен вибрати. Це радикальне рішення для усунення впливу установки на соціально схвалювані відповіді. Однак, цей метод не отримав підтримки з наступних причин.

(1) Вкрай важко отримати узгоджені затвердження, релевантні й у термінах змісту, яке ми хочемо виміряти {Edwards, 1957). Дійсно, серйозне заперечення проти EPPS - це те, що даний тест є трохи більше, ніж вправою з конструювання тестів, і мало свідчень того, що він вимірює змінні з будь-якої ефективністю (див. Kline, 1979).

(2) Будь-які незначні відмінності в соціальній бажаності між частинами завдань мають тенденцію збільшуватися, коли вони пред`являються разом, як це передбачено в формі вимушеного вибору, що зводить нанівець більшість з зусиль по підбору тверджень.

(3) Експертне оцінювання соціальної бажаності - значне спрощення даного явища. Це стає ясно з того, як виходить середня експертна оцінка соціальної бажаності для кожного завдання. Для цього передбачається, що соціальна бажаність одномерна (хоча a priori це не так). Насправді було б потрібно багатовимірне шкалювання впливу соціальної бажаності за всі завданням, і потім підрахунок показників по окремим вимірам - процедура, яка могла б бути, безсумнівно, рекомендована в світлі наведеного вище пункту (2)! Крім того, як вказує Messick (1960), соціальна бажаність сама по собі припускає значні індивідуальні відмінності: те, що соціально бажано для члена парламенту, майже напевно не є таким для лондонського докера.

Виходячи з цих трьох причин, не рекомендується вдаватися до такого радикального і, мабуть, недостатньо ефективному кроку, як конструювання спарених завдань, підібраних по їх соціальної бажаності.

Уникайте явно соціальних бажаних / небажаних завдань

Існує ряд характеристик і якостей, з якими мало хто захоче погодитися, по крайней мере в середовищі освічених європейців. Вони настільки очевидні, що коли ми проілюструємо їх нижче кількома прикладами тверджень, то вони здадуться явно абсурдними. Ось кілька прикладів тверджень, які є явно соціально бажаними чи небажаними:

(1) Я насилу переношу невдачі: (так, ні).

(2) Я не розумію гумор: (так, ні).

(3) Я постійно брешу: (так, ні).

(4) Я мало сексуальний: (так, ні).

(5) Я сексуальний психопат: (так, ні).

(6) Я не можу контролювати свої емоції: (так, ні).

(7) Я заздрісний і ревнивий чоловік: (так, ні).

(8) Я скупий: (так, ні).

(9) Коли можливо, я ухилявся від роботи: (так, ні).

(10) Я брешу, щоб позбутися клопоту: (так, ні).

(11) Я ненавиджу негрів: (так, ні).

(12) Я в основі своїй антисеміт: (так, ні).

З нашого досвіду розробки тестів, ми були б дуже здивовані, якби будь-який з дванадцяти наведених прикладів виявився прийнятним навіть для дослідницького тесту. Наприклад, для тестів особистості, які використовуються в профотборе, вони будуть абсолютно марними. Уявіть собі твердження (11) в тесті, призначеному для працівників соціального забезпечення, або твердження (12) в тесті, запропонованому людині, що сподівається отримати роботу в фірмі, власником якої є єврей.

Вимірювання соціально бажаних і небажаних рис

Якщо вимірюванню підлягають соціально бажані чи небажані риси, розробки завдань слід уникати прямолінійного підходу, як в перерахованих вище твердженнях. Два приклади пояснять сказане.

Приклад 1. Завдання для вимірювання скупості. Оскільки (див. Твердження 8 вище) прямий підхід не годиться, я стверджував при розробці тесту AI3Q, що скупий людина цілком міг би думати, що містяться в народній мудрості вислови про ощадливість дуже розумні, худа як на менш скупого вони не справили б враження. Отже, я спробував сформулювати завдання наступним чином: "Кожна дитина повинна знати, що ощадливість краще багатства." Схоже, що в цьому завданні відповіді як "так", так і "ні", не мають відношення до соціальної бажаності (не є соціально схвалюються). Дійсно, це питання виявилося вдалим за всіма результатами аналізу завдань.

Приклад 2. Завдання для виявлення мстивості. Мало хто підтвердить твердження: "Я мстивий." Однак, як уже говорилося, мстиві індивідууми зазвичай проектують свою мстивість на інших, тобто діють механізми захисту. Таким чином, я сконструював твердження: "Вчинками більшості революціонерів керує мстива жорстокість." Я подумав, що мало кого з випробовуваних можна було б дійсно зарахувати до революціонерам, так що думки обстежуваних відображатимуть їхні власні захисні реакції і прагнення. Це завдання виявилося вдалим, і я вважаю, що проекція - це механізм, дія якого може бути використано в формулюванні питань, які занадто соціально небажані, щоб задавати їх прямо.

Приклад 3. Завдання для виявлення лінощів. Якщо спиратися на механізм проекції, то можна сформулювати твердження так: "Промисловість сьогодні перебуває в жалюгідному стані, тому що робочі в основному ліниві." Слід зауважити, що якщо це твердження розглядається деякими піддослідними як факт, тобто не "включає" проективний механізм, то аналіз завдань повністю виявить це: питання не буде працювати.

Використання шкали брехні

Деякі автори (наприклад, Айзенк в тестах ЕРI і EPQ) вводять особливу групу завдань для виявлення тих осіб, які схильні давати соціально схвалювані відповіді. Вони складаються з питань, що стосуються незначних проступків, які, на жаль, іноді відбуваються більшістю людей. Який набрав найбільшу кількість балів за такою шкалою розглядається як дає соціально схвалювані відповіді, а тому його показники по тесту можуть бути проігноровані. Хоча Eysenck і Eysenck (1976), виходячи з факторного аналізу завдань тесту EPQ стверджують, що шкала брехні вимірює певну особистісну змінну, для практичного тестування зі значним потоком випробовуваних цей прийом для виявлення установки на соціально схвалювані відповіді дуже корисний.

Ось деякі типові затвердження шкали брехні: "Я ніколи не обманюю" - "Я завжди приходжу вчасно на зустрічі і побачення" - "Я завжди плачу за проїзд на транспорті".

Адекватний аналіз завдань і валидизация тесту

Незважаючи на все сказане, я як і раніше стверджував би, що при відповідному аналізі та відборі завдань під час розробки тесту, при ретельній валидизации тесту, як і у випадку з установкою на згоду, впливом тенденції до соціально схвалюваних відповідей можна знехтувати.

(1) Аналіз завдань. За визначенням, наявність в тесті завдання, провокуючого соціально схвалювані реакції, має приводити до того, що розподіл відповідей на нього буде усунута з посади, тобто не буде відповідати нормальному розподілу. Таким чином, усуненням з тіста завдань з розподілом відповідей, відмінним від нормального, ми позбудемося дії установки на соціально схвалювані відповіді. Більш того, якщо більшість завдань дають нормальне розподіл відповідей і вони навантажені деяким загальним фактором, тоді установка на соціально схвалювані відповіді не може чинити сильний вплив і на інші завдання, пов`язані з того ж фактору. Подібні аргументи наводяться під час аналізу завдань з використанням бісеріальний кореляції результатів виконання кожного завдання із загальним показником по тесту. Таким чином, при адекватному аналізі ті завдання, результат виконання яких схильний до впливу установки на соціально схвалювані відповіді, повинні бути усунені, якщо тільки, через безглузду випадковість, всі завдання, обрані нами для тесту, не виявилися вимірюють цю рису. Можливість виникнення цієї ситуації повинна перевірятися при валідизації тесту.

(2) Валидизация тесту. Більш важливою процедурою, ніж перевірка на тенденцію до соціально схвалюваних відповідей, є валидизация тесту. Якщо ми покажемо, що тест валиден, то тоді не має значення, чи впливає на його виконання установка на соціально схвалювані відповіді, чи ні. Один із шляхів докази того, що тест вільний від дії установки на соціально схвалювані відповіді, - показати при дослідженні валідності, що він не пов`язаний зі шкалою соціальної бажаності Кроуна-Марлоу (Crowne-Marlowe Social Desirability Scale- Crowne і Marlowe, 1964), шкалою , coстоящей з явно соціально бажаних (небажаних) тверджень.

Висновки щодо установки на соціально схвалювані відповіді

Немає сумніву, що установка на соціально схвалювані відповіді може впливати на результати виконання завдань, і, отже, на показники тестів особистості. Незважаючи на це, її вплив може бути мінімізовано. Ось деякі висновки:

(1) Слід всіляко уникати завдань з явно соціально бажаної чи небажаної забарвленням.

(2) Процедура аналізу завдань дозволить усунути ті завдання, відповіді на які явно зміщені в одному напрямку ( "так" або "ні").

(3) Повинна бути завжди продемонстровано валідність тесту, що дозволить остаточно усунути всі завдання, у відповідях на які позначається установка на соціальну бажаність.

(4) Не треба робити так ретельно розробляються заходи обережності проти установки на соціальну бажаність, як це робив Edwards (1957).


Інші установки на відповіді

ТЕНДЕНЦІЯ ПІДТВЕРДЖУВАТИ КРАЙНІ ВІДПОВІДІ

Це тенденція, що позначається в рейтингових шкалах і таких тестах, як, наприклад, тест особистісних шкал Комрея (Cornrey Personality Scales- Cornrey, 1970), тобто тих, в форму завдань яких входять рейтингові шкали. З моєї точки зору, переваги рейтингових шкал (у плані почуття задоволення у тих випробовуваних, які вважають, що на питання краще відповідати в такій формі) зводяться нанівець проблемами, що виникають з тими піддослідними, які схильні підтверджувати крайні відповіді. Для того, щоб не сплутати їх з особами, які мають високі показники по тесту, збалансована шкала вже не допоможе, тому що при такій установці кожен з крайніх пунктів шкали однаково привабливий. Єдиний спосіб уникнути цієї проблеми - не використовувати завдання даного типу. Якщо ж ми з яких-небудь причин змушені використовувати такі шкали, то ретельний аналіз завдань і валидизация змінних тесту, ймовірно, зможуть усунути ті питання (затвердження), які особливо спонукають піддослідних виявляти цю установку.

Як стверджує Guilford (1959), найбільш сприятливим грунтом для прояву будь-яких установок на відповіді є ті завдання, які невизначені, неоднозначні і неконкретні. Значення цього твердження неможливо перебільшити. Формулювання завдань шляхом прямування зазначеним вище правилам дозволить мінімізувати вплив установок. Більш того, ретельна валидизация тесту продемонструє, що вплив цих які деформують чинників незначно. Однак, цей вплив не буде настільки несуттєвим, якщо не будуть вжиті заходи обережності. Стосовно до установок на крайні відповіді можемо рекомендувати уникати використовувати завдання типу рейтингових.

ТЕНДЕНЦІЯ ДО ПІДТВЕРДЖЕННЯ СЕРЕДНІХ ЗНАЧЕНЬ

Безсумнівно, кращий спосіб уникнути прояви цієї установки - це використовувати дихотомічні завдання. Однак, у деяких піддослідних виникають складності при роботі з дихотомическими завданнями. Вони вважають, що на них неможливо відповідати, а тому (тих піддослідних) бажано запровадження деякою середньої категорії відповідей. Дослідження (Bendig, 1959) показали настільки високу кореляцію між дихотомічними і трихотомической завданнями, що ризик прояву побічних явищ, подібних обговорюваному, не виправдовує використання останніх.

Добре сформульовані завдання можуть бути написані так, що вибір середньої категорії не буде привабливим для випробовуваних. Ця категорія відповідей особливо приваблива тоді, коли обидва крайніх значення однаковою мірою не зачіпають, байдужі для піддослідних. Наприклад: "Що б ви хотіли: (а) оглянути консервний завод-(б) піти в місцевий музей-(в) не знаю?" Як можуть бути виявлені такі питання при перевірці тесту в тому випадку, коли ми використовуємо дихотомічні завдання? Автор даної книги використовував такий прийом: під час перевірки тесту він забезпечив його спеціальною інструкцією, в якій вказувалося, що всі завдання, при виконанні яких випробуваним потрібна була середня категорія відповідей, повинні бути позначені хрестиком. Від тих завдань, які часто відзначаються таким чином, краще відмовитися, якщо тільки вони не виявилися особливо ефективними в ході аналізу завдань.

Завдання, для яких необхідна середня категорія відповідей, не зможуть пройти процедуру аналізу і будуть автоматично усунуті, а дослідження валідності може показати, що установка на середні відповіді не є суттєвим джерелом помилок.

Досить про установках на відповіді. Якщо будуть використовуватися ті прийоми, про які йшлося вище, то ми схильні вважати, що вплив установок на відповіді буде мінімальним. Подальша валидизация тестів покаже, чи дійсно це так.

Зміст питань (тверджень)

До сих пір під час обговорення принципів конструювання завдань основна увага приділялася їх формі. При цьому ми припускали, що знаємо, які риси (особливості) намагаємося тестувати. Проте, справедливо було б запитати, яким же саме чином ми приймаємо рішення про зміст завдань. Важко робити загальні висновки про це, оскільки багато що залежить від особливостей конкретної області поведінки, для діагностики якої ми хочемо розробляти тест особистості. Щоб проілюструвати, як приймати рішення про зміст тестів, я наведу кілька прикладів.

теоретичний приклад

Kline (1968) виконав експериментальне дослідження особливостей анального характеру (Freud, 1908), в ході якого для конструируемого тесту було поставлено велику кількість емпіричних завдань. Чи існує анальний характер? Якщо так, то вимірюється він іншими особистісними опитуваннями? Чи має він відношення до навчання дитини справляти велику нужду? Чи змінюється він від культури до культури, як слід було б очікувати, виходячи з психоаналітичної теорії? Щоб відповісти на ці питання, було необхідно сконструювати і валидизировать інструмент для вимірювання анального характеру. Щоб зробити це, я повинен був вирішити, які риси повинні увійти в тест.

Далі слід короткий опис того, як зміст запитань (тверджень) було відшліфовано, перш ніж вони перетворилися в завдання тесту. Одержаний в результаті цього тест (Ai3Q), схоже, витримав докладні критично перевірки (див. Kline, 1978). Були детально вивчені психоаналітичні описи анального характеру (напр., Abraham, 1921 Jones, 1923- Menninger, 1943), і складений список всіх рис і специфічних прикладів поведінки. Приклади з публікації Jones (1923) перераховані нижче.

(1) Зволікання в задоволенні потреб, доводимое до їх інтенсивної концентрації, монотонна наполегливість, свавільна незалежність - впевненість, що ніхто не може зробити що-небудь так добре, як він сам.

(2) Нездатність передоручати роботу.

(3) Дріб`язкову увагу до подробиць.

(4) Ніжність до дітей.

(5) Схильність до домінування.

Подібним чином було зібрано довгий докладний список рис та особливостей поведінки. Потім вони були перетворені в завдання тесту з використанням всіх тих правил і прийомів, які обговорювалися в цьому розділі.

практичний приклад

Немає сумнівів в тому, що корисно мати інструмент для виміру агресивності, наприклад, в центрі по перевиховання правопорушників або для малолітніх в`язнів. Основним підходом у цьому випадку було б складання списку всіх проявів агресивності, які тільки можна уявити, перетворення їх в завдання й апробація на відповідної вибірці. Слід зазначити, що при такому підході не стоїть питання про те, що є агресія як особистісний вимір. Для цього необхідно спеціальне дослідження. Так, факторний аналіз завдань продемонстрував б, чи є тільки один вимір, ряд корелюють між собою вимірів, кілька некоррелірующіх вимірювань або жодного реального синдрому поведінки, які могли б бути значимо описані як агресивність.

Отримання змісту завдання

Повертаючись до нашого прикладу, відзначимо, що є набір ознак агресивної поведінки, які б могли бути використані в завданнях: постійно б`ється (не в жарт) - коли роздратований, вступає в бійку з будь-якого поводу- використовує в бійці розбиті бутилкі- носить з собою бритви , кастети, велосипедні ланцюги, складні ножі, ремені з металевими бляхами, має важкі ботінкі- б`є впали супротивників ногамі- бив когось до втрати свідомості-страждав від несправедливості і оскорбленій- кричить, якщо раздражен- розкидає речі по кімнаті-бреше , Щоб роздратувати конкурентів- придумує страшні історії. Потім подібний список за допомогою прийомів, описаних в цьому розділі, може бути перетворений в завдання тесту.

висновок

При тих складних і неминуче неточних інструкціях для конструювання завдань тестів особистості, наведених в цьому розділі, найбільш цінним може бути короткий покроковий опис цікавить нас процедури. Воно і наводиться нижче. Повний обгрунтування всіх цих положень міститься в тексті глави.

(1) Перерахуйте риси та особливості поведінки з описів в психологічній літературі.

(2) Перетворіть опис кожної риси чи особливості поведінки в завдання. Це найкраще зробити за допомогою звичайних форм завдань опитувальників: (а) дихотомічних завдань (типу "так-ні") - (б) трихотомических завдань (типу "так -? - ні"): (в) альтернативних завдань- (г) завдань типу "подобається-не подобається" - (д) завдань із вимушеним вибором-(е) завдань з рейтинговими шкалами. Вибір форми завдання залежить від особливостей використовуваного матеріалу і оцінки переваг і недоліків кожного типу завдань.

(3) Незалежно від використовуваного типу завдань намагайтеся, щоб призначення кожного завдання не було надто очевидним.

(4) формулюйте кожне завдання зрозуміло і недвозначно.

(5) Наскільки це можливо, забезпечте, щоб кожне завдання ставилося до будь-якої конкретної області поведінки.

(6) У кожному завданні повинен міститися лише одне питання або одне твердження.

(7) Уникайте висловлюватись у термінах частоти та інші суб`єктивні висловлювання.

(8) Коли це можливо, завдання повинні стосуватися поведінки, а не почуттів і відносин.

(9) Забезпечте, щоб відповіді на завдання давалися швидко.

(10) Уникайте впливу основних установок на відповіді, таких як установка на згоду і установка на соціально схвалювані відповіді.

(11) Можливість прояви установки на згоду найкраще зменшується формулюванням зрозумілих завдань та використанням збалансованих шкал.

(12) Перевірте за допомогою процедур аналізу завдань то, що тенденція до згоди - несуттєвий фактор.

(13) Установки на соціально схвалювані відповіді найлегше уникнути шляхом ретельного формулювання завдань.

(14) Перевірте за допомогою техніки аналізу завдань, що установка на соціально схвалювані відповіді - несуттєвий фактор.

(15) Уникайте з допомогою адекватної форми завдань впливу установок на вибір крайніх чи середніх категорій відповідей.

(16) Перевірте за допомогою процедури валідизації, що вплив установок на відповіді не є суттєвим. Якщо тести валідність, то установки на відповіді не можуть впливати на їх показники.

» » Створення надійних тестів: особистісні опитувальники, розробка завдань