Цель: смоделировать, как меняется вероятность верного определения типа по мере увеличения числа задаваемых респонденту вопросов, являющихся эксклюзивными для данного типа.
Порядок моделирования:
1. генерируем набор квазислучайных соционических профилей (с широкой вариативностью расклада по дихотомиям) и из него выбираем 160 признаков, наиболее эксклюзивных для определённого типа (у которых в типном профиле столбец нужного типа лидирует с заданным отрывом)
2. генерируем набор квазислучайных соционических профилей (с близким к реальному раскладом дисперсии по признакам и учётом наличия отрицательного эксцесса в распределении популяции по наиболее сильным из них) - по 1000 на каждый тип
3. считаем ответ каждого из 16000 респондентов на каждый из 160 вопросов - как сумму корреляции типных профилей респондента и признака плюс некоторое количество случайного шума (да, это немного криво, но пока так).
4. определяем типный состав группы респондентов, которые по результатам одного или более вопросов попадают в верхнюю 1/16 по сумме своих ответов за эти вопросы. Прослеживаем изменение этого расклада по мере увеличения числа используемых для типирования вопросов. Определяем долю искомого типа в этой верхней 1/16 как надёжность методики.
Допущения:
1. численность всех типов в выборке одинаковая
2. среднее ответов на все вопросы принято за ноль
3. дисперсия всех вопросов в проекции на набор 15 признаков полагается одинаковой
4. дисперсия всех профилей респондентов в проекции на набор 15 признаков полагается одинаковой
5. искажающее симметрию социона взаимовлияние признаков не учитывается
6. ответы респондентов на вопросы взяты "как есть" а не приведены к квантованной шкале да-не_знаю-нет(-1...0...1) или 1-2-3-4-5
7. тонкие эффекты, вроде разногго уровня зашумлённости ответов у разных типов в связи с разным уровнем чёткости самовосприятия, не учитываются.
Первые 4 графика - типичные варианты роста вероятности верного диагноза с увеличением числа вопросов, далее указаны варианты с тем или иным изменением параметров моделирования.
Скачать код программы с яндекс-диска.
Вывод: вероятность верного определения типа по его эксклюзивным признакам растёт по мере увеличения числа предъявляемых респонденту подобных признаков (вопросов). Однако, в силу того, что все эксклюзивные свойства одного типа сильно скоррелированы меж собой (?), рост вероятности верного типирования человека в предполагаемый тип только по его эксклюзивным признакам, имеет естественный потолок в районе 66+/-2% (по крайней мере, для рассматриваемой автором методики расчёта этой вероятности). Влияние шума в ответах респондентов на высоту этого потолка не столь значительно и приводит скорее не к снижению максимальной точности (потолка надёжности), но к повышению необходимого для достижения этого потолка числа вопросов.
При доле шума в ответе около 70% (взятом за норму) нет практического смысла задавать более 80 эксклюзивных вопросов, так как после этого числа вероятность выходит на ровное плато в районе 60%, и почти перестаёт расти. В варианте с нулевым вкладом шума (в реальности не бывает) плато достигается много раньше, в районе 10 вопроса. Для варианта с минимальными требованиями к эксклюзивности вопросов (к типированию допускаются все признаки, в типном профиле которых столбец нужного типа просто лидирует, даже без какого-либо отрыва) надёжность снижается на 5-6% относительно варианта с сильными фильтрами.
Таким образом, автор полагает, что в типодиагностике всё же лучше использовать весь широкий спектр соционических вопросов, а не его узкую часть - в силу того, что в последнем случае используемые вопросы оказываются сильно скоррелированы и плохо подходят для различения близкородственных типов. Либо, как вариант, можно рассмотреть модель типирования, где эксклюзивные вопросы на тип сочетаются с вопросами, наиболее надёжно отличающими его от типов-соседей (в первую очередь, от квазитождественного и родственного по сенсорике-интуиции).