anton19286 писал(а):Пихнул 3000 фоток от 370 людей, протипированных опросником Хижняка-Таланова.
Получилось попаданий с первого раза 10%, в четверке 40%.
Наверное, такую же точность можно получить, если писать всех женщин в этики, а мужчин в логики.
Жаль, что так мало. У Таланова более-менее адекватные результаты тест дает.
По внешности тоже перспективный метод, особенно с машинным обучением.
Так что должна быть корреляция намного выше.
Даже если 30% была бы сходимость, уже какая-то отправная точка была бы.
10% сходимость - это близко к случайной.
Но задача конечно очень сложная, думаю не на один год работы.
Фейсбук все-таки несколько другую задачу решает, он идентифицирует конкретное лицо, а не сортирует лица по группам.
У меня с текстом получилось, что установить автора по базе текстов проще, чем ТИМ выделить
http://www.geshtalt.ru/psycholingvist_author.phpОсновная идея частотный словарь каждого человека уникален, с лицами должно быть примерно также.
А вот разбить на 16 кластеров, которые будут ТИМами так и не получилось.
Частотные словари людей одного ТИМа часто были дальше друг от друга, чем от частотного словаря человека другого ТИМа.
Хотя сама идея упростить физиономию и по сути перевести ее в матрицу, а дальше уже работать с числами прекрасна.
98% точность - потрясающий результат у них получился.
Есть смысл копать в эту сторону для реального развития соционики.
Мы еще лет 15 назад обсуждали, что антропометрические данные могут быть основой метода типирования в будущем.
Сейчас на компах можно обрабатывать миллионы фото, поэтому вполне можно найти закономерности.
Основная проблема с начальной выборкой, на которой будет проходить обучение алгоритма,
Тут возможно тоже самое, на лицо влияет пол, возраст, национальность, а не только психотип.
Отделить признаки психотипа от других довольно сложно.
Как вариант можно попробовать обучать на выборке Таланова, взяв его версии за основу.
Может быть тогда прога будет лучше работать на новых лицах.
И аналогично моему способу с частотными словарями можно попробовать посчитать дисперсию между 128 характеристиками, которые выдает библиотека распознавания лиц OpenFace. Возможно какие-то конкретные характеристики из 128 и будут образовывать базис для психотипов. Причем с практической точки зрения даже неважно какие именно, главное их выделить и использовать при дальнейшем типировании на новых лицах.