Нейросети для соционики и психологииИтак, поделюсь в общих чертах своими идеями по поводу создания нейросети, умеющей определять психологический тип.
1. Что уже работаетДля начала, что уже умеют делать современные нейросети (начало 2019 года):
-
распознавать рукописный текст-
распознавать речь- генерировать речь и вести диалог (
Алиса в Яндексе)
-
распознавать лица (Фейсбук)
-
отличать разные предметы друг от друга (есть обучающие выборки в открытом доступе)
-
различать кошек на видео-
определять породу собаки по фото- определять марку машины по фото (Яндекс - auto.ru)
-
отличать мужчин от женщин по тексту- отличать мужчин от женщин по фото
-
найти похожую на вас знаменитость (Микрософт)
-
создать 3D-модели лиц по одной фотографии-
пытаются определять интеллект по форме черепа (Израиль)
-
определять сексуальную ориентацию-
определять 7 базовых эмоций с вероятностью в 60%-
раскрашивать черно-белые фото-
создавать портреты людей, которых не существует- играть лучше людей и других программ в шашки, шахматы, го, старкрафт и видимо в любые другие игры с четкими правилами (
АльфаГо,
АльфаЗеро,
АльфаСтар)
-
создавать рисунки в стиле разных художников (пока в основном абстракционистов)
-
писать музыку в разных стилях-
писать стихи по изображениям (пока простенькие)
-
подделывать отпечатки пальцев-
переводить тексты между несколькими языками (DeepL)
-
ставить некоторые диагнозы не хуже врачей- управлять рекламой (Google, Яндекс, Фейсбук)
- водить автомобиль (Google, Яндекс)
21 сайт, где можно протестировать работу нейросетей19 отличных бесплатных нейросетейВ целом возможности нейросетей будут с каждым годом все расширяться.
2. Как связать это с соционикой?Очевидно, что с задачей распознавания образов нейросети на мощном железе уже начали справляться.
Задача соционического типирования по сути состоит в том, чтобы отнести объект к одной из 16 групп (типов).
Таким образом нужно найти наиболее подходящий кластер, к которому относится объект.
В данном случае задача аналогична поиску отличий собак от кошек, мужчин от женщин, но конечно в разы сложнее.
Потому что нейросети обычно нужна огромная обучающая выборка.
Например, в миллион фото.
Получить такую выборку на данный момент для соционики почти нереально.
К тому же определение соционического типа до сих пор неразрешенная задача.
Пока мы можем получить эталонные списки для обучающей выборки всего двумя разными способами:
1.
Проанализировать базы типирований знаменитостей множеством социоников, выбрать те, по которым минимум противоречий. При достаточно большом числе версий адекватные варианты обычно в топе по количеству голосов. То есть сообщество в целом типирует неплохо, в данном случае получается человеческий аналог нейросети.
Даже если все версии не попадают в один тип, а расходятся, например, между СЭЭ и СЭИ можно использовать эту знаменитость в качестве эталона сенсорика, иррационала и этика.
2. Брать за основу самотипирование, выбирая тех, кто уже относительно долго занимается соционикой
Конечно, любая соционическая школа может взять за основу свою собственную выборку, но на мой взгляд она будет содержать больше ошибок, чем полученная фильтрацией по всем соционическим школам.
В любом варианте эти обучающие выборки будут иметь ошибки.
В лучшем случае нейросеть научиться приближать свое типирование к обучающим выборкам, то есть либо типировать как соционическое сообщество в целом, либо близко к самотипированиям.
3. Что скармливать нейросети?Нейросети можно скармливать:
1. Результаты ответов на тесты
+ Наиболее точная инфа, при условии, что человек себя хорошо осознает и не пытается обмануть программу
- Большинство соционических тестов довольно прозрачны, человек, знакомый с соционикой может косить под любой из типов при необходимости (например, при устройстве на работу на конкретную должность)
2. Тексты
+ Можно типировать авторов по текстам в соцсетях без их присутствия
- Сложности с разбором синтаксических конструкций в разных языках, и особенно понимании смысла
На мой взгляд логика-этика наиболее выраженная дихотомия для текстов, начинать стоит с нее.
3. Фото
+ Можно незаметно типировать людей (сейчас Сбербанк делает систему для определения эмоции клиента после обслуживания с помощью нейросети)
+ Такой вариант может быть удобен для экономии времени в HR-отделе
- На данный момент нужна огромная обучающая выборка, иначе качество типирования будет низким
Интроверсия-экстраверсия наиболее выраженная дихотомия для фото.
4. Видео.
Видео - это по сути своей последовательность кадров, то есть фото.
+ гораздо больше информации
- нужны мощные вычислительные ресурсы для их обработки
В любом случае обычно сначала все материалы переводятся в цифру, и затем по сути обрабатываются матрицы чисел.
Для примера, на вход обученной нейросети подается директория с новыми фото, а она их раскидывает по 16 папкам - типам + еще одной забракованным изображениям (например, "лицо человека не найдено"). Также вместо четкого разложения по папкам можно выдавать вероятности принадлежности к каждому из 16 типов.
4. Плюсы нейросетейКак показывает опыт компании DeepMind, достаточно легко их нейросеть перешла от шашек к шахматам, потом к го, и наконец к Старкрафт.
Несмотря на разность игр опыт построения нейросети для одних игр помог в других.
Таким образом потенциально может быть решена задача не только соционического типирования, но и любой другой типологии (MBTI, Мак Вильямс, Личко, Леонгард, психейога, психодиагностика по фото, медицинские диагнозы по фото и так далее). Важно только иметь адекватные обучающие выборки и возможность настраивания параметров нейросети.
5. Промежуточные нейросетиВ конечном варианте нейросеть должна определять 1 из 16 типов.
Но сначала можно тестировать на более простых вариантах, а именно определение одной основной дихотомии.
Логика-этика, экстраверсия-интроверсия, сенсорика-интуиция скорее всего будет проще определить по внешности, чем рациональность-иррациональность.
Из работающих признаков Рейнина, то есть с относительно адекватным психологическим наполнением, на мой взгляд всего три: статика-динамика, позитивизм-негативизм, демократия-аристократия. Сомневаюсь, что их легко определить по фото. Но возможно нейросеть сможет уловить какие-то закономерности, которые пропустили соционики, и найдет их даже для таких экзотических признаков как эмотивизм/конструктивизм.
Если кого-то типируют в 3 ТИМа, и все они логики, то можно использовать его как эталона логика наравне с теми, кого типируют только в один ТИМ (логика) для этой упрощенной нейросети. Аналогично и с другими признаками. То есть таким образом можно будет удлинить списки знаменитостей, увеличив обучающие выборки для мелких нейросетей.
Крупную нейросеть, которая получает на выходе ТИМ, а не отдельный признак можно строить двумя способами.
Либо как одну сеть, либо как последовательность ответов (суперпозицию) более мелких сетей.
6. Тензоры в нейросетях1. Скаляр (число)
2. Вектор (линейный набор чисел)
3. Матрица (прямоугольный набор чисел)
4. Изображение (высота, ширина, цвет)
5. Видео (последовательность изображений)
С каждым шагом нужно все больше вычислительных ресурсов.
Для обработки видео нейросетью скорее всего понадобятся суперкомпьютеры с огромной вычислительной мощностью.
7. Параметры нейросети1. Практика показала, что нейронов должно быть как минимум в 3 раза больше, чем вариантов результата.
2. Практика показала, что нужно минимум 5000 примеров в обучающей выборке.
3. Для типирования по тексту лучше использовать реккурентные или одномерные сверточные (менее затратны) нейросети.
Сначала нужно провести векторизацию текста, то есть перевести все в числа.
- разбить текст на слова, перевести слова в вектора
- разбить текст на символы, перевести символы в вектора
- извлечь N-граммы (перекрывающиеся последовательности из 2-3-...) из слов/символов (токенов), перевести N-граммы в вектора
FastText - векторные представления, поддерживающие русский язык
4. Для типирования по фото лучше использовать сверточные нейросети.
Для упрощения вычислений предварительно можно делать фото черно-белыми.
8. Вычислительные мощностиДля простых тестовых моделей можно использовать TPU (тензорные процессоры) от Google.
Сейчас их дают бесплатно всем желающим на 12 часов.
По вопросам сотрудничества пишите в личную почту на форумеПродолжение следует...