А давайте сделаем просто топик для общения по теме?

Языки программирования, базы данных, прикладные программы

Re: А давайте сделаем просто топик для общения по теме?

Сообщение R.D. » Пн ноя 22, 2021 4:43 pm

Кароч, смотри:

Сделать одну SQL таблицe из двух полей id и binary_value а потом вычислить в цикле расстояние Хэмминга для каждых двух значений из этой таблицы, и записать это во вторую таблицу, id, id_1, id_2, hamming_distance, и далее....

ORDER BY hamming_distance :D :lol:

а на id_1, id_2 повесь составной уникальный ключ :angel:

...хотя это еще не все нюансы :D :lol:
Если ты давно не пишешь на форум - значит, ты умер от ковида! (с) Джокер
Аватара пользователя
R.D.
Кот Шрёдингера
Кот Шрёдингера
 
Сообщения: 3864
Зарегистрирован: Ср авг 21, 2019 2:48 pm
Пол: Мужской
Соционический тип: Гамлет
Профессия: Архитектор

Re: А давайте сделаем просто топик для общения по теме?

Сообщение TailWind » Пн ноя 22, 2021 6:44 pm

R.D. писал(а):Ну а разбить на группы - это уже дело техники.

Так это как раз самое непонятное
У меня даже думательный процесс не запускается на эту тему
Аватара пользователя
TailWind
Гуру
Гуру
 
Сообщения: 10903
Зарегистрирован: Ср апр 15, 2015 1:36 am
Медали: 5
Пол: Мужской

Re: А давайте сделаем просто топик для общения по теме?

Сообщение R.D. » Пн ноя 22, 2021 7:27 pm

TailWind писал(а):
R.D. писал(а):Ну а разбить на группы - это уже дело техники.

Так это как раз самое непонятное
У меня даже думательный процесс не запускается на эту тему


Бро, а ты с чего вообще думать-то стал на эту тему? :D

Это какая-то реальная задача у тебя на работе? Или что-то учебное?

На каком стеке это вообще решить-то надо?

Я - больше по вебу как-то :add29

btw, не совсем ясна постановка задачи: что значит "разбить на группы"? Это требует уточнения. Ну, т.е. в реальном проекте такая постановка задачи не проканает :D :lol:
Если ты давно не пишешь на форум - значит, ты умер от ковида! (с) Джокер
Аватара пользователя
R.D.
Кот Шрёдингера
Кот Шрёдингера
 
Сообщения: 3864
Зарегистрирован: Ср авг 21, 2019 2:48 pm
Пол: Мужской
Соционический тип: Гамлет
Профессия: Архитектор

Re: А давайте сделаем просто топик для общения по теме?

Сообщение Самотипирование » Пн ноя 22, 2021 7:46 pm

R.D. писал(а):btw, не совсем ясна постановка задачи: что значит "разбить на группы"? Это требует уточнения. Ну, т.е. в реальном проекте такая постановка задачи не проканает :D :lol:

Да ладно. Нарпимер, на задачу поиска авторитетных типировщиков и ведущихся на их типирования похоже. Что-то такое клоновод вычислял несколько лет тому назад.
Мой клоновод дописался до 10-го издания.
Аватара пользователя
Самотипирование
Старожил
Старожил
 
Сообщения: 4121
Зарегистрирован: Пн апр 24, 2017 5:52 pm
Медали: 2
Профессия: Геноид

Re: А давайте сделаем просто топик для общения по теме?

Сообщение TailWind » Пн ноя 22, 2021 8:01 pm

R.D. писал(а):Это какая-то реальная задача у тебя на работе? Или что-то учебное?

На каком стеке это вообще решить-то надо?

Реальная
C++, но мне не нужны исходники. Нужна концепция

R.D. писал(а):btw, не совсем ясна постановка задачи: что значит "разбить на группы"? Это требует уточнения. Ну, т.е. в реальном проекте такая постановка задачи не проканает :D :lol:

Тут как раз проблема, что нужно условия задачи поставить
В закодить проблем нет
Аватара пользователя
TailWind
Гуру
Гуру
 
Сообщения: 10903
Зарегистрирован: Ср апр 15, 2015 1:36 am
Медали: 5
Пол: Мужской

Re: А давайте сделаем просто топик для общения по теме?

Сообщение R.D. » Пн ноя 22, 2021 8:53 pm

TailWind писал(а):Тут как раз проблема, что нужно условия задачи поставить
В закодить проблем нет


Блин, ты реально загадками говоришь :D

Давай сначала:

1. Имеется 1000 кусков информации ("массивами" у нас в вебе совсем другие вещи называются :) ) по 0x100 байт каждый, так?

2. Нужно найти расстояние Хэмминга между ними, так?

3. Ииии? Что еще с этими данными потом сделать?
Если ты давно не пишешь на форум - значит, ты умер от ковида! (с) Джокер
Аватара пользователя
R.D.
Кот Шрёдингера
Кот Шрёдингера
 
Сообщения: 3864
Зарегистрирован: Ср авг 21, 2019 2:48 pm
Пол: Мужской
Соционический тип: Гамлет
Профессия: Архитектор

Re: А давайте сделаем просто топик для общения по теме?

Сообщение R.D. » Пн ноя 22, 2021 8:54 pm

...кстати, расстояние Хэмминга нужно найти побайтовое или побитовое? :D

потому что это, как ты понимаешь, не одно и то же :)
Если ты давно не пишешь на форум - значит, ты умер от ковида! (с) Джокер
Аватара пользователя
R.D.
Кот Шрёдингера
Кот Шрёдингера
 
Сообщения: 3864
Зарегистрирован: Ср авг 21, 2019 2:48 pm
Пол: Мужской
Соционический тип: Гамлет
Профессия: Архитектор

Re: А давайте сделаем просто топик для общения по теме?

Сообщение TailWind » Пн ноя 22, 2021 9:01 pm

R.D. писал(а):2. Нужно найти расстояние Хэмминга между ними, так?

Давай детские задачки не будем обсуждать

Нужно разделить выборку на группы
Первая группа, та в которой расстояние Хемминга между членами самое маленькое. И число членов самое большое

Во второй группе расстояние больше и число членов меньше

Итд..

Нужно придумать правила:
- Как делить
- Какой критерий использовать
- Могут ли быть члены одной группы в другой
Аватара пользователя
TailWind
Гуру
Гуру
 
Сообщения: 10903
Зарегистрирован: Ср апр 15, 2015 1:36 am
Медали: 5
Пол: Мужской

Re: А давайте сделаем просто топик для общения по теме?

Сообщение TailWind » Пн ноя 22, 2021 9:13 pm

Как в статистике. Есть скрытые факторы, и их нужно найти

На ряд массивов действует один скрытый фактор, на другие другой

Остальные массивы имеют случайное распределение

Цель данной сортировки выявить эти факторы
Аватара пользователя
TailWind
Гуру
Гуру
 
Сообщения: 10903
Зарегистрирован: Ср апр 15, 2015 1:36 am
Медали: 5
Пол: Мужской

Re: А давайте сделаем просто топик для общения по теме?

Сообщение Neo » Пн ноя 22, 2021 9:46 pm

TailWind писал(а):Нужно разделить выборку на группы
Первая группа, та в которой расстояние Хемминга между членами самое маленькое. И число членов самое большое

А вот здесь возникает вопрос. К примеру, у тебя 4 массива - A, B, C, D. AB=1, CD=1, остальные расстояния - ну пусть 5+:) Если буквально понимать твою формулировку - то все 4 массива попадают в 1 группу. Хотя по-моему - логичнее было бы их в 2 группы определить - [A,B] и [C, D].
TailWind писал(а):Нужно придумать правила:
- Как делить
- Какой критерий использовать
- Могут ли быть члены одной группы в другой

Ну вроде самый напрашивающийся вариант - смотрим распределение расстояний. И выделяем в группы те массивы, расстояние между которыми попадает в первый дециль (ну или квартиль). Если не все массивы по группам распределились - смотрим 2й дециль, ну и т.д.
А насчет "могут ли быть члены одной группы в другой" - тут уже применительно к конкретной задаче смотреть надо :) В варианте "не могут" - итераций для распределения по группам потребуется значительно больше.
Я верю в честность президента
И в неподкупность постовых,
В заботу банка о клиентах,
В русалок верю, в домовых ...
Аватара пользователя
Neo
Бывалый
Бывалый
 
Сообщения: 2189
Зарегистрирован: Сб июн 02, 2007 1:54 pm
Откуда: Москва
Пол: Мужской
Соционический тип: Джек Лондон
Темперамент: Холерик
Профессия: Java developer

Re: А давайте сделаем просто топик для общения по теме?

Сообщение R.D. » Пн ноя 22, 2021 10:14 pm

TailWind писал(а):
R.D. писал(а):2. Нужно найти расстояние Хэмминга между ними, так?

Давай детские задачки не будем обсуждать

Нужно разделить выборку на группы
Первая группа, та в которой расстояние Хемминга между членами самое маленькое. И число членов самое большое

Во второй группе расстояние больше и число членов меньше

Итд..

Нужно придумать правила:
- Как делить
- Какой критерий использовать
- Могут ли быть члены одной группы в другой


Что это вообще за ересь? :D

Типа нужно самому придумать головоломку и самому же ее и решить? :add29 :D

А в чем соль?

Зачем? Цель какая?
Если ты давно не пишешь на форум - значит, ты умер от ковида! (с) Джокер
Аватара пользователя
R.D.
Кот Шрёдингера
Кот Шрёдингера
 
Сообщения: 3864
Зарегистрирован: Ср авг 21, 2019 2:48 pm
Пол: Мужской
Соционический тип: Гамлет
Профессия: Архитектор

Re: А давайте сделаем просто топик для общения по теме?

Сообщение TailWind » Пн ноя 22, 2021 11:57 pm

Только в школе тебе дают задачки с условиями

Когда ты занимаешься аналитикой, приходится условия самому изобретать

Цель - поиск фактора влияющего на ряд массивов
Когда найдёшь однотипные массивы, выделить фактор уже не сложно
Аватара пользователя
TailWind
Гуру
Гуру
 
Сообщения: 10903
Зарегистрирован: Ср апр 15, 2015 1:36 am
Медали: 5
Пол: Мужской

Re: А давайте сделаем просто топик для общения по теме?

Сообщение TailWind » Вт ноя 23, 2021 12:23 am

Neo писал(а):
TailWind писал(а):Нужно разделить выборку на группы
Первая группа, та в которой расстояние Хемминга между членами самое маленькое. И число членов самое большое

А вот здесь возникает вопрос. К примеру, у тебя 4 массива - A, B, C, D. AB=1, CD=1, остальные расстояния - ну пусть 5+:) Если буквально понимать твою формулировку - то все 4 массива попадают в 1 группу. Хотя по-моему - логичнее было бы их в 2 группы определить - [A,B] и [C, D].

Именно так мне и нужно. Но:

А если [a,b] = 1
[b,c]=1

А [a,c] = 10

То как быть?
Аватара пользователя
TailWind
Гуру
Гуру
 
Сообщения: 10903
Зарегистрирован: Ср апр 15, 2015 1:36 am
Медали: 5
Пол: Мужской

Re: А давайте сделаем просто топик для общения по теме?

Сообщение TailWind » Вт ноя 23, 2021 12:39 am

Neo писал(а):Ну вроде самый напрашивающийся вариант - смотрим распределение расстояний. И выделяем в группы те массивы, расстояние между которыми попадает в первый дециль (ну или квартиль). Если не все массивы по группам распределились - смотрим 2й дециль, ну и т.д.
А насчет "могут ли быть члены одной группы в другой" - тут уже применительно к конкретной задаче смотреть надо :) В варианте "не могут" - итераций для распределения по группам потребуется значительно больше.

Мысль хорошая
Я пока просто посчитал расстояния между всеми массивами
И вывел на экран список, отсортированный по количеству совпадений. Совпадение = 80% бит одинаковые
Сверху массивы у которых больше совпадений с другими
Это претенденты на фактор
Ну и в группы они организовались, так как внутри группы примерно одинаковое количество совпадений у массивов

Не скажу что доволен. Но вроде работает. Буду тестировать ещё
Аватара пользователя
TailWind
Гуру
Гуру
 
Сообщения: 10903
Зарегистрирован: Ср апр 15, 2015 1:36 am
Медали: 5
Пол: Мужской

Re: А давайте сделаем просто топик для общения по теме?

Сообщение R.D. » Вт ноя 23, 2021 2:17 am

Что-то я не верю, что есть люди, готовые платить деньги за

TailWind писал(а):поиск фактора влияющего на ряд массивов


Деньги платят за решение конкретных задач и в опросов.

Обычно :)

Но если у тебя есть каналы, где платят деньги за подобное - может познакомишь? :) Мне это было бы тоже интересно :add29

Я сейчас как раз сдал большой проект, и у меня такой момент локального перепутья :add29

Могу продолжить CRM-ки клепать :D а могу и что-нибудь новое попробовать.

Есть у вас там шанс вписаться в тему эту? :add14
Если ты давно не пишешь на форум - значит, ты умер от ковида! (с) Джокер
Аватара пользователя
R.D.
Кот Шрёдингера
Кот Шрёдингера
 
Сообщения: 3864
Зарегистрирован: Ср авг 21, 2019 2:48 pm
Пол: Мужской
Соционический тип: Гамлет
Профессия: Архитектор

Пред.След.

  • { SIMILAR_TOPICS }
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в Программирование

Кто сейчас на конференции

Зарегистрированные пользователи: Айрин1, GoGo [Bot], Google [Bot], rtanya, vadimr, Yandex 3.0 [Bot], Yandex [Bot], Zevs