Высокие статистические технологии

Форум сайта семьи Орловых

Текущее время: Чт мар 28, 2024 9:20 pm

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 5 ] 
Автор Сообщение
 Заголовок сообщения: О зависимости между бинарными переменными
СообщениеДобавлено: Сб окт 20, 2012 5:42 pm 
Не в сети

Зарегистрирован: Сб окт 20, 2012 5:27 pm
Сообщений: 3
Уважаемый Александр Иванович!
Как Вы думаете, насколько справедливы следующие соображения?
Если мы обрабатываем массив данных, представляющих собой номинальные (бинарные) переменные, и ставим задачу построить модель, связывающую одну из них с остальными, то можем ли мы воспользоваться аппаратом булевых функций для составления такой связи? Как известно, булеву функцию можно восстановить на любом наборе булевых переменных в виде, например, совершенной нормальной дизъюнктивной формы (СДНФ). Проблема в том, как ее упростить. На модельных массивах я пришел к такому выводу (строго обосновать его пока не могу): знак коэффициента корреляции Кендалла указывает на то, как будет входить та или иная переменная в итоговую регрессию, в прямом или инвертированном (для отрицательной корреляции) виде. Далее, мы смотрим на СДНФ и в слагаемых, в которых соответствующая переменная входит иным образом, заменяем ее на 1. Дальнейшие преобразования проводятся по соотв. свойствам операций конъюнкции и/или дизъюнкции - дистрибутивность и т.п. В абсолютном большинстве случаев (я ограничивался случаем моделей максимум с 4-мя независимыми бинарными переменными), преобразуя СДНФ, я приходил обратно к модельной зависимости.
В сети я не нашел похожих методик. Вот и решил спросить Вашего совета.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения: Re: О зависимости между бинарными переменными
СообщениеДобавлено: Сб окт 20, 2012 6:45 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11265
1. Подобными задачами не занимался.
2. Не вполне понятно, корреляцию между какими переменными Вы считаете и как. Коэффициент корреляции Кендалла - показатель связи между двумя переменными. Поскольку переменные - булевы, то речь идет о коэффициенте связи Чупрова или его вариантах?
3. Говорите о
Цитата:
совершенной нормальной дизъюнктивной форме (СДНФ)
- сокращение не СНДФ?
4. Как понимать словосочетание
Цитата:
В абсолютном большинстве случаев
? В скольких случаях из скольких?
5.
Цитата:
Если мы обрабатываем массив данных, представляющих собой номинальные (бинарные) переменные, и ставим задачу построить модель, связывающую одну из них с остальными, то можем ли мы воспользоваться аппаратом булевых функций для составления такой связи?

Конечно. можем. Так многие делают.
6. Что такое [quote]модельная зависимость[quote]?
7. Вы разработали некоторый алгоритм. Можно изучать его свойства. Он не всегда приводит к успеху (иначе Вы написали бы не "в абсолютном большинстве случаев", а "всегда". Можно вычснять, в какой доле случаев он приводит к успеху, перебирая все возможности или статистически, с помощью датчика псевдослучайных чисел выбирая набор исходных данных.
8. Поможет пониманию описание прикладной задачи, приведшей к рассматриваемой Вами постановке.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения: Re: О зависимости между бинарными переменными
СообщениеДобавлено: Сб окт 20, 2012 7:16 pm 
Не в сети

Зарегистрирован: Сб окт 20, 2012 5:27 pm
Сообщений: 3
Проф.А.И.Орлов писал(а):
8. Поможет пониманию описание прикладной задачи, приведшей к рассматриваемой Вами постановке.

Задача такая: медицинские данные, набор признаков, о которых мы можем говорить "признак есть" или "признака нет" - "курит/не курит, проходит диспансеризацию/не проходит, есть предрасположенность к заболеванию/нету такой" - и т.п. Итоговый признак, к примеру, "заболел/не заболел".
Мне хотелось бы, чтобы врач на основе такой булевой функции мог быстро составить прогноз.
Проф.А.И.Орлов писал(а):
- сокращение не СНДФ?

Да, извините, ошибся - СДНФ
Проф.А.И.Орлов писал(а):
? В скольких случаях из скольких?

В 13 из 17
Проф.А.И.Орлов писал(а):
6. Что такое модельная зависимость?

Я составлял булеву функцию, например, $A=A_1A_2+\bar{A_3}$, на заданном наборе исходных переменных (тут их три, уникальных наборов будет восемь), потом рассчитывал ее значения, а потом восстанавливал исходную функцию.
Проф.А.И.Орлов писал(а):
Не вполне понятно, корреляцию между какими переменными Вы считаете и как

Вот тут я притормозил с ответом... Надо подумать. Я полагал, что можно использовать $\tau$ Кендалла...
P.S. А что, TeX на форуме не работает? Вроде же правильно формулы записываю...


Вернуться наверх
 Профиль  
 
 Заголовок сообщения: Re: О зависимости между бинарными переменными
СообщениеДобавлено: Пт окт 26, 2012 4:45 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11265
Математические методы диагностики и прогнозирования течения заболевания - популярная тема уже полвека. См., в частности, статью "Доказательная медицина" http://orlovs.pp.ru/comp.php - много ссылок на различные ресурсы.
Цитата:
Проф.А.И.Орлов писал(а):
Не вполне понятно, корреляцию между какими переменными Вы считаете и как

Вот тут я притормозил с ответом... Надо подумать. Я полагал, что можно использовать $\tau$ Кендалла...
P.S. А что, TeX на форуме не работает? Вроде же правильно формулы записываю...

В чем проблема? Я же не о формуле спрашиваю, а о том, между какими переменными рассчитывается коэффициент корреляции.

TeX на форуме не работает.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения: Re: О зависимости между бинарными переменными
СообщениеДобавлено: Сб окт 27, 2012 7:45 am 
Не в сети

Зарегистрирован: Сб окт 20, 2012 5:27 pm
Сообщений: 3
Проф.А.И.Орлов писал(а):
Математические методы диагностики и прогнозирования течения заболевания - популярная тема уже полвека. См., в частности, статью "Доказательная медицина" http://orlovs.pp.ru/comp.php - много ссылок на различные ресурсы.
В чем проблема? Я же не о формуле спрашиваю, а о том, между какими переменными рассчитывается коэффициент корреляции.
TeX на форуме не работает.

Спасибо за ссылку, обязательно просмотрю.
Расчет корреляции между номинальными (дихотомическими) переменными: стандартно, как правило, "есть признак/нет признака"


Вернуться наверх
 Профиль  
 
Показать сообщения за:  Сортировать по:  
Начать новую тему Ответить на тему  [ Сообщений: 5 ] 

Часовой пояс: UTC + 3 часа


Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 79


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
Русская поддержка phpBB