Компания spellabs разработала систему автоматического построения карт влияния в произвольной предметной области. Предметная область отображается в виде графа, узлы которого представляют понятия, а направленные дуги, отображаемые стрелками, иллюстрируют непосредственные зависимости между этими понятиями. Связь между понятиями x и y означает: знание значения x помогает сделать более обоснованное предположение о значении y.
Отсутствие непосредственной связи между понятиями моделирует условную независимость между ними при известных значениях некоторого набора «разделяющих» понятий.
Простой пример
Размер обуви ребенка, очевидно, связан с умением ребенка читать через возраст. Так, больший размер обуви дает большую уверенность, что ребенок уже читает, но если нам уже известен возраст, то знание размера обуви уже не даст нам дополнительной информации о способности ребенка к чтению.
В качестве другого примера можно рассмотреть следующие факторы: инвестиции в здравоохранение, число обследований и число выявленных заболеваний.
Пример: медицинские инвестиции
Очевидно, инвестиции и число выявленных заболеваний зависимы через число обследований, т.е. чем больше инвестиций, тем больше обследований, и тем больше выявленных заболеваний. Но если нам уже известно число проведенных обследований, то число выявленных заболеваний от инвестиций, произведенных в эти обследования, уже не зависит.
В качестве противоположного, примера рассмотрим такие изначально несвязанные факторы как курение и простуда. Но если нам известен симптом, например, что человек страдает по утрам кашлем, то знание того, что человек не курит, повышает нашу уверенность того, что человек простужен.
Пример: дороги
Еще один пример: состояние тормозов автомобиля и состояние дороги независимы. Но если известно, что авария произошла, то знание о состояние дороги позволяет с большей уверенностью делать вывод о состоянии тормозов: если дорога была хорошая, то так как авария произошла, то вероятность того, что с тормоза были неисправны, возрастает.
В двух первых примерах два зависимых факторы становятся независимыми, как только мы узнаем «промежуточный» фактор влияния. В двух последних примерах два изначально независимых фактора (возможные причины) становятся зависимыми, как только мы узнаем результат их воздействия.
В основе алгоритма работы системы лежит
исследование, посвященное математическим и алгоритмическим вопросам построения байесовских сетей.
Перейдем к более сложным примерам, анализирующим реальные выборки и большое число взаимосвязей.
Пример: Американский обыватель
Источник:Американские анкеты 15000 анкет, 68 вопросов.
Фрагменты:
Вера человека в жизнь после смерти непосредственно зависит от того, сколько часов в день он смотрит телевизор:
Цепочка наивности: если человек доверяет телевизору, то он верит прессе, банкам, медицине, образовательным учреждениям. А если он часто читает газеты, то держит дома пистолет.
Общее ощущение счастья зависит от счастья в браке и далее, от семейного положения:
Является ли человек противником или сторонником смертной казни зависит, прежде всего, от его расы:
Пример: Контрацепция
Источник:Американские анкеты.
Образование жены является определяющим фактором в семье, от него зависит даже образование «выбранного» мужа, а не наоборот.
Метод контрацепции определяет число детей, которое в свою очередь позволяет судить о возрасте жены.
Пример 3: характеристики животных.
Источник:
Биологическая типизация животных является определяющей характеристикой:
Если есть перья, то воздушное и не ядовитое:
Если дышащее и нет шерсти, то неводное. Если водное, то есть плавники:
Если есть клыки, то нет плавников. Если хищное, то не домашнее.
Резюме
Карты влияния позволяют получать знания о зависимости между факторами, узнавать цепочки влияния и оптимальные точки приложения управляющих воздействий для оказания влияния в нужном направлении.
Платформа
Реализация алгоритма: SQL Server 2008 R2
Интерфейс: SharePoint 2010
