ask@ftvmetrics.com +79259265003, Москва
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И НЕЙРОСЕТИ

Абстрактное определение задачи моделирования для управления.

Фатеев Д.А., Фатеев Г.Д.

1. Задачи управления реальностью.

Современная реальность представляет собой переплетение физического мира и конструктивного мира, сформированного человеком.

Умение решать задачи управления реальностью на основе наблюдаемых состояний является практически значимым преимуществом.

2. Лицо принимающее решения - вычислительно ограниченный наблюдатель.

Ключевое обстоятельство для лица, принимающего решения (ЛПР), при управлении реальностью состоит в том, что технологически ЛПР представляет собой вычислительно ограниченного наблюдателя (ВОН): объемы вычислительной работы, которую может осуществлять наблюдатель, кардинально ограничены в количестве и продолжительности.

Вычислительная ограниченность наблюдателя порождает новую подзадачу: какие данные в каких ситуациях интересно обозревать и что означает их динамика.

Потенциальная возможность управления реальностью для ВОН связана с наличием выявленных причинно-следственных зависимостей, которые позволяют предсказывать будущее в конкретных обстоятельствах.

Необходимым условием для управления реальностью является возможность моделирования и предсказания характеристик того, что будет делать та или иная система: сильно связанная часть реальности, интересующая наблюдателя.

3. Три парадигмы предсказания будущего.

Имеется три парадигмы, определяющие практику предсказания будущего: логическая, математическая и вычислительная.
Каждая из трех парадигм по-разному предсказывает характеристики будущего и имеет принципиальные особенности и ограничения применимости.

Логическая парадигма (время - не имеет явного количественного измерения, концепция времени сведена до частичной упорядоченности) представлена «словесными» моделями, содержащими понятия и категории, в которых мыслится система, а так же принципы функционирования системы. Такие модели не приводят к формированию прогнозов, но дают способы думать и рассуждать о системе и явлениях в системе.
Время не является обязательным элементом логической парадигмы.
Цель логической парадигмы состоит в выявлении точных цепочек влияния.
Неявно предполагается, что знание механизмов и правил способно привести к формированию правдоподобных прогнозов на основе логических построений, опыта и интуиции.

Математическая парадигма (время — обратимый параметр) связана с идеей использования математических уравнений для описания реальности.
Наличие уравнения, описывающего систему, дает возможность расчета состояния системы в любой момент времени. При этом не требуются промежуточные вычисления для предшествующих моментов времени, а важными являются только начальные условия.
В математической парадигме время является значимым элементом, но имеет статус параметра.
Такой статус позволяет думать об обратимости времени, а так же решать прямые и обратные задачи:
прямая задача — определение итогового состояния по начальным условиям;
обратная задача — определение требуемых начальных условий для обеспечения желаемого итогового состояния.

Вычислительная парадигма (время — реальный, не обратимый и самый важный фактор процесса) соответствует возможности написать программу, чтобы воспроизвести в компьютерной форме то, что можно наблюдать в реальности прямо или опосредованно.
Время в вычислительной парадигме является одним из главных компонентов системы. Оно определяет объем вычислительной работы, которую надо осуществить, чтобы понять, что делает система.
Только знание правил системы не позволяет спрогнозировать характеристики будущего состояния — узнать их можно только произведя все промежуточные вычисления в полном объеме.

4. Понятие сложности.

Понятие «сложность» используется тогда, когда наблюдатель не может понять суть того, что он обозревает. В этом случае наблюдатель так же не имеет возможности действовать целенаправленно и обоснованно.

В логической и математической парадигмах сложность можно толковать как временное явление, связанное с необходимостью проведения дальнейших исследований, которые могут привести к успеху.

В вычислительной парадигме сложность проявляется как повсеместное явление, которое определяется невозможностью понимания итогового состояния системы без проведения всех промежуточных вычислений.

5. Данные.

Некоторую часть современной реальности можно наблюдать непосредственно, но большая часть скрыта и может восприниматься только через порождаемые ею данные.

Для характеристики того, что происходит с данными, введено понятие BigData, закрепляющее состояние быстрого роста и так уже избыточного количества данных, при котором совсем не понятно, как использовать значительную часть доступных данных.

Формальное определение понятия «данных» практически ничего не разъясняет. В современной реальности данными является все. Более того, применяемая концепция компьютерной архитектуры фон Неймана не делает различий между программами и данными: программы представляются данными.

Будем считать, что за каждой конкретной совокупностью данных обязательно стоит вопрос или группа вопросов, ответами на которые и являются эти данные (неявное определение данных). Прогноз будущего также представляет ответ на вопрос.

Формируемые модели систем можно рассматривать как «генераторы» ответов на вопросы, которые предопределяются структурой и параметрами модели.

6. Состояния и события.

Данные в форме временных рядов являются основным источником для формирования причинно-следственных зависимостей.

При анализе временных рядов имеется альтернатива: либо удается «уложить» данные ряда в некоторое уравнение или систему уравнений, либо — нет.
В первом варианте будет работать математическая парадигма.
Во втором — вычислительная парадигма, в общем случае определяющая невозможность понимания итогового состояния системы без проведения всех промежуточных вычислений.

Данные временного ряда определяют состояния, в котором находится система или ее компоненты.
Эти данные явным образом не определяют события: что происходит и по каким правилам.

Если временной ряд можно связать с некоторым известным уравнением, то в данном случае событием является реализация соответствующего закона (закономерности), описываемого уравнением.

Иначе необходимо восстановить события или их совокупность, которые приводят к изменению состояния системы и действующие при этом правила.
Это является необходимым условием использования вычислительной парадигмы, так как разработка программных моделей системы требует формирование множества значимых событий и соответствующих правил действий при наступлении этих событий.

7. Доменный язык как необходимое условие эффективного управления реальностью.

7.1. Имеется два подхода учета действующих событий, которые неявно определяют подходы к решению проблемы сложности.

7.2. Традиционный подход связан с наращиванием количества параметров в достаточно простых и известных моделях. Таким образом события неявно учитываются через вектора значений параметров.
Введение большого количества параметров ведет к усложнению модели и латентно имеет целью «перехитрить» фактически имеющую место сложность, а так же привести задачу в сферу математической парадигмы.
При этом автоматически возникает побочная подзадача установления функциональных зависимостей между введенными параметрами и событиями, влияющими на систему: одна явная нерешенная проблема преобразуется в эквивалентную, но до некоторых пор не явную.

7.3. В этой ситуации имеется запрос на новый подход к моделированию, при котором становится понятно как и из чего возникает сложность на самом нижнем уровне, а также в каких случаях сложность можно редуцировать.
Рассмотрим подход, связанный с успехами развития машинного обучения, обеспечивающими возможность эффективного решения комбинаторных задач.
При этом подходе необходимо перейти на несколько смысловых уровней вниз, чтобы иметь возможность фиксировать позиции возникновения сложности. В этом случае формируются низкоуровневые примитивы, позволяющие строить смысловые конструкции любой степени абстрактности.
Признаком выявления низкоуровневых примитивов является нахождение правил, по которым изменяется состояние системы при наступлении определенных событий или их совокупности.

7.4. Опыт показывает, что низкоуровневые примитивы позволяют сформировать специализированный доменный язык, который одновременно дает возможность описывать замыслы по управлению реальностью и сразу производить непосредственные вычисления, находя результаты моделирования замыслов. В результате преодолевается разрыв между категориями и понятиями, в которых формулируются замыслы, и технологиями программной реализацией инноваций.

7.5. Имея доменный язык становится возможным составлять формализованные вопросы, ответами на которые будут соответствующие данные. Это позволяет содержательным образом выстроить работу с BigData, а не только искать скрытые закономерности в надежде найти какое-то уравнение или формулу: важная и нужная работа, но чаще всего оканчивающая ничем.

7.6. Кроме описания того, что существует в системе (домене), язык должен уметь описывать то, что пока не существует или даже никогда не будет существовать.
В противном случае нельзя будет описать будущее развитие системы, а так же ошибки, которых необходимо избегать. Эти требования определяют потребности в символическом доменном языке.

7.7. Понимание процессов «as is» не дает никаких ориентиров для поиска целевых процессов «to be». Найти целевые процессы можно только произведя перебор всех вариантов, соответствующих выделенным целям и производственно-коммерческим ограничениям.
В этом случае можно использовать методы машинного обучения и нейросети. Причем наличие низкоуровневых примитивов автоматически (если изначально иметь эту цель ввиду) обеспечивает формализм для применения методов машинного обучения.

7.8. Наличие доменного языка позволяет в ряде случаев преодолеть ключевое свойство вычислительной парадигмы: невозможностью понимания итогового состояния системы без проведения всех промежуточных вычислений. Это связано с нахождением причинно-следственных инвариантов.
Пример присутствия причинно-следственных инвариантов — это сортировка.
Да, надо проделать все промежуточные вычисления.
Да, в зависимости от алгоритма или начальных состояний вычислительная работа будет разной.
Но результат всегда будет одинаковый, какой бы алгоритм не был использован в каждом конкретном случае.

7.9. Естественным условием нахождения причинно-следственных инвариантов является рассмотрение всех возможных вариантов динамического сочетания событий и правил (действий) системы.
При этом реально доступной информацией о системе являются в основном временные ряды состояний.
Временной ряд фиксирует состояние системы для некоторой конкретной системы координат: некая метрика переводит качественные состояния в количественные характеристики.
Используя другие метрики (системы координат) можно получить другие временные ряды.
В то же время система как определенное пространство реальности объективно существует вне зависимости от применяемых систем координат.

7.10. При том, что множество явлений реальности происходит параллельно и асинхронно возможность человека что-то понять привязана к следующим условиям:
- смысловые конструкции, соответствующие изучаемым процессам, должны быть выстроены в последовательную цепочку, соответствующую причинно-следственной частичной упорядоченности (когда время не относится к основным действующим факторам);
- упорядочивание абстрактных объектов (сущностей) и операций должно быть выстроено для единой и последовательной нити времени.
Если один временной ряд соответствует требованию единой нити времени, то уже для двух временных рядов, описывающих состояние для пространственно разнесенных или функционально различных компонентов системы, временная упорядоченность состояний перестает однозначно определять причинно-следственные зависимости.

7.11. Преодолеть проблемы использования разных систем координат и иметь возможность для разных наблюдателей получать последовательное и непротиворечивое описание системы или ее частей в единой ните времени можно только при наличии цельной модели системы: возможности восприятия системы как единой сущности, так и любой ее части.
В случае наличия правильно выстроенного доменного языка фактор сложности уступает место фактору количества комбинаторных вариантов.
Обычно такие конструкции, как графы (деревья или сети), через совокупность сформированных на доменном языке утверждений об исследуемых компонентах дают возможность сформировать цельные дискретные модели, которые отражают зависимости на основе низкоуровневых примитивов: вершины - объекты, ребра - операции/действия.

7.12. Необходимо иметь инструментарии для трансформации разрозненных знаний о системе в совокупность объектов, событий и действий, а также привязки временных рядов состояний к объектам, событиям и действиям. Итогом применения инструментария будут упорядоченные или частично упорядоченные конструкции графов.

7.13. Нахождение причинно-следственных инвариантов связано с тем, что на основе имеющегося графа состояний и низкоуровневых примитивов можно сформировать граф событий (заменяя вершины состояния на соответствующие им вершины события) и граф правил (действий), заменяя вершины в графе событий на вершины действующих правил.
Граф состояний, граф событий и граф правил (действий) представляют собой наблюдение одного и того же явления, используя разные понятия и категории. Поэтому имеется возможность существенно увеличить количество используемых методов исследований, а также одновременно применяемых идей, реализованных в том или ином инструментарии.
Ориентация только на использование графа состояний, построенного на базе исходных временных рядов, ведет к тому, что будущее может представляться только повторением прошлого: того, что уже было. Нет возможности получить нечто новое непосредственно из графа состояния. Отказ от чего-то или отрицание также явно не порождают новые качества.

7.14. В итоге, на основе доступной информации о динамике наблюдаемых состояний системы после формирования доменного языка и применения соответствующего инструментария существенно расширяются возможности выстраивания причинно-следственных цепочек событий и правил (действий).
Изменение правил конструктивного мира, для которых имеется возможность определить их последствия через граф правил (действий), также дает возможность более просто и явно добиваться требуемых свойств систем.
Анализ статистических свойств графа событий и графа правил часто позволяет выявить уравнения, которым соответствует поведение, и перейти в сферу работы математической парадигмы.

7.15. Существенные резервы моделирования для задач управления связаны с применением самообучающихся нейросетей. При этом низкоуровневые примитивы и доменный язык обеспечивают требуемый формализм для описания целей и правил обучения, а также выстраивания иерархии смыслов.