ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ИНХС РАН |
||
В процессе исследований по проекту РФФИ 14-07-00441 "Разработка, исследование и применения методов математического моделирования субъективных суждений в научных исследованиях" сформулированы математический формализм и концепция субъективного моделирования в научных исследованиях, согласно которым и в отличие от "стандартного" математического моделирования, математический формализм субъективного моделирования (м.ф.с.м.) позволяет модельеру-исследователю (м.-и.) моделировать как формализованные знания об объекте исследования (ОБ.И.) из соответствующей предметной области, так и неполные и недостоверные неформализованные знания, научный опыт и интуицию учёного, выразив математически своё отношение к их истинности, указывая, насколько относительно правдоподобны его суждения и насколько следует относительно доверять их отрицаниям. М.ф.с.м. является существенным обобщением "стандартного" математического моделирования, позволяющим м.-и. создавать модели, начиная с абсолютного незнания модели ОБ.И., вплоть до точного формализованного её знания, как в "стандартном" математическом моделировании. Если же доступны данные, относящиеся к ОБ.И., то м.ф.с.м. позволяет м.-и. использовать их для проверки адекватности субъективной модели цели исследования, корректировать субъективную модель, комбинировать данные наблюдений и свои субъективные представления об ОБ.И. для оптимизации заключений об исследуемых свойствах ОБ.И в условиях априорной неполноты и противоречивости неформализованных знаний объекта исследования и его модели, и т.п. Однако использовать так любые данные, относящиеся к ОБ.И., к его модели и к цели исследования, полученные из различных источников, нельзя, не проверив их, прежде всего, на наличие дезинформации. Поэтому фундаментальной научной проблемой, на решение которой ориентирован проект, является "оснащение" м.ф.с.м. математическими методами, алгоритмами и программами, позволяющими м.-и. проверять непротиворечивость и отсутствие дезинформации в данных (субъективных, эмпирических, нечётких, статистических, экспертных и других), поступающих из разных источников, оптимально учитывать данные в субъективной модели ОБ.И. для проверки её адекватности цели исследования, её коррекции и оптимизации основанных на ней заключений об изучаемых свойствах ОБ.И. в условиях априорной неполноты и противоречивости неформализованных знаний объекта исследования и его модели. Кроме этого, в проекте планируется исследовать новые методы получения и математического представления, обработки или интеграции неформализованных знаний, ориентированные на математическую компьютерную обработку, для использования в научных исследованиях. Успешное решение этих задач позволит считать "оснащённый" м.ф.с.м. новой информационной технологией получения и использования в научных исследованиях формализованных и неформализованных знаний, существенно более полно представляющей знания и научный опыт м.-и., чем "стандартное" математическое моделирование.
During research in RFBR project 14-07-00441 "Development, research and applications of mathematical modeling methods of subjective judgments in scientific research" the mathematical formalism and the concept of subjective modeling were formulated, according to which, unlike in "usual" mathematical modeling, the mathematical formalism of subjective modeling (m.f.s.m.) allows the researcher-modeller (r.-m.) to model both formalized knowledge about the research object (r.ob.) from the subject area and incomplete and unreliable unformalized knowledge, experience and intuition of a scientist by mathematically expressing his opinion on their truth by describing how relatively plausible are his judgements and to what degree their negations can be believed in. M.f.s.m is a substantial generalization of the "usual" mathematical modeling that allows the r.-m. to create models ranging from absolute ignorance of the model of the r.ob. to exact formalized knowledge about it like in the "usual" mathematical modeling. If data related to the r.ob. is available, m.f.s.m. allows the r.-m. to use them to test the adequacy of the subjective model for the research objective, to correct the subjective model, to combine the observation data and his subjective notions about the r.ob. to optimize his conclusions about the researched features of the research object under prior incompleteness and inconsistency of unformalized knowledge about the research object and its model, and so on. However, arbitrary data related to the r.ob., to its model and to the research objective cannot be used in this manner without checking them for misinformation first. Therefore, the fundamental scientific problem the project is aiming to solve is "equipping" m.f.s.m. with mathematical methods, algorithms and programs allowing the r.-m. to check inconsistency and lack of misinformation of data (subjective, empirical, fuzzy, statistical, expert and other) from different sources, to optimally use them in r.ob.'s subjective model to test its adequacy for the research objective, to correct it and to optimize conclusions on the researched features of the r.ob. based on it under prior uncertainty and inconsistency of unformalized knowledge about the research object and its model. In addition, it is planned to research new methods of obtaining and mathematical representation, processing or integration of unformalized knowledge aimed at mathematical computer processing for use in scientific research. Successful solution of these problems would allow m.f.s.m "equipped" with these methods to be considered a new information technology of obtaining and using formalized and unformalized knowledge in scientific research that represents knowledge and scientific experience of the r.-m. substantially fuller that the "usual" mathematical modeling.
В проекте будут получены следующие результаты: - Математические методы, алгоритмы и программы проверки непротиворечивости данных, распознавания дезинформации и указания её источника, в том числе и в наблюдениях за ОБ.И, математические модели которых могут быть ошибочными, и оптимального комбинирования экспертных, субъективных и других данных, полученных из разных источников. Эти результаты должны обеспечить безусловную применимость математического формализма субъективного моделирования как новой технологии получения, комбинирования и анализа знаний об ОБ.И., существенно расширяющей возможности "стандартного" математического моделирования при решении научно-исследовательских и прикладных задач. - Математический метод, алгоритм и комплекс программ построения субъективной модели в случае, когда исследователь предлагает распределения правдоподобий и доверий значений параметра субъективной модели и следствия из неё, которые могут противоречить друг другу вследствие различной имеющейся у исследователя субъективной информации о модели и о её следствии. Полученные в этом пункте результаты важны при решении прикладных задач в ситуации, когда ранее не связанные характеристики ОБ.И. оказываются зависящими друг от друга. - Численные методы (алгоритмы и программы) для вычисления распределений правдоподобий и доверий следствий субъективной модели. Результаты этого пункта обеспечат эффективность расчётов в программах, связанных с субъективным моделированием, в частности, в программной системе "Интеллектуальный интерфейс" (см. ниже). - Новые методы оптимизации принятия решений в задачах идентификации и оценивания в условиях априорной неполноты и противоречивости неформализованных знаний ОБ.И. и его модели. - Новые математические методы, алгоритмы и программы для решения и исследования возникающих в процессе работ над проектом задач, в частности: - применения разработанных методов в прикладных задачах (в задачах морфологического анализа данных в условиях неполного и недостоверного знания модели объекта, характерной для морфологических моделей, построения субъективных моделей в геофизике и их применение для создания нечётких моделей динамики климатических процессов и представлений об изменении метеорологических показателей во времени, обусловленных поступлением новых данных наблюдений за приземным слоем атмосферы и др.); - практическая реализация теоретических методов и подходов теории возможностей и математических методов субъективного моделирования в комплексной программной системе "Интеллектуальный интерфейс", которая будет универсальной: математическая модель объекта будет представлена "черным ящиком" - функцией произвольной природы (под "интеллектуальностью" понимается возможность математически моделировать неформализованные, неполные и неточные знания исследователя об исследуемом объекте в диалоге с его математической моделью, учитывая доступные ему данные наблюдений за объектом и иную информацию). - Математические методы, алгоритмы и комплексы программ оптимальной интерпретации данных наблюдений, математическая модель которых известна неточно, позволяющие как оптимально учитывать имеющуюся информацию, если "основная, опорная" априорная информация не вызывает сомнения, а любая дополнительная может оказаться дезинформацией, так и оптимально отфильтровывать дезинформацию автоматически или предоставлять такое решение исследователю, включая математические методы построения субъективной модели измерительно-вычислительного преобразователя как универсального средства измерения, анализа и интерпретации данных измерительного эксперимента, не возмущенных процессами измерений, в услових априорной неопределённости его субъективной модели. - Метод оптимального планирования и использования тестовых наблюдений ОБ.И. в случае субъективной модели наблюдений. Этот и предыдущий пункты важны для разработки математических методов построения субъективной модели измерительно-вычислительного преобразователя сверхвысокого разрешения как универсального средства измерения, анализа и интерпретации данных измерительного эксперимента, причём не возмущенных процессами измерений. - Математические методы комбинирования неопределённой информации с помощью отношения специфичности на множестве распределений правдоподобий, введённого в рамках проекта РФФИ 14-07-00441, и числовая мера неопределённости распределения правдоподобий, согласованная с отношением специфичности. Полученные результаты важны при комбинировании доступной исследователю субъективной информации и при оценке её информативности.
Авторский коллектив имеет большой опыт исследований по теории мер возможности и необходимости, формально эквивалентных мерам правдоподобия и доверия, поддержанных проектами РФФИ "Разработка, исследование и применения методов математического моделирования субъективных суждений в научных исследованиях", РФФИ № 14-07-00441 "Стохастические модели возможности", РФФИ № 02-01-00424, "Неопределенные нечеткие меры и их обобщения в проблеме анализа и интерпретации сложных неточных недостоверных и противоречивых данных", РФФИ № 05-01-00532, "Математические методы и адаптивные алгоритмы эмпирического построения стохастических, нечетких, неопределенных стохастических и неопределенных нечетких моделей", РФФИ № 08-07-00133, посвященных разработке и исследованию первого варианта теории возможностей и ее приложений для решения прикладных задач. Полученные результаты являются новыми. Их аналогами являются математические методы теории мер и интегралов, асимптотические методы теории вероятностей, методы теории статистических решений, методы теории стохастических систем и стохастического программирования, методы идемпотентного анализа. В процессе исследований по проектам РФФИ 11-07-00722 и 14-07-00441 разработан метод, позволяющий математически моделировать субъективные суждения м.-и. о возможных значениях неизвестного параметра модели ОБ.И. и их модальности (правдоподобие и доверие), показано, что м.-и. может оценивать правдоподобия и доверия истинности его суждений о свойствах объекта исследования, обусловленных его моделью, и показано, что м.-и. всегда может предложить характеризующую его знания субъективную модель. Разработанный математический формализм субъективного моделирования позволяет устранить проблемы, свойственные известным методам математического моделирования субъективных суждений. Последние полученные по теме проекта в рамках предыдущих проектов результаты систематизированы в монографии "Вероятность, возможность и субъективное моделирование в научных исследованиях".
2018 год Получены новые научные результаты, существенно расширяющие области применимости стандартного математического и субъективного моделирования, обеспечивающие безусловную применимость математического формализма субъективного моделирования как новой информационной технологии получения, комбинирования, анализа и использования знаний, существенно обобщающей "стандартное" математическое моделирование при решении научно-исследовательских и прикладных задач. Разработан [1, 2] метод построения субъективной модели в случае, когда исследователь предлагает распределения правдоподобий и доверий значений параметра субъективной модели и следствия из неё, которые могут противоречить друг другу вследствие различных источников, имеющейся у исследователя субъективной информации о модели и о её следствии. Этот метод актуален и при решении прикладных задач в ситуации, когда ранее не связанные характеристики объекта исследования оказываются зависящими друг от друга. Исследована [3] проблема информативности/неопределенности субъективных суждений исследователя как информативности/неопределенности энтропий распределений правдоподобий и доверий неопределенного элемента, как параметра модели объекта исследования, получены и исследованы оптимальные субъективные правила оптимальной идентификации состояний и оптимального оценивания неизвестных параметров неопределенного нечеткого объекта, основанные на данных наблюдений за ним. В теории измерительно-вычислительных систем (ИВС) разработан [4] и программно реализован метод редукции измерения к виду, свойственному измерению на идеальном измерительном приборе, использующий субъективную информацию исследователя о модели измерения, в котором субъективная и объективная погрешности результата редукции представлены раздельно, при вероятностной модели измерения. Метод позволяет определить, насколько неточность оценки интересующей исследователя характеристики обусловлена его субъективными представлениями, а насколько — погрешностью измерений. При этом каждое правдоподобное значение полученной оценки как неопределённого элемента оптимально (в с.к.) при соответствующем значении субъективной информации. В известных методах задача интерпретации ставилась не как задача редукции измерения, т. е. ошибки интерпретации не минимизировались. Получены [5] новые методы и алгоритмы редукции измерения, применимые при вероятностной модели измерения когда измеряемый сигнал принадлежит известному выпуклому замкнутому множеству. Показано, что новая оценка при определённых условиях точнее в с. к. известных погрешностей редукции измерений, дана оценка точности нового метода, и в численном эксперименте на разработанном комплексе программ получены свидетельства её верности. Получены [6] методы и алгоритмы оценивания отклика неизвестного измерительного преобразователя (ИП) на заданный сигнал и результата редукции измерения, выполненного на нем, основанные на априорной информации об ИП и на данных тестовых измерений на нём, в отличие от ранее известных методов, с учётом искажений объектов, с которыми ИП взаимодействует, для вероятностной модели измерения. Показана оптимальность полученных оценок в классе линейных. Предложены [4] как способ единого представления всей имеющейся у исследователя информации о модели измерения и о цели исследования в задачах редукции измерений (для вероятностной, нечеткой и/или субъективной моделей измерения), так и комбинирования информации, верификации, выявления дезинформации и её удаления с помощью этого представления. Для повышения качества редукции этот способ позволяет комбинировать информацию, предложенную разными исследователями и сформулированную в терминах различных математических подходов, верифицировать её и использовать всю верифицированную информацию при минимальном риске ухудшения качества интерпретации. С помощью "Интеллектуального интерфейса" построена [7] математическая субъективная модель измерений температуры воды в открытом водоеме, выполненных по схеме y_j = f(t_j) + v_j, j = 1, …, n, j=1,...,n, в некоторой точке водоёма через равные промежутки времени, где y_j - известный результат j-го измерения, f(t_j) - измеряемая температура, v_j - погрешность j-го измерения, в которой шум, значения f(t_j) и v_j, j = 1,…, n, неизвестны, и требуется решить задачу субъективной интерпретации данных измерений y_1, …, y_n, т.е. определить f(t_1), ..., f(t_n). При решении задачи интерпретации данных измерений использованы априорные представления исследователя, согласно которым, в силу физических свойств воды в обычных природных условиях, зависимость её температуры от времени должна быть достаточно гладкой, поскольку вода обладает большой теплоёмкостью и малой теплопроводностью, а возможные флуктуации температуры обусловлены ветром, перемешиванием воды, шумом измерений и другими процессами. При этом от исследователя не требуется моделировать математические свойства шума. Выбрав порядок сплайна, исследователь изменяет фактор гладкости сплайна, анализируя одновременно зависимости от значений фактора: графика сплайна, моделирующего зависимость f(t), и графика разностей измеренных значений температуры и сплайна, моделирующего погрешности измерений. Для принятия решения исследователю требуется подобрать такое значение фактора гладкости сплайна, при котором на гладком графике не будет фрагментов, свойственных графику разностей, моделирующему зависимость шума от времени, а на графике разностей исчезнут фрагменты, свойственные гладкой зависимости, моделирующей зависимость от времени температуры воды. Определив искомое значение фактора гладкости, исследователь присваивает субъективные значения правдоподобий истинности графиков, моделирующих зависимости температуры воды от времени, и графиков, моделирующих зависимости шума от времени. С этого момента фактор гладкости рассматривается как неопределённый элемент, заданный двумя условными распределениями правдоподобий: при условиях, что он субъективно характеризует истинности графиков зависимостей от времени температуры и шума. Эти распределения независимы в силу независимости соответствующих субъективных суждений исследователя. В модельных измерительных экспериментах, в которых реальные данные измерений и шум известны, и при сравнении реальных данных измерений с данными субъективной интерпретации, показано, что минимум с.к. значений их разностей достигаются на оптимальных интерпретациях максимального правдоподобия. В результате регрессионного анализа сглаженного ряда динамики температуры в [8] был сделан вывод об увеличении среднегодовой температуры воздуха в Тверской области за 1971-2016 гг. на 1,9°С. При этом линейный коэффициент корреляции Пирсона принимает максимальное значение 0,95 при сглаживании исходного ряда температуры с интервалом 8 лет. Значимость и адекватность построенной субъективной модели подтверждены результатами проверки статистических гипотез о значении параметров регрессии и анализа остаточной составляющей. Полученный в данном регионе тренд температуры согласуется с современными климатическими изменениями, для которых характерно повышение средней глобальной температуры воздуха. В результате Фурье-анализа периодических изменений в ряду динамики температуры воздуха помимо сезонных колебаний обнаружены [8] также циклические изменения с периодами 8 лет и 3 года. Вклад циклической составляющей ряда в суммарную периодограмму составляет более 50%. Анализ сингулярного спектра (SSA) ряда температуры также подтвердил, что основной вклад во временной ряд вносят гармоники около 8 и 3 лет, вызванные особенностями атмосферной циркуляции и 11-летних циклов солнечной активности. На основании проведенных исследований при моделировании динамики температуры воздуха как суммы циклов с различными продолжительностями показано, что существенный вклад в колебания температуры воздуха вносят гармоники с периодами до 2,75 лет, а также гармоники ENSO (El Nino Southern Oscillation) с периодами 3,9-6,18 лет (в среднем - 4 года) и с периодами 6,4-9,1 (в среднем - 8 лет). ENSO является частью глобальной системы атмосферной циркуляции и оказывает значительное влияние на изменчивость погоды и климата. На особенности атмосферной динамики и формирование основных гармоник ряда температуры могут оказывать влияние также полные 11-22 летние циклы солнечной активности. Также показано, что наиболее выраженным является 11-летний (в среднем) цикл Швабе-Вольфа, в котором за первые 3-4 года происходит увеличение числа солнечных пятен и усиление других проявлений солнечной активности, а в течение последующих 7-8 лет – обратный процесс. Выполнено иследование применимости методов нечеткой, нечеткой-неопределенной математики и теории возможностей в задачах интервального оценивания и общей теории принятия решения. В его рамках: 1. Получена оценка границ применимости теоретико-вероятностных методов в общей теории оценивания на примере задачи о двух средних. 2. Произведено исследование взаимосвязи байесовского и фидуциального подходов с подходом, основанном на нечеткой и нечеткой неопределенной информации в теории интервального оценивания. Разработана версия морфологического алгоритма выделения изображений неизвестных объектов на фоне, форма которого известна, с подвижным локальным полем зрения с шагом в 1 пиксель, асимптотическая производительность которого превышает производительность алгоритма, в котором шаг смещения локального поля зрения равен его размеру. Принята к печати глава коллективной монографии в серии «Series on Language Processing, Pattern Recognition, and Intelligent Systems» издательства World Scientific Publishing, Ltd. (UK), посвященной достижениям российских ученых в области анализа изображений, распознавания образов и смежных разделов информатики и прикладной математики. Название главы: «Morphological Image Analysis. Mathematical Foundations and Applications», авторы Пытьев Ю. П., Чуличков А.И., Фаломкина О.В., Зубюк А.В., Балакин Д.А. Один из параграфов главы посвящен субъективным моделям морфологического анализа. Для реализации диалога исследователя со своей субъективной моделью разработан програмный интеллектуальный интерфейс, позволяющий в интерактивном режиме изменять значение неопределённого параметра модели и присваивать каждому значению параметра значение его относительного правдоподобия. Интерфейс написан на языке программирования Python 3.7, с использованием модулей dill, numpy, scipy, pyqtgraph и PyQt5. Реализовано: - интерактивное взаимодействие с моделью; - возможность построения распределения правдоподобий значений сглаживающего параметра сплайна и его степени; - загрузка других данных для субъективной сплайновой модели; - сохранение и загрузка модели. С его помощью построена математическая субъективная модель измерений температуры воды в открытом водоеме, см. выше. Проведено сравнительное исследование оптимальных вероятностного и возможностного решений задачи классификации (т. е. решений задачи классификации в вероятностной байесовской постановке и в возможностной постановке) и методов их эмпирического построения (т. е. обучения классификации). Для тестирования использовались данные, сгенерированные с использованием вероятностной модели. Для построения возможностного решения использовалась возможностная модель, максимально согласованная с заданной вероятностной. Исследование показало, что: - качество классификации при использовании возможностного решения более устойчиво к изменениям вероятностной модели, чем при использовании вероятностного решения (заметное ухудшения качества классификации с использованием вероятностного решения при изменении модели является проявлением «эффекта переобучения»: решение, оптимальное в рамках одной вероятностной модели, зачастую оказывается весьма далёким от оптимального для любой другой модели), - скорость обучения классификации с использованием возможностных методов может быть значительно выше, чем скорость обучения классификации с использованием вероятностных методов. Проведено более детальное исследование введённого ранее отношения частичного порядка на множестве распределений возможностей (правдоподобий) и соответствующих нечётких (неопределённых) моделей, позволяющего сравнивать их по степени информативности [9]. Определена роль этого отношения в задаче оценивания ненаблюдаемого параметра объекта исследования по наблюдению за ним. Показано, что если нечёткая (неопределённая) модель 1 более информативна, чем модель 2, то оптимальная в рамках 1-ой модели оценка является оптимальной и в рамках 2-ой модели с необходимостью (доверием) 1. Разработан алгоритм, реализующий указанное отношение частичного порядка. В основе алгоритма лежит процедура эквализации. Алгоритм и теорема, обосновывающая его работоспособность, опубликованы в [9]. Дано определение указанного отношения частичного порядка в терминах разбиений, ранжирующих элементарные события согласно возможности их наступления (well-ordered partitions [10]). 2019 год На примере задач оптимизации анализа и интерпретации данных измерений температуры воды в открытом водоеме, математическая модель которых неизвестна, получены новые методы решений задач эмпирического восстановления: субъективной математической модели измерений температуры, субъективной интерпретации данных измерений и субъективного анализа адекватности восстановления математической модели измерений. Для решения названных задач использован математический формализм субъективного моделирования (МФСМ), позволивший модельеру-исследователю (м-и) математически формализовать его субъективные представления о физических свойствах воды, и интеллектуальный компьютерный интерфейс, обеспечивший связь субъективных суждений м-и с восстанавливаемыми математическими моделями и позволивший м-и использовать свойства теплоёмкости и теплопроводности воды для отделения значений её температуры от погрешностей её измерений, называемых далее шумом. Математическая модель измерения температуры впервые определена лишь субъективными представлениями м-и о гладкости интересующей его зависимости температуры от времени и «негладкости» шума, которые представлены отдельно применением сглаживающего сплайна. Впервые показано, что наблюдаемая при субъективной интерпретации данных измерений её максимальная точность может служить критерием истинности эмпирически восстановленной субъективной математической модели измерений, поскольку в задаче интерпретации данных измерений максимизируется правдоподобие результатов интерпретации и полученной при этом реализации шума, а не точность интерпретации. Опубликовано в статье [11]. Получен [12] новый метод редукции измерений изображений к виду, свойственному измерениям пространственного распределения интересующей исследователя оптической характеристики объекта исследования при помощи идеального датчика (в частности, имеющего размер меньше размера реально использованного датчика), новизна которого определяется использованием субъективной информации, согласно которой значения близко расположенных точек объекта, как правило, отличаются незначительно, где «как правило» и «незначительно» отражают субъективные представления исследователя об объекте исследования. Полученная оценка близка к известным в математической статистике оценкам типа Джеймса–Стейна, поскольку уменьшение погрешности достигается за счет комбинирования оценки редукции, при построении которой не используется субъективная информация, но которая заведомо передает все детали объекта (в оценке Джеймса–Стейна аналогичную роль играет оценка метода наименьших квадратов), и оценки, существенно основанной на априорных представлениях вплоть до независимости от результата измерений (в оценке Джеймса-Стейна такую роль играет значение оценки, которое, по мнению исследователя, наиболее ожидаемо). Оригинальность нового метода состоит в том, что если в оценке Джеймса-Стейна комбинирование является линейным, то в полученном методе комбинирование производится покомпонентно, отбором компонент комбинируемых оценок методами проверки статистических гипотез с учетом субъективных представлений исследователя о виде изображения и о виде погрешности аналогично [11]. Предложен способ эмпирической верификации такого рода субъективной информации. Предложен [13] новый метод выбора наиболее правдоподобного решения недоопределенной системы линейных уравнений за счет учета априорной субъективной информации о правдоподобии возможных решений, выраженной не непосредственно предложенной исследователем субъективной моделью, а на языке неравенств, выражающих субъективные мнения исследователя вида «значение компоненты 1 скорее всего превосходит значение компоненты 2» («мягких ограничений»). Показано, что задача поиска наиболее правдоподобного решения сводится к задаче линейного программирования, и проведено исследование предложенного метода. Проведены исследования тенденций изменчивости концентрации CO2 в различных временных диапазонах по данным измерений. Для выделения суточных колебаний концентрации CO2 применялся метод морфологического анализа. Согласно априорному мнению исследователя, временной ряд суточных колебаний концентрации углекислого газа является квазипериодической последовательностью, состоящей в чередовании монотонно возрастающих и убывающих фрагментов с меняющимися периодами чередования, амплитудами и формами монотонных участков. Поэтому исследователь на основе своих субъективных представлений о том, какие виды зависимости концентрации от времени правдоподобны, а какие — нет, строит субъективную морфологическую модель наблюдений [14], а именно, для выявления суточных колебаний он вводит математическое понятие формы сигнала на квазипериоде как множества сигналов с фиксированным положением максимума, минимума и точек перегиба. Положения этих точек являются параметрами формы, их значения определяются как условно наиболее правдоподобные значения при условии — полученном результате измерения. На данном этапе правдоподобие определяется евклидовым расстоянием от исходного фрагмента временного ряда до заданной формы сигнала. Вычитание выделенной таким образом суточной составляющей позволило обнаружить регулярность более высокочастотной составляющей в динамике концентрации CO2. Результаты исследования подтверждаются исследованиями, проведёнными на метеорологической станции «ZOTTO», расположенной в среднетаежной подзоне Приенисейской Сибири, и метеорологической станции «Asiaflux», расположенной во Вьетнаме. Получена и изложена в учебном пособии [15] программная реализация умножения матриц в идемпотентных алгебрах, с помощью которой реализовано вычисление меры близости матриц парных сравнений, применяемой в задаче построения коллективной экспертной оценки. Используемый в [15] язык Julia позиционируется как язык для научного программирования благодаря одновременно скорости исполнения программ, сравнимой со скоростью программ, написанных на языке C, интерактивности и способности использования библиотек, написанных на Python, C и Fortran. Указанные свойства языка позволяют преодолеть «проблему двух языков», возникающую при применении языков высокого уровня (например, Python, MATLAB) для написания прототипа программы для решения научной проблемы, когда для получения требуемой при эксплуатации программы производительности требуется переписать программу или ее части на низкоуровневом языке (например, C или Fortran). Начато изучение получения максимально точного и содержательно обоснованного интервала, основанного на известных статистиках, для оценки невязки математических средних в задаче о двух средних в случае неизвестных дисперсий. С целью преодоления трудностей, охарактеризованных в теореме Шефе (патологическая связь отношения дисперсий с размерами выборок) была сделана попытка сформулировать задачу в смешанной вероятностно-возможностной постановке, опираясь на материалы изложенные в гл. 4 монографии [1]. К сожалению, в первоначальной версии данная постановка привела к трудностям содержательного толкования значения правдоподобия получаемого интервала, хотя и показала границы применимости теоретико-вероятностного подхода в задачах интервального оценивания. В связи с этим предполагается попробовать решить задачу в рамках теории нечетких и нечетко-неопределенных множеств. Ранее удалось установить связь между фидуциальным подходом и мерой правдоподобия в задачах интервального оценивания. В этой постановке информацию о дисперсии предполагается связать с четкостью знаний о параметре (в данном случае - о среднем), а результат получать в виде множества с нечеткими границами и заданным на нем мерой правдоподобия. Начато исследование возможности использования методов субъективного моделирования, изложенных в гл. 5 монографии [1] с целью создания субъективной модели восприятия аудио и видео информации. Речь идет об модернизации теории констант Вебера с целью установлении содержательно-адекватной взаимосвязи между такими объективными параметрами как интенсивность звука, его спектральная составляющая (тембр) - с одной стороны, и такими субъективными параметрами как его громкость, и «чистота» тембра - с другой. (Или при анализе изображения: длина волны, яркость и чистота цвета - с одной стороны, и цветовой тон (ОЩУЩЕНИЕ света с определенной длиной волны), светлота (ОЩУЩЕНИЕ яркости) и насыщенность (ОЩУЩЕНИЕ чистоты цвета) - с другой). 2020 год Разработаны и исследованы методы решения задач эмпирического восстановления субъективной математической модели объекта исследования (ОБИ) и субъективной интерпретации данных его измерений, искажённых шумом, математическая модель которого неизвестна, и "пропусками" данных измерений ОБИ, когда математическая модель измерений также неизвестна. Для постановки и для решения названных задач использован математический формализм субъективного моделирования (МФСМ), позволивший математически сформулировать как субъективную модель ОБИ, так и субъективную модель его измерений и их субъективной интерпретации с учётом восстановленных данных измерений в "пропусках", и интеллектуальный программный интерфейс, обеспечивший диалог модельера-исследователя с МФСМ. Для реализации заявленной программы использованы субъективные представления модельера-исследователя (м-и) о физических свойствах ОБИ и о средствах его измерений, о математических свойствах шума и т. п.; вся субъективная информация основана на научном опыте м-и и на его интуиции учёного. Изучено использование собственного базиса модели интерпретации измерения в задаче редукции измеренных видеоданных к виду, свойственному измерениям ОБИ идеальным датчиком. При этом используется редукция не сразу всех видеоданных после завершения их регистрации, а данных, накопленных по мере их поступления, а исследователь может в каждый момент времени остановить процесс измерений. Рассмотрены два метода, позволяющие сформировать оценку, имеющую меньшую погрешность, чем погрешность линейной редукции, ценой детерминированного искажения оценки, характеризуемого подпространством значений интересующей исследователя характеристики, не влияющих на результат оценивания. В первом методе оценка формируется при помощи отбора компонент в собственном базисе так, чтобы среднее значение квадрата нормы шума не превышало заданное, а во втором — определением составляющей оценки, относительно которой может быть принята гипотеза о ее равенстве нулю, и замены этой составляющей на нулевую. Второй способ позволяет в ряде случаев получить более значительное подавление шума при меньшем искажении. Показано, что в обоих способах применение собственного базиса модели измерения позволяет выполнять значительную часть вычислений параллельно, так как принадлежащие различным собственным подпространствам компоненты данных обрабатываются независимо. Накопление информации, представленной в собственном базисе модели измерений, при условии неизменности собственного базиса, также производится независимо для принадлежащих различным собственным подпространствам компонент оценки, а объем хранимой информации фиксирован, что положительно влияет на быстродействие параллельной реализации предложенных методов. Разработан эвристический алгоритм поиска матрицы парных сравнений, минимизирующей сумму расстояний до матриц парных сравнений, связанных с распределениями правдоподобий различного происхождения и в связи с этим выраженных в разных шкалах значений правдоподобий. В отличие от многих распространенных алгоритмов решения этой задачи, он корректно обрабатывает распределения с равноправдоподобными элементарными событиями. Алгоритм реализован на языке Julia. Предложенный на этапе 2019 года метод выбора наиболее правдоподобного решения недоопределенной системы линейных уравнений при помощи «мягких ограничений» обобщен для решения некорректно поставленных обратных задач с использованием априорной информации, представленной в форме мягких ограничений. Даны постановки задач с мягкими качественными ограничениями и предложены численные методы их решения в линейном и нелинейном случаях. В линейном случае задачи сводятся к задачам линейного программирования. В нелинейном предложены градиентные методы их решения, причём для автоматического дифференцирования функций предложено использовать возможности библиотеки TensorFlow. Продолжены исследования тенденций изменчивости концентрации CO2 в различных временных диапазонах по данным измерений. Для этого использован ряд методов, как специально разработанных (морфологических),так и модифицированных из известных (Фурье-или вейвлет-анализ). Определены области применимости каждого из методов, в результате получен набор методов, позволяющих выделять циклические компоненты ряда в широком диапазоне их периодов. Предложена математическая модель формы сигнала, отражающая суточную динамику концентрации CO2, в виде функции, направление выпуклости которой меняется на противоположное в точках перегиба. Эти точки являются параметрами формы фрагмента сигнала, моделирующего суточный ход концентрации CO2. Считается, что два фрагмента сигнала имеют одинаковую форму, если интервалы их выпуклостей вверх и выпуклостей вниз совпадают. Для выделения суточной циклической составляющей из исходного временного ряда выбирается составляющая, моделирующая суточную динамику концентрации СО2 путем решения задачи наилучшего приближения участков ряда сигналами заданной формы. Далее исследуется остаток ряда, представляющий собой разность исходного ряда и его аппроксимации. Метод морфологической фильтрации позволил выделить суточную циклическую составляющую и анализировать остаток ряда для оценивания составляющих с периодом, меньшим, чем 24 часа. Метод, основанный на Фурье-преобразовании, позволил выделить циклические составляющие анализируемого ряда с периодом, как большим, так и меньшим, чем 24 часа. Вейвлет-анализ позволил выделить и локализовать во времени составляющие с периодом, большим, чем 24 часа. Таким образом, предложен набор методов, позволяющих выявить цикличность рядов в широком временном диапазоне. Подготовлена к публикации статья, в которой рассмотрены постановки и решения задач эмпирического восстановления субъективной математической модели объекта исследования (ОБИ), схемы его измерений и субъективной интерпретации данных измерений, искажённых "пропусками" данных измерений ОБИ и шумом, математическая модель которого неизвестна. Статья посвящена исследованию и решению актуальной задачи субъективного восстановления пропущенных данных измерений и влияния пропусков на качество решения задач субъективного моделирования. В статье поставлена, решена и исследована задача восстановления пропущенных данных измерений. Приведены результаты сравнительного анализа ошибок "автоматического" и субъективного методов восстановления пропущенных данных измерений. Для решения задачи определения скорости тяжелого иона с помощью полупроводникового детектора (PIN диода) были разработаны новый метод и алгоритм на основе математического формализма субъективного моделирования. В экспериментальной практике скорость иона измеряют «по времени пролета», т.е. измеряется время пролета ионом некоторого известного расстояния – пролетной базы. Для измерения времени пролета необходимо получить временные отметки «старт» и «стоп», соответствующие моментам начала и окончания движения вдоль пролетной базы. Для получения таких отметок используют временные детекторы. Отметку «стоп» часто берут с полупроводникового детектора, например, так называемого PIN диода. При попадании иона в диод на выходе появляется сигнал (импульс напряжения), который можно представить как сумму собственно импульса напряжения, вызванного регистрируемым ионом, и аддитивного шума. Физика взаимодействия тяжелого иона с полупроводником такова, что форма сигнала представляет собой сначала медленно растущую функцию, вид которой неизвестен, выходящую потом на почти линейную зависимость (длина этого участка неизвестна). Требуется найти момент времени, когда ион попал в детектор («абсолютная временная привязка») – т.е. собственно начало сигнала, при том, что начальная часть фронта импульса лежит внутри «шумовой дорожки». Для решения задачи был разработан и реализован алгоритм, позволяющий восстановить форму фронта сглаживающим сплайном со следующим специальным условием: начальная часть сплайна (слева) задается уравнением параболы, а вершина этой параболы должна лежать на усредненной шумовой линии, поскольку в отсутствие шума фронт начинает расти с нулевой линии. Для определения оптимального сглаживающего фактора был использован математический формализм субъективного моделирования. Метод проходит апробацию на реальных ядерно-физических данных в Лаборатории ядерных реакций Объединенного института ядерных исследований (г.Дубна). По результатам исследований готовятся к публикации две статьи в тематических журналах. Разработана программа для изучения алгоритмов выделения неизвестного объекта на фоне, морфологическая форма которого известна. Программа предоставляет возможность вычисления и визуализации морфологической разности, ее нормы, места появления нового объекта при помощи нелокального алгоритма, алгоритма с подвижным локальным полем зрения, алгоритма, использующего разбиение поля зрения. Полученная программа проверена на модельных изменениях изображений (яркость-контраст, градиенты, волны, пятна, шум с заданной степенью размытия), полученных с использованием специальных подходов и технических средств (цифровой фотоаппарат, не имеющий механических вибраций при съемке нескольких кадров подряд; получение изображений не только в видимом, но и в ближнем инфракрасном диапазоне; авторские программные средства подготовки изображений для вычислительных экспериментов, минимизирующей влияние несовершенства технических средств съемки, не имеющего отношения к цели исследования). Исследована работоспособность «нелокального» метода в «хороших», «средних» и «плохих» случаях, влияние отклонений от «идеальных» условий (нарушение постоянства яркостей областей, масштаба и совмещенности изображений) на его результаты и сравнение с «локальными» методами. Изучено влияние типа и параметров «локальных» алгоритмов на результаты работы для разных типов объектов («высокочастотный», «однотонный», «полупрозрачный» и «промежуточные» между ними) и фона. В частности, изучено влияние как «физических» изменений условий регистрации (изменение типа, состава и направления источников света, параметров экспозиции и светочувствительности при съемке, смешение цветных изображения в изображения в шкале серого с разными коэффициентами для эталонного и предъявленного изображений), так и модельных (добавление в исследуемое изображение программными средствами модельных «градиентов», «волн», «пятен», шума выбранной степени размытия, изменение яркости и контраста) на результаты работы алгоритмов. Во всех исследованных случаях «тривиальная» разность эталонного и предъявленного изображений не позволяла выделить объект. [1] Пытьев Ю. П. Вероятность, возможность и субъективное моделирование в научных исследованиях. — ФИЗМАТЛИТ Москва, 2018. — 296 с. Издание поддержано РФФИ по проекту 17-17-00078. [2] Пытьев Ю. П. Математические методы субъективного моделирования в научных исследованиях. 1. Математические и эмпирические основы // Вестник Московского университета. Серия 3: Физика, астрономия. — 2018. — № 1. — С. 3–17. Pyt’ev Y. P. Mathematical methods of subjective modeling in scientific research: I. the mathematical and empirical basis // Moscow University Physics Bulletin. — 2018. — Vol. 73, no. 1. — P. 1–16. [3] Пытьев Ю. П. Математические методы субъективного моделирования в научных исследованиях. 2. Приложения // Вестник Московского университета. Серия 3: Физика, астрономия. — 2018. — № 2. — С. 3–17. Pyt'ev Y. P. Mathematical methods of subjective modeling in scientific research. 2: Applications // Moscow University Physics Bulletin. — 2018. — Vol. 73, no. 2. — P. 125–140. [4] Балакин Д. А., Пытьев Ю. П. Редукция измерения при наличии субъективной информации // Математическое моделирование. — 2018. — Т. 30, № 12. С. 84–110. [5] Балакин Д. А., Пытьев Ю. П. Улучшение редукции измерения при принадлежности интересующей исследователя характеристики объекта исследования априори известному выпуклому замкнутому множеству // Ученые записки физического факультета Московского Университета. — 2018. — № 5. — С. 1850301. [6] Балакин Д. А. Эмпирическое восстановление математических моделей линейного измерительного преобразователя и оптимального вычислительного преобразователя // Ученые записки физического факультета Московского Университета. — 2018. — № 4. — С. 1840603. [7] Математический формализм субъективного моделирования / Ю. П. Пытьев, О. В. Фаломкина, С. А. Шишкин, А. И. Чуличков // Машинное обучение и анализ данных. — 2018. — Т. 4, № 2. — С. 108–121. [8] Статистический анализ циклических изменений в рядах динамики метеорологических показателей на юго-западе Валдайской возвышенности / В. А. Газарян, Ю. А. Курбатова, Т. А. Овсянников, Н. Е. Шапкина // Вестник Московского университета. Серия 3: Физика, астрономия. — 2018. — № 1. — С. 61–67. [9] Zubyuk A.V. A new approach to specificity in possibility theory: Decision-making point of view // Fuzzy Sets and Systems. — 2019. — Vol. 364. — P. 76–95. DOI: 10.1016/j.fss.2018.06.017 [10] Benferhat S., Dubois D., Prade H. Possibilistic and standard probabilistic semantics of conditional knowledge bases // Journal of Logic and Computation. — 1999. — Vol. 9, no. 6. — P. 873–895. [11] Pyt'ev Yu. P., Falomkina O. V., Shishkin S. A. Subjective restoration of mathematical models for a research object, its measurements, and measurement-data interpretation // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. 2019. Vol. 29, no. 4. P. 577–591. http://link.springer.com/article/10.1134/S1054661819040138 [12] Балакин Д. А. Редукция изображений к виду, свойственному измерению распределения прозрачности объекта, при субъективной информации о его разреженности в заданном базисе // Вестник Московского университета. Серия 3. Физика. Астрономия. 2020. № 1. С. 25-32. [13] Использование качественной субъективной информации в виде мягких неравенств при оценке состава инвестиционного портфеля / В. В. Ашарин, А. В. Зубюк, Е. П. Фадеев, Г. Л. Шапошник // Математические методы распознавания образов: Тезисы докладов 19-й Всероссийской конференции с международным участием. Т. 1. М.: Российская академия наук, 2019. С. 24–27. [14] Pyt'ev Y. P. Subjective models, oblique projectors, and optimal decisions in image morphology // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. 2017. Vol. 27, no. 2. P. 213–233. [15] Антонюк В. А. Язык Julia как инструмент исследователя. М.: Физический факультет МГУ имени М. В. Ломоносова, 2019. 48 с.
грант РФФИ |
# | Сроки | Название |
1 | 1 января 2018 г.-31 декабря 2018 г. | Новые методы, алгоритмы и программы математического формализма субъективного моделирования в научных исследованиях для построения математической модели объекта исследования, адекватной цели его исследования, и оптимизации заключений о его исследуемых свойствах, в условиях априорной неполноты и противоречивости формализованных и неформализованных знаний объекта исследования и его модели |
Результаты этапа: В 2018 году получены новые научные результаты, существенно расширяющие область применимости стандартного математического и субъективного моделирования. Эти результаты обеспечивают безусловную применимость математического формализма субъективного моделирования как новой информационной технологии получения, комбинирования, анализа и использования знаний, существенно обобщающей "стандартное" математическое моделирование при решении научно-исследовательских и прикладных задач. Разработан [1, 2] метод построения субъективной модели в случае, когда исследователь предлагает распределения правдоподобий и доверий значений параметра субъективной модели и следствия из неё, которые могут противоречить друг другу вследствие различных источников, имеющейся у исследователя субъективной информации о модели и о её следствии. Этот метод актуален и при решении прикладных задач в ситуации, когда ранее не связанные характеристики объекта исследования оказываются зависящими друг от друга. Исследована [3] проблема информативности/неопределенности субъективных суждений исследователя как информативности/неопределенности энтропий распределений правдоподобий и доверий неопределенного элемента, как параметра модели объекта исследования, получены и исследованы оптимальные субъективные правила оптимальной идентификации состояний и оптимального оценивания неизвестных параметров неопределенного нечеткого объекта, основанные на данных наблюдений за ним. В теории измерительно-вычислительных систем (ИВС) разработан [5] и программно реализован метод редукции измерения к виду, свойственному измерению на идеальном измерительном приборе, использующий субъективную информацию исследователя о модели измерения, в котором субъективная и объективная погрешности результата редукции представлены раздельно, при вероятностной модели измерения. Метод позволяет определить, насколько неточность оценки интересующей исследователя характеристики обусловлена его субъективными представлениями, а насколько — погрешностью измерений. При этом каждое правдоподобное значение полученной оценки как неопределённого элемента оптимально (в с. к.) при соответствующем значении субъективной информации. В известных методах задача интерпретации ставилась не как задача редукции, т. е. погрешность интерпретации не минимизировалась. Получены [6] новые методы и алгоритмы редукции измерения, применимые при вероятностной модели измерения когда измеряемый сигнал принадлежит известному выпуклому замкнутому множеству. Показано, что новая оценка при определённых условиях точнее в с. к. известных оценок редукции, дана оценка точности новой оценки, и в численном эксперименте на разработанном комплексе программ получены свидетельства её верности. Получены [8] методы и алгоритмы оценивания отклика неизвестного измерительного преобразователя (ИП) на заданный сигнал и результата редукции измерения, выполненного на нем, основанные на априорной информации об ИП и данных тестовых измерений на нём, в отличие от ранее известных методов, с учётом искажений объектов, с которыми он взаимодействует, в случае вероятностной модели измерения. Показана оптимальность полученных оценок в классе линейных. Предложен [5] способ единого представления всей имеющейся у исследователя информации о модели измерения и о цели исследования в задачах редукции измерений (при вероятностной, нечеткой и/или субъективной модели измерения), а также комбинирования информации, верификации, выявления дезинформации и её удаления с помощью этого представления. Для повышения качества редукции это позволяет комбинировать информацию, предложенную разными исследователями и сформулированную в терминах различных математических подходов, верифицировать её и использовать всю верифицированную информацию при минимальном риске ухудшения качества интерпретации. С помощью "Интеллектуального интерфейса" построена [4] математическая субъективная модель измерений температуры воды в открытом водоеме, выполненных по схеме y_j = f(t_j) + v_j, j = 1, …, n, j=1,...,n, в некоторой точке водоёма через равные промежутки времени, где y_j - известный результат j-го измерения, f(t_j) - измеряемая температура, v_j - погрешность j-го измерения, в которой шум, значения f(t_j) и v_j, j = 1,…, n, неизвестны, и требуется решить задачу субъективной интерпретации данных измерений y_1, …, y_n, т.е. определить f(t_1), ..., f(t_n). При решении задачи интерпретации данных измерений использованы априорные представления исследователя, согласно которым в силу физических свойств воды в обычных природных условиях зависимость её температуры от времени должна быть достаточно гладкой, поскольку вода обладает большой теплоёмкостью и малой теплопроводностью, а возможные флуктуации температуры обусловлены ветром, перемешиванием воды, шумом измерений и другими процессами. При этом от исследователя не требуется моделировать математические свойства шума. Выбрав порядок сплайна, исследователь изменяет фактор гладкости сплайна, анализируя одновременно зависимости от значений фактора: графика сплайна, моделирующего зависимость f(t), и графика разностей измеренных значений температуры и сплайна, моделирующего погрешности измерений. Для принятия решения исследователю требуется подобрать такое значение фактора гладкости сплайна, при котором на гладком графике не будет фрагментов, свойственных графику разностей, моделирующему зависимость шума от времени, а на графике разностей исчезнут фрагменты, свойственные гладкой зависимости, моделирующей зависимость от времени температуры воды. Определив искомое значение фактора гладкости, исследователь присваивает субъективные значения правдоподобий истинности графиков, моделирующих зависимости температуры воды от времени, и графиков, моделирующих зависимости шума от времени. С этого момента фактор гладкости рассматривается как неопределённый элемент, заданный двумя условными распределениями правдоподобий: при условиях, что он субъективно характеризует истинности графиков зависимостей от времени температуры и шума. Эти распределения независимы в силу независимости соответствующих субъективных суждений исследователя. На Рис. 6 приведены результаты восстановления подобной субъективной модели измерений температуры воды и субъективной интерпретации данных измерений, когда часть данных измерений потеряна. В модельных измерительных экспериментах, в которых реальные данные измерений и шум известны, и при сравнении реальных данных измерений с данными субъективной интерпретации, показано, что минимум с.к. значений их разностей достигаются на оптимальных интерпретациях максимального правдоподобия. В результате регрессионного анализа сглаженного ряда динамики температуры в [12] был сделан вывод об увеличении среднегодовой температуры воздуха в Тверской области за 1971-2016 гг. на 1,9°С. При этом линейный коэффициент корреляции Пирсона принимает максимальное значение 0,95 при сглаживании исходного ряда температуры с интервалом 8 лет. Значимость и адекватность построенной модели подтверждены результатами проверки статистических гипотез о значении параметров регрессии и анализа остаточной составляющей. Полученный в данном регионе тренд температуры согласуется с современными климатическими изменениями, для которых характерно повышение средней глобальной температуры воздуха. В результате Фурье-анализа периодических изменений в ряду динамики температуры воздуха помимо сезонных колебаний обнаружены [12] также циклические изменения с периодами 8 лет и 3 года. Вклад циклической составляющей ряда в суммарную периодограмму составляет более 50%. Анализ сингулярного спектра (SSA) ряда температуры также подтвердил, что основной вклад во временной ряд вносят гармоники около 8 и 3 лет, вызванные особенностями атмосферной циркуляции и 11-летних циклов солнечной активности. Исследования, проведённые геофизиками, показали, что существенный вклад в колебания температуры воздуха вносят гармоники с периодами до 2,75 лет, а также гармоники ENSO (El Nino Southern Oscillation) с периодами 3,9-6,18 лет (в среднем - 4 года) и с периодами 6,4-9,1 (в среднем - 8 лет). ENSO является частью глобальной системы атмосферной циркуляции и оказывает значительное влияние на изменчивость погоды и климата. На особенности атмосферной динамики и формирование основных гармоник ряда температуры могут оказывать влияние также полные 11-22 летние циклы солнечной активности. Наиболее выраженным является 11-летний (в среднем) цикл Швабе-Вольфа, в котором за первые 3-4 года происходит увеличение числа солнечных пятен и усиление других проявлений солнечной активности, а в течение последующих 7-8 лет – обратный процесс. Выполнено иследование применимости методов нечеткой, нечеткой-неопределенной математики и теории возможностей в задачах интервального оценивания и общей теории принятия решения. В его рамках: 1. Получена оценка границ применимости теоретико-вероятностных методов в общей теории оценивания на примере задачи о двух средних. 2. Произведено исследование взаимосвязи байесовского и фидуциального подходов с подходом, основанном на нечеткой и нечеткой неопределенной информации в теории интервального оценивания. Разработана версия морфологического алгоритма выделения изображений неизвестных объектов на фоне, форма которого известна, с подвижным локальным полем зрения с шагом в 1 пиксель, асимптотическая производительность которого превышает производительность алгоритма, в котором шаг смещения локального поля зрения равен его размеру. Принята к печати глава коллективной монографии в серии «Series on Language Processing, Pattern Recognition, and Intelligent Systems» издательства World Scientific Publishing, Ltd. (UK), посвященной достижениям российских ученых в области анализа изображений, распознавания образов и смежных разделов информатики и прикладной математики. Название главы: «Morphological Image Analysis. Mathematical Foundations and Applications», авторы Пытьев Ю. П., Чуличков А.И., Фаломкина О.В., Зубюк А.В., Балакин Д.А. Один из параграфов главы посвящен субъективным моделям морфологического анализа. | ||
2 | 1 января 2019 г.-31 декабря 2019 г. | Новые методы, алгоритмы и программы математического формализма субъективного моделирования в научных исследованиях для построения математической модели объекта исследования, адекватной цели его исследования, и оптимизации заключений о его исследуемых свойствах, в условиях априорной неполноты и противоречивости формализованных и неформализованных знаний объекта исследования и его модели |
Результаты этапа: На примере задачи интерпретации измерений температуры воды в водоеме рассмотрена задача субъективной интерпретации и субъективного анализа данных измерений при помощи математического формализма субъективного моделирования в случае, когда модель измерений определяется лишь аддитивностью шума и субъективными представлениями исследователя о гладкости интересующей его зависимости температуры от времени и «негладкостью» шума. Показано, что наблюдаемая при интерпретации ее максимальная точность может служить критерием истинности предложенной исследователем субъективной модели, поскольку в задаче интерпретации максимизируется правдоподобие результата интерпретации и полученной при этом реализации шума, а не точность. Опубликовано в статье Pyt'ev Y. P., Falomkina O. V., Shishkin S. A. Subjective restoration of mathematical models for a research object, its measurements, and measurement-data interpretation // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. 2019. Vol. 29, no. 4. P. 577–591. Получен метод редукции изображений к виду, свойственному измерениям пространственного распределения интересующей исследователя оптической характеристики объекта исследования при помощи идеального датчика (в частности, имеющего размер меньше размера реально использованного датчика), в котором используется субъективная информация, согласно которой значения близко расположенных точек объекта, как правило, отличаются незначительно. «Как правило» и «незначительно» отражают субъективные представления исследователя об объекте исследования. Полученная оценка близка к известным в математической статистике оценкам типа Джеймса–Стейна, поскольку уменьшение погрешности достигается за счет комбинирования оценки редукции, при построении которой не используется субъективная информация, но которая заведомо передает все детали объекта (в оценке Джеймса–Стейна аналогичную роль играет оценка метода наименьших квадратов) и оценки, существенно основанной на априорных представлениях вплоть до независимости от результата измерений (в оценке Джеймса-Стейна такую роль играет значение параметра, которое, по мнению исследователя, является наиболее ожидаемым). Но если в оценке Джеймса-Стейна комбинирование является линейным, то в полученном методе комбинирование производится покомпонентно, отбором компонент комбинируемых оценок методами проверки статистических гипотез. Показан способ эмпирической верификации такого рода субъективной информации. Предложен метод выбора наиболее правдоподобного решения недоопределенной системы линейных уравнений за счет учета априорной субъективной информации о правдоподобии возможных решений, выраженной не непосредственно предложенной исследователем субъективной моделью, а на языке «мягких» неравенств, выражающих субъективные мнения исследователя вида «значение компоненты 1 скорее всего превосходит значение компоненты 2». Показано, что задача поиска наиболее правдоподобного решения сводится к задаче линейного программирования, и проведено исследование предложенного метода. | ||
3 | 1 января 2020 г.-31 декабря 2020 г. | Новые методы, алгоритмы и программы математического формализма субъективного моделирования в научных исследованиях для построения математической модели объекта исследования, адекватной цели его исследования, и оптимизации заключений о его исследуемых свойствах, в условиях априорной неполноты и противоречивости формализованных и неформализованных знаний объекта исследования и его модели |
Результаты этапа: Разработаны и исследованы методы решения задач эмпирического восстановления субъективной математической модели объекта исследования (ОБИ) и субъективной интерпретации данных его измерений, искажённых шумом, математическая модель которого неизвестна, и "пропусками" данных измерений ОБИ, когда математическая модель измерений также неизвестна. Для постановки и для решения названных задач использован математический формализм субъективного моделирования (МФСМ), позволивший математически сформулировать как субъективную модель ОБИ, так и субъективную модель его измерений и их субъективной интерпретации с учётом восстановленных данных измерений в "пропусках", и интеллектуальный программный интерфейс, обеспечивший диалог модельера-исследователя с МФСМ. Для реализации заявленной программы использованы субъективные представления модельера-исследователя (м-и) о физических свойствах ОБИ и о средствах его измерений, о математических свойствах шума и т. п.; вся субъективная информация основана на научном опыте м-и и на его интуиции учёного. Изучено использование собственного базиса модели интерпретации измерения в задаче редукции измеренных видеоданных к виду, свойственному измерениям ОБИ идеальным датчиком. При этом используется редукция не сразу всех видеоданных после завершения их регистрации, а данных, накопленных по мере их поступления, а исследователь может в каждый момент времени остановить процесс измерений. Рассмотрены два метода, позволяющие сформировать оценку, имеющую меньшую погрешность, чем погрешность линейной редукции, ценой детерминированного искажения оценки, характеризуемого подпространством значений интересующей исследователя характеристики, не влияющих на результат оценивания. В первом методе оценка формируется при помощи отбора компонент в собственном базисе так, чтобы среднее значение квадрата нормы шума не превышало заданное, а во втором — определением составляющей оценки, относительно которой может быть принята гипотеза о ее равенстве нулю, и замены этой составляющей на нулевую. Второй способ позволяет в ряде случаев получить более значительное подавление шума при меньшем искажении. Показано, что в обоих способах применение собственного базиса модели измерения позволяет выполнять значительную часть вычислений параллельно, так как принадлежащие различным собственным подпространствам компоненты данных обрабатываются независимо. Накопление информации, представленной в собственном базисе модели измерений, при условии неизменности собственного базиса, также производится независимо для принадлежащих различным собственным подпространствам компонент оценки, а объем хранимой информации фиксирован, что положительно влияет на быстродействие параллельной реализации предложенных методов. Разработан эвристический алгоритм поиска матрицы парных сравнений, минимизирующей сумму расстояний до матриц парных сравнений, связанных с распределениями правдоподобий различного происхождения и в связи с этим выраженных в разных шкалах значений правдоподобий. В отличие от многих распространенных алгоритмов решения этой задачи, он корректно обрабатывает распределения с равноправдоподобными элементарными событиями. Алгоритм реализован на языке Julia. Предложенный на этапе 2019 года метод выбора наиболее правдоподобного решения недоопределенной системы линейных уравнений при помощи «мягких ограничений» обобщен для решения некорректно поставленных обратных задач с использованием априорной информации, представленной в форме мягких ограничений. Даны постановки задач с мягкими качественными ограничениями и предложены численные методы их решения в линейном и нелинейном случаях. В линейном случае задачи сводятся к задачам линейного программирования. В нелинейном предложены градиентные методы их решения, причём для автоматического дифференцирования функций предложено использовать возможности библиотеки TensorFlow. Продолжены исследования тенденций изменчивости концентрации CO2 в различных временных диапазонах по данным измерений. Для этого использован ряд методов, как специально разработанных (морфологических),так и модифицированных из известных (Фурье-или вейвлет-анализ). Определены области применимости каждого из методов, в результате получен набор методов, позволяющих выделять циклические компоненты ряда в широком диапазоне их периодов. Предложена математическая модель формы сигнала, отражающая суточную динамику концентрации CO2, в виде функции, направление выпуклости которой меняется на противоположное в точках перегиба. Эти точки являются параметрами формы фрагмента сигнала, моделирующего суточный ход концентрации CO2. Считается, что два фрагмента сигнала имеют одинаковую форму, если интервалы их выпуклостей вверх и выпуклостей вниз совпадают. Для выделения суточной циклической составляющей из исходного временного ряда выбирается составляющая, моделирующая суточную динамику концентрации СО2 путем решения задачи наилучшего приближения участков ряда сигналами заданной формы. Далее исследуется остаток ряда, представляющий собой разность исходного ряда и его аппроксимации. Метод морфологической фильтрации позволил выделить суточную циклическую составляющую и анализировать остаток ряда для оценивания составляющих с периодом, меньшим, чем 24 часа. Метод, основанный на Фурье-преобразовании, позволил выделить циклические составляющие анализируемого ряда с периодом, как большим, так и меньшим, чем 24 часа. Вейвлет-анализ позволил выделить и локализовать во времени составляющие с периодом, большим, чем 24 часа. Таким образом, предложен набор методов, позволяющих выявить цикличность рядов в широком временном диапазоне. Подготовлена к публикации статья, в которой рассмотрены постановки и решения задач эмпирического восстановления субъективной математической модели объекта исследования (ОБИ), схемы его измерений и субъективной интерпретации данных измерений, искажённых "пропусками" данных измерений ОБИ и шумом, математическая модель которого неизвестна. Статья посвящена исследованию и решению актуальной задачи субъективного восстановления пропущенных данных измерений и влияния пропусков на качество решения задач субъективного моделирования. В статье поставлена, решена и исследована задача восстановления пропущенных данных измерений. Приведены результаты сравнительного анализа ошибок "автоматического" и субъективного методов восстановления пропущенных данных измерений. Для решения задачи определения скорости тяжелого иона с помощью полупроводникового детектора (PIN диода) были разработаны новый метод и алгоритм на основе математического формализма субъективного моделирования. В экспериментальной практике скорость иона измеряют «по времени пролета», т.е. измеряется время пролета ионом некоторого известного расстояния – пролетной базы. Для измерения времени пролета необходимо получить временные отметки «старт» и «стоп», соответствующие моментам начала и окончания движения вдоль пролетной базы. Для получения таких отметок используют временные детекторы. Отметку «стоп» часто берут с полупроводникового детектора, например, так называемого PIN диода. При попадании иона в диод на выходе появляется сигнал (импульс напряжения), который можно представить как сумму собственно импульса напряжения, вызванного регистрируемым ионом, и аддитивного шума. Физика взаимодействия тяжелого иона с полупроводником такова, что форма сигнала представляет собой сначала медленно растущую функцию, вид которой неизвестен, выходящую потом на почти линейную зависимость (длина этого участка неизвестна). Требуется найти момент времени, когда ион попал в детектор («абсолютная временная привязка») – т.е. собственно начало сигнала, при том, что начальная часть фронта импульса лежит внутри «шумовой дорожки». Для решения задачи был разработан и реализован алгоритм, позволяющий восстановить форму фронта сглаживающим сплайном со следующим специальным условием: начальная часть сплайна (слева) задается уравнением параболы, а вершина этой параболы должна лежать на усредненной шумовой линии, поскольку в отсутствие шума фронт начинает расти с нулевой линии. Для определения оптимального сглаживающего фактора был использован математический формализм субъективного моделирования. Метод проходит апробацию на реальных ядерно-физических данных в Лаборатории ядерных реакций Объединенного института ядерных исследований (г.Дубна). По результатам исследований готовятся к публикации две статьи в тематических журналах. Разработана программа для изучения алгоритмов выделения неизвестного объекта на фоне, морфологическая форма которого известна. Программа предоставляет возможность вычисления и визуализации морфологической разности, ее нормы, места появления нового объекта при помощи нелокального алгоритма, алгоритма с подвижным локальным полем зрения, алгоритма, использующего разбиение поля зрения. Полученная программа проверена на модельных изменениях изображений (яркость-контраст, градиенты, волны, пятна, шум с заданной степенью размытия), полученных с использованием специальных подходов и технических средств (цифровой фотоаппарат, не имеющий механических вибраций при съемке нескольких кадров подряд; получение изображений не только в видимом, но и в ближнем инфракрасном диапазоне; авторские программные средства подготовки изображений для вычислительных экспериментов, минимизирующей влияние несовершенства технических средств съемки, не имеющего отношения к цели исследования). Исследована работоспособность «нелокального» метода в «хороших», «средних» и «плохих» случаях, влияние отклонений от «идеальных» условий (нарушение постоянства яркостей областей, масштаба и совмещенности изображений) на его результаты и сравнение с «локальными» методами. Изучено влияние типа и параметров «локальных» алгоритмов на результаты работы для разных типов объектов («высокочастотный», «однотонный», «полупрозрачный» и «промежуточные» между ними) и фона. В частности, изучено влияние как «физических» изменений условий регистрации (изменение типа, состава и направления источников света, параметров экспозиции и светочувствительности при съемке, смешение цветных изображения в изображения в шкале серого с разными коэффициентами для эталонного и предъявленного изображений), так и модельных (добавление в исследуемое изображение программными средствами модельных «градиентов», «волн», «пятен», шума выбранной степени размытия, изменение яркости и контраста) на результаты работы алгоритмов. Во всех исследованных случаях «тривиальная» разность эталонного и предъявленного изображений не позволяла выделить объект. |
Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".