Тезисы статей, представленных на 47 конференции МФТИ - фирме ЛАНИТ

Тезисы статей - Парадигма трех миров и управление знаниями, Процессы без людей – проблемы интеграции и пути их решения

~

Парадигма трех миров и управление знаниями
В.В. Рыков
Московский физико-технический институт (государственный университет)
Rykov2000@mail.ru
Сейчас все чаще употребляется термин «управление знаниями». Однако употребляется этот термин часто неоднозначно и по-разному. Начнем с определений.
«Под управлением знаниями в общем случае понимается дисциплина, которая обеспечивает интегрированный подход к созданию, сбору, организации, доступу и спользованию информационных ресурсов организации . Эти ресурсы включают в себя корпоративные базы данных, текстовую информацию, такую как документы, описывающие правила и процедуры, и, что наиболее важно, неявные знания и опыт сотрудников организации» [9].
Это достаточно авторитетное определение международной фирмы IBM. Согласно этому определению, видно, что управление знаниями есть достаточно сложная и совершенная система управления информацией. Об этом же говорит и другое определение ниже.
»Под корпоративными знаниями понимается различная деловая информация, которую необходимо иметь для поддержки на высоком уровне основных бизнес-процессов предприятия, а также для быстрого реагирования на динамику рынка. В более широком смысле знания - это информация, материализованная в процессе решения конкретной задачи в виде каких-то конкретных действий людей, стремящихся достичь своих конкретных целей» [3].
Рассмотрим другие определения.
«При внедрении технологий управления знаниями особое внимание мы уделяем стратегии создания и развития хранилищ корпоративных данных, которую мы увязываем со стратегическими аспектами развития всей компании и потребностями конкретных бизнес-процессов» [5].
Согласно этому определению получается, что управление знаниями есть достаточно сложная и совершенная система управления данными.
На самом деле противоречия в этих определениях нет. Во-первых, во многих англоязычных публикациях специально отмечают, что knowledge management – это единый термин, определяющий определенного уровня сложности кибернетическую программную систему. И это не есть management of knowledge.
Тем не менее, до сих пор не прекращаются попытки разобраться, в чем разница между тремя понятиями – данные, информация и знания [2]. Для этого лучше всего начать с классики. Великий славянский философ восемнадцатого века Григорий Сковорода в своем сочинении «Потоп змиин» описал концепцию трех миров. Согласно его описанию, в первый мир входит окружающая нас реальность (по английски Reality – R). Во второй мир входит внутренний мир человека (английский термин Mind или М). Третий мир, согласно Г. Сковороде, есть мир знаков (signs – или S) [7]. Действительно, этот мир не пересекается ни с одним из первых двух миров. Трудно сомневаться в автономности существования мира знаков в эпоху Интернета. Особенно, если это было предсказано более двухсот лет назад. Независимо от Сковороды к открытию третьего мира пришли некоторые западные философы XX века – например Карл Поппер. Этот мир он даже называл «третьим миром» [4]. Эта парадигма давно уже не является периферийной, полузабытой или невостребованной. Философия Карла Поппера входит в аспирантский минимум [6]. О концепции трех миров Г. Сковороды недано вышла солидная книга с одноименным названием. Автор – сотрудник Института славяноведения РАН [8].
Как известно, философские системы в зависимости от признания первичности существования одного из первых двух миров делятся на материалистические (первичность материального или реального мира R) или идеалистические (первичность духа или внутреннего мира М). Однако, понятие слова как обобщенный образ знакового мира также встречается в текстах, и даже в очень древних. Обсуждается также и вопрос о его существовании и первичности. Так, гностическое евангелие от Иоанна начинается со слов «Вначале было Слово, и Слово было у Бога и Слово было Бог». Достаточно ясно сказано о Слове как о третьем мире и о проблеме его первичности, происхождения и т.д. – причем достаточно авторитетным автором.
Теперь можно продолжить рассуждение о том, как эта теоретическая конструкция может послужить информационным технологиям. Здесь более актуальной и плодотворной является проблема не первичности, а принадлежности. Действительно, данные – это явления реального мира. Это намагниченные участки дисков, бороздки грампластинок и CD, модулированные радиоволны и т.д. Их можно измерить, а часто и увидеть или пощупать. Однако эти данные несут в себе закодированную информацию, которая может быть воспринята только если она преобразуется в знаки – визуальные, звуковые. На экране компьютера мы видим их знаковое содержание. Через динамик мы слышим закодированные звуки с грампластинки или переданные по радио. Это не является открытием, а констатацией факта. Информация имеет знаковую природу и принадлежит миру знаков. Аналогичное рассуждение приводит к выводу, что знание принадлежит внутреннему миру человека. В полном объеме только в сознании человека происходят сложные и простые когнитивные процессы – от сложных доказательств теорем до аристотелевых силлогизмов. И сейчас ведутся работы по моделированию и переносу самых элементарных их этих процессов в кибернетические системы.
Итак, данные – это объекты материального мира. Информация – это знаки, полученные при преобразовании данных в сознании человека или в процессоре компьютера. Знания же пока есть только у человека или в самом элементарном виде в кибернетических системах (КС). Но пока не в системах управления знаниями.
Можно легко проиллюстрировать проделанное рассуждение. Если мы введем в КС следующие два факта:
1. Студент Петров учится в 925 группе.
2. Студенты Иванов и Петров учатся в одной группе.
После этого сделаем системе запрос:
- В какой группе учится студент Иванов?
На этот вопрос ответит любой школьник, но представляется интересным узнать – какая система управления знаний ответит правильно на такой вопрос.
Здесь и пролегает различие между самой передовой системой управления знаниями (в описанном выше смысле – как совершенная ИС) и системой, на самом деле способной обрабатывать знания. Такой системе присуще существенное свойство, которое можно принять за критерий определения настоящей системы, работающей со знаниями – а именно способность порождать новые или прибавочные знания в результате собственных внутренних когнитивных процессов [1].
В заключение стоит отметить еще один важный факт, требующий для понимания некоторой философской культуры. Источник знания не есть еще само знание. Текст есть знаковая конструкция и часто содержит знание. Но текст есть не знание, а его источник. Знания из текста еще нужно извлечь. Человеку или КС. Это также справедливо для реальной действительности. Там содержится огромный объем знаний. И выявить и описать их – задача естественных наук. То есть окружающий нас материальный мир - это тоже есть не знание, а только его источник. Также как и одно из его реализаций – данные на любом материальном носителе.

Литература

1. Беляев И. П., Капустян В. М. Процессы и концепты. – М. , 1997.
2. Леонов А. В. Динамический документ – ключевой объект современных информационных систем // Виртуальная реальность на кластерах персональных компьютеров. Международная конференция. 9-13 июня 2003 года, Москва, НИВЦ МГУ. – Протвино, 2003.
3. Простаков И.Е. Технологии управления корпоративными знаниями // Всероссийская научно-техническая конференция «Наука и образование» - 2002. - М., 2002.
4. Поппер К.Р. Логика и рост научного знания. - М.: Прогресс, 1983.
5. Применение технологий управления корпоративными знаниями. – Красноярск: Partner Business Consulting, 2004.
6. Садовский В.Н. О Карле Поппере и судьбе его учения в России // Вопросы философии. - №10. - 1995.
7. Сковорода Г. Сочинения. – М.: , 2003.
8. Софронова Л.А. Три мира Григория Сковороды. – М.: Индрик, 2002.
9. Технологии IBM для электронного бизнеса. - М., 2004. – http://www-106.ibm.com/developerworks/patterns/ru_ru/



===================


Процессы без людей – проблемы интеграции и пути их решения
В.В. Рыков
Московский физико-технический институт (государственный университет)
Rykov2000@mail.ru
Практическая деятельность человека чаще всего выражается в его действиях над самыми разными объектами. В процессе интеграции такой деятельности в современную ИС ее принято описывать бизнес процессами, состоящими из бизнес действий над бизнес объектами.
Как правило, проектирование ИС происходит при той или иной форме взаимодействия заказчика, знающего предметную область (ПО), в которой протекает деятельность, которую требуется интегрировать в ИС, и постановщиком (аналитиком). Интерфейс между ними реализуется сначала на словесном уровне и начинается с выяснения набора объектов и действий над ними, которые и составляют эту ПО. Как правило, желательным результатом этого первого этапа создания ИС является процессная схема, представленная в графическом виде в определенной нотации. Существуют прграммные системы, позволяющие проверить такую нотацию на непротиворечивость и соответствие стандартам (ARIS, BPwin и др.) [1, 4, 5, 6].
На втором этапе приходится расщеплять составленную ранее процессную схему на рутинную и творческую составляющие. Здесь реализуется так называемый принцип рутинного подкрепления творческих процессов принятия решений - процедура проектирования сводится к выделению автоматизируемых бизнес процессов, которые могли бы протекать без вмешательства человека и последующей инкорпорации их в построенную процессную схему, соединение их с творческими, неформализуемыми составляющими ИС. Далее, на третьем этапе, каждый из объектов, определяющих рутинные составляющие, подвергается дальнейшей формализации с целью записи их в БД – т.е. с целью описания их как частей полностью автоматизированного бизнес процесса [1].
В процессе выполнения этих трех этапов ставшей уже классической схемы приходится сталкиваться в той или иной форме с проблемами интеграции в единую ИС совершенно разнородных бизнес объектов. Наиболее проблемным является третий этап – построение формальной модели программно реализованного бизнес процесса, выполняемого без вмешательства человека. В сфере финансовых услуг, где такие процессы используются в наибольшей степени, их называют процессами класса Straight Through Processing (STP) или по-русски это называется «сквозная обработка данных» [4,5].
Следовательно, для того, чтобы спроектировать STP бизнес процесс нужно решить следующие проблемы [3,6,7]:
1. Интегрировать в него необходимые бизнес объекты (БО) – Datasource Integration. Дело в том, что они могут иметь самый разнообразный формат и природу. Это могут быть БД разных систем, сообщения, файлы и многое другое, содержащие, в свою очередь таблицы, документы, транзакции и т.д.
2. Синхронизовать бизнес действия над БО – Event Integration. Действительно, бизнес действия, входящие в состав данного STP бизнес процесса протекают в определенных временных интервалах и находятся зачастую в сложных временных зависимостях. Начало, конец, особые ситуации в процессе выполнения любого действия обозначаются как асинхронные события (business events). Для описания этого существуют уже XML-подобные языки (например, PSL – Process Specification Language).
3. Решить проблему именования. – Vocabulary Integration. Здесь речь идет о компоненте, пока отсутствующей на рынке интеграционных платформ [6,7]. Имется в виду не только управление справочно-нормативной информацией. Одни и те же единицы интеграции разных уровней (поля БД и многое другое) могут иметь разные имена и наоборот – у разных единиц одинаковые имена, в силу того, что они могли создаваться в разное время разными людьми.
Конечно, эти проблемы присутствуют в разной степени и в разном объеме при проектировании ИС. Однако, успешные и достаточно общие подходы к решению этих проблем безусловно повышает скорость и качество проектирования, а также различные параметры производительности уже готовых ИС. Также может быть много подходов к решению этих проблем – в зависимости от многих причин. Так, разработаны форматы метаданных для единообразного описания любых источников данных (CWM), существует технология мэппинга этих метаданных в онтологию, отражающую самые существенные свойства интегрируемых частей. Резко повышает гибкость и опреативность процедур мэппинга технология интеллектуальных многоагентных систем, приобретающую все большую популярность в ИТ [3,4,5,6,7].
Все это в целом позволяет говорить о возможности реализации когнитивной структуры – метаонтологии, представляющей собой динамический образ работающего без вмешательства человека бизнес процесса, формирующейся методом мэппинга из интегрируемых источников данных (бизнес объектов) при помощи технологии интеллектуальных агентов как практически реализуемой в разных формах информационной технологии интеграции разнородных бизнес объектов и бизнес действий в STP бизнес процесс. При необходимости такое онтологическое описание БП может быть преобразовано в более удобные для обработки XML формы (XPDL, BPML, BPEL, RDF/T) [2,5,7] .


Литература

1. Беляев И. П., Капустян В. М. Процессы и концепты. – М. , 1997.
2. Лукашева Н. К. Универсальный онтологический подход к описанию бизнес процессов. Теория и практика. Дипломная работа на степень бакалавра. – М.: МФТИ, 2004.
3. Круговец А.С. Технология многоагентных систем, их применение и реализация на основе технологии dot NET. Дипломная работа на степень бакалавра. – М.: МФТИ, 2003.
4. Резниченко А. К процессам без людей // PCWEEK/RE. – N. 34. – 2004 г.
5. Технологии IBM для электронного бизнеса. - М., 2004. – http://www-106.ibm.com/developerworks/patterns/ru_ru/
6. Тропин В.А. Интеграция бизнес процессов методом онтологий. Дипломная работа на степень бакалавра. – М.: МФТИ, 2003.
7. Omelayenko B. Ontology-Mediated Business Integration // Proceedings of the 13-th EKAW 2002 Conference, , October 1-4, LNAI 2473. - Siguenza, Spain, 2002. - pp. 264-269.


~

Тезисы статей

~

Управление метаданными как способ повышения эффективности
создания корпоративных хранилищ данных.
«Корпоративный каталог показателей»
В.В. Дельцов1, А. В. Шовкун2
1 Московский физико-технический институт (государственный университет)
2 Московский Инженерно-Физический Институт (технический университет)
vasya_deltsov@mail.ru
Одним из способов снижения общей стоимости владения корпоративной информационно-аналитической системой (КИАС) и обеспечения конечных пользователей необходимыми данными и инструментами для анализа информации в масштабах всей организации является использование технологии построения КИАС на основе конфедеративного управления метаданными, поддерживаемой в продукте компании ЛАНИТ "Корпоративный Каталог Показателей" («ККП»).
Интегрирование программных продуктов и инструментов на уровне метаданных позволяет вдвое сократить количество ручных операций при создании КИАС.
Одним из ключевых препятствий на пути освоения и эффективного использования КИАС прикладными (бизнес) пользователями является непрозрачность информационного содержимого системы. Бизнес пользователи обычно жалуются на то, что сложно понять, какая информация вообще есть в системе. При этом у них уходит много времени на поиск и получение доступа к нужным данным.
В работе описываются основные функции программного продукта «ККП», позволяющие:
· централизованно хранить метаданные КИАС;
· разделить бизнес и технические метаданные;
· отлеживать зависимости между объектами метаданных;
· решить проблемы, связанные с поддержкой версионности сложных объектов;
· сравнивать различные версии составных объектов.

Литература
1. Сайт "Корпоративного каталога показателей" http://bi.lanit.ru/products/emc.htm - ЛАНИТ. - 2004.
2. Common Warehouse Metamodel: An Introduction to the Standard for Data Warehouse Integration, J. Poole, D. Chang, D. Tolbert, D. Mellor, John Willey & Sons, Inc., 2002
3. Современные способы представления метаданных, Шовкун А.В, Соколов М.В., Научная сессия МИФИ-03, Москва 2003
==========
Средства объектно-реляционного отображения языка Java.
А.Н. Головенко, В.А. Жиляев
Московский физико-технический институт (государственный университет)

Современные многоуровневые приложения устроены таким образом, что данные приложения хранятся в реляционных базах данных, а обрабатываются на более высоком объектном уровне. Таким образом, мы имеем дело с объектной и реляционной моделями данных. Объектная и реляционные модели данных существенно различны, поэтому у любого средства объектно-реляционного отображения есть свои недостатки.

Технология EJB Entity Beans представляет собой формат, разработанный компанией Sun. Но его реализация осуществляется каждым вендором, предоставляющим EJB контейнер, самостоятельно. Конкуренция между вендорами способствовала разрастанию формата. И как следствие, он предоставляет широкий функционал, одновременно являясь тяжелым для изучения.[1]
К достоинствам EJB Entity Beans можно отнести:
· распределённость
· масштабируемость
· безопасность
· наличие механизма persistence
К недостаткам:
· громоздкая система из нескольких интерфейсов, необходимость наследования от javax.ejb
· язык запросов предоставляет мало возможностей

EJB Entity Beans применялись при создании торгового портала. Из-за простоты реляционной модели, ограниченность EJB QL не представляла какой либо трудности. В приложении активно использовалась распределённость Entity Beans.

Hibernate (www.hibernate.org) - инструмент объектно-реляционного отображения для Java окружения. Одно из наиболее популярных ORM-средств.[3]
К достоинствам hibernate можно отнести:
· удобный язык запросов
· наличие механизма persistence
· возможность использования как внутри EJB-контейнеров, так и в standalone приложениях
· открытость продукта и возможность его бесплатного использования
Среди недостатков продукта можно отметить:
· невозможность собрать объект, “размазанный” по нескольким таблицам, не прибегая к помощи промежуточных объектов
· ограниченность persistence сессией hibernate

Hibernate использовался авторами работы в процессе разработки приложения для издательской системы. Фреймворк проявил себя с лучшей стороны, позволяя создавать сложнейшие запросы по довольно запутанной схеме данный, избавив тем самым авторов от написания SQL-кода. Поскольку защищенность и распределённость приложения достигалась с помощью использования EJB Session Beans, то совместимость Hibernate и EJB тоже оказалась весьма полезной.
Литература
1. Ричард Монсон-Хейфел "Enterprise JavaBeans", третье издание O''REILLY 2002.
2. Гектор Гарсиа-Молина, Джеффри Д. Ульман, Дженнифер Уидом "Система баз данных. Полный курс" Вильямс, Москва - Санкт-Петербург - Киев 2004.
3. Christian Bauer, Gavin King. “Hibernate in action” Manning Publications Co. 2004.

================

Создание централизованной информационно-аналитической системы на примере проекта в ОАО “Детский-Мир Центр”.
А.С. Круговец1 , А. Клименков2
1 Московский физико-технический институт (государственный университет)
2Московский Государственный Университет
alexey@dgap.mipt.ru
В работе рассмотренно создание централизованной аналитической системы, позволяющей проводить анализ финансовых и хозяйственных показателей на базе консолидированной по всему предприятию информации и формировать отчеты без нагрузки ключевых оперативных систем. Опыт российских и зарубежных торговых компаний показывает, что внедрение аналитических систем является абсолютно необходимым для поддержки роста и расширения организации.
Необходимость автоматизации заключается в том, что существующая реализация цепочки «Сбор данных»-> «Сведение данных»-> «Получение отчетов и анализ» может обеспечивать только небольшие товарообороты и может оказаться критичной для планов развития. [1] Система предназначена для оперативного учета товародвижения и обслуживания клиентов, и, хотя, содержит средства получения оперативных отчетов, не может выполнять функции формирования стандартной отчетности и бизнес анализа.
На основании составленных требований к такой системе, [2] были выбраны програмные продукты и обеспечение для создания КИАС, которая успешно внедряется компанией BI Partner в рамках проекта с ОАО “Детский-Мир Центр”.


В качестве информационного хранилища системы предлагается использовать Oracle 9i Standard Edition. [3] Среда анализа данных аналитиками и коммерсантами ОАО «Детский мир – Центр» разворачивается на основе ПО Cognos PowerPlay. Создание и распространение отчетов будет производиться на основе ПО Cognos ReportNet. ReportNet предназначен для обеспечения конечных пользователей, не знающих SQL и структур источников данных, возможностью самостоятельно строить запросы и создавать аналитические отчеты. [4]


Такая концепция позволяет выполнять многомерный анализ в режиме реального времени, легко выявлять влияние каждого аспекта деятельности организации на другие аспекты и на конечные результаты. Бизнес правила и экономические расчеты (например: процент роста доходов) могут быть встроены в кубы и автоматически просчитаны каждый раз при обращении к данным куба.[5] Пользователи могут получить доступ к кубам с использованием средств операционных систем, клиентов Excel. Для защиты информации обрабатывающейся и хранящейся в системе применяются механизмы контроля доступа, использующие различные характеристики пользователя.
Литература
1. Usama Fayyad "Optimizing Customer Insight” Intelligent Enterprise. May, 2003.

2. Keith Gile, Laurie M. Orlov, Colin Teubner, and Philip Russom "Grading BI Reporting And Analysis Solution" Forrester Research. August, 2004..

3. А. Стулов 2002 "Хранилища данных: основные архитектуры и принципы построения в реляционных СУБД" http://www.bipartner.ru/resources/dw_arch.html
4. Richard Connelly, Robin McNeill, Roland Mosimann "Multidimensional manager", Published by Cognos Inc., 2001
5. Nigel Pendse, OLAP Architectures: The OLAP Report, http://www.olapreport.com/Architectures.htm#top.

===================

Аспекты методологии разработки аналитической системы поддержки управленческих решений на примере аналитической надстройки для гарантийного отдела Предприятия «Никс»
Прохоров С.П 1., Рубаев В. Ю.2, Кулигин Л.Е.2 , Чернышев М.Н.2
1 Институт Системного Программирования РАН
2 Московский Физико-Технический Институт (ГУ)

В ходе работы была разработана система аналитической отчетности для гарантийного отдела Предприятия «Никс» (далее ГО).
Учет финансово-хозяйственных операций компании ведется в CRM и ERP-системе собственной разработки. Однако данная система обеспечивает только сбор и хранение информации, а также обеспечение всех бизнес-процедур компании. Была поставлена задача разработать аналитический модуль для ГО и встроить его в систему.
Дадим определение аналитической системы поддержки управленческих решений (далее АСПУР) – это совокупность аналитических показателей (далее АП) и методик расчета данных показателей, удовлетворяющим временным и ресурсным ограничениям, а также инструментов расчета АП, обладающих пользовательской простотой. АП – это однозначно определенный вид информации, необходимой для принятия управленческого решения и характеризующее состояние (или изменение состояния) бизнес-единицы. Значение АП – количественное значение такой информации за определенный период или в конкретный момент времени.
Под временным и ресурсным ограничением мы понимаем возможность расчета АП на средней ЭВМ за время, много меньшее, чем предельное время, отведенное на принятие управленческого решения. В нашем случае стояла задача разработать систему расчета таких показателей на ЭВМ Intel Celeron 2.66 Гц, 256 Mb RAM, MS Windows 2000 SP3 менее чем за 10 минут.
Инструмент для расчета АП по определенной методике обладает пользовательской простотой, если:
· сам АП понятен руководителю и адекватен (ожидаемому) уровню его образования. Сложные математические модели, малопонятные руководителю Предприятия, теряют свой первоначальный смысл и обретают мистические свойства.
· инструмент (интерфейс для расчета АП) также понятен конечному пользователю и не требует дополнительного участия аналитика для расчета.
Таким образом, важнейшим свойством АП и методики расчета АП является свойство повторяемости. Основная работа аналитика (и важнейшая задача разработки любой АСПУР) должна заключаться не в непосредственном расчете АП, а в разработке АП (на основе реальных потребностей менеджмента предприятия) и методик их расчета. Далее к работе аналитика подключается программист, который реализует третий компонент АСПУР – а именно интерфейс.
Стоит отметить, что в рамках данной статьи не рассматривается ряд важных вопросов построения и разработки АСПУР как например, безусловно важный вопрос разграничения прав доступа и иные.
Сложность бизнес-процессов ГО заключается в том, что между бизнес-единицами циркулирует товар в различных состояниях:
исправный новый товар, исправный б/у товар, возможно неисправный, доказанно неисправный и деньги. (1)
Так, за неисправный товар клиент может получить деньги или исправный товар, а сам возвращенный товар будет обменян на деньги или исправный товар у поставщика. Бизнес-единицы могут быть как внутренними – склады Никса, подразделение ГО для обслуживания розничных покупателей, непосредственно ГО, так и внешними – поставщики, розничный покупатели, дилеры. (2)
Для расчета АП ГО можно использовать 2 методики:
I. отслеживание конечного состояния каждого проданного товара. Каждый экземпляр товара ТК «Никс» обладает серийным номером производителя и стикером ТК «Никс», образующими уникальную пару. Любое изменение состояния и местонахождения товара сопровождается созданием электронного документа в общем потоке электронных документов (tradeflow), поэтому можно отследить движение каждого товара.
II. анализ агрегированных потоков товаров и денег. Данный подход воспринимает каждую бизнес-единицу как «черный ящик», в который втекают и из которого вытекают потоки товаров и денег.
Для расчета АП в денежном выражении встает вопрос – по каким ценам (продажи/закупки/средним) и на какой момент (на дату продажи/закупки/поступления в ГО) учитывать товар в различных его состояниях: по ценам продажи или закупки.
Учитывая данное выше определение АП, была оценена ресурсоемкость каждой методики. Как показал экспериментальный расчет, временным и ресурсным ограничениям удовлетворяет только методика анализа агрегированного потока товаров и денег в совокупности с методикой учета товаров по средневзвешенным ценам. Иные методики (даже после индексирования соответствующих полей) не удовлетворяют нашим требованиям к методике расчета АП.
Результатом работы стала полноценная разработка АСПУР для ГО (изучение потребностей менеджмента Предприятия, определение набора АП и методик их расчета, реализация интерфейса АСПУР). Были разработаны следующая система АП:
1. Объем продажи каждого товара/товарной группы как в натуральном, так и в денежном выражении (с возможностью конфигурировать состав товарных групп). Под натуральным выражением понимается баланс по всем 5 состояниям товара (см. (1)).
2. Процент брака по отдельным товарам/товарным группам как в натуральном, так и в денежном выражении. Нужно отметить, что данный АП имеет смысл только в совокупности с АП п.1.
3. Баланс каждой бизнес-единицы (см. (2)) в натуральном и денежном выражении.
4. Процент товаров, признанных ГО неисправными, но признанных поставщиком исправными.
5. Большой интерес представляет набор следующих показателей, характеризующих работу поставщиком с возможно неисправным товаром: Средний срок обработки товара (принятия решения о подтверждении неисправности), коэффициент хождения товара по кругу (товар может быть признан исправным), количество товара, находящееся на обработке у поставщика в текущий момент.
На основе АП пп. 1 и 2 можно составить синтетический показатель степени надежности определенного товара/товарной группы (например, винчестеры определенного производителя). На основе пп. 3-5 можно составить синтетические показатели качества работы ГО с поставщиками, как, например, процентное соотношение каждого (см. (1)) состояния товара, возвращенного поставщиком в ГО. Очевидно, что лучше, если поставщик взамен бракованного товара возвращает деньги или новый товар, а не б/у исправный товар или тем более товар, который признан возможно неисправным.
АСПУР была внедрена в ERP-систему Предприятия и в настоящее время успешно эксплуатируется.
Литература:
1. Решетников И. Н. «Финансовый менеджмент предприятий в условиях рынка» М., 2001
2. «Интегрированная корпоративная инормационная система A-III: описание системы» М.: консалтинговая группа «Альфа», 1998
3. Ковалев В. В. «Финансовый анализ: методы и процедуры», М.: «Финансы и статистика», 2002
4. Д. Харрингтон, К. Эсселинг, Х. Нимвеген «Оптимизация бизнес-процессов», Спб.: «Азбука», 2002
5. С. В. Черемных, И. О. Семенов, В. С. Ручкин «Структурный анализ сист

Тезисы статей

~

РАБОТА С ГРАММАТИКОЙ РУССКОГО ЯЗЫКА ИЗ PERL
С. В. Протасов
Московский физико-технический институт
2004

Регулярные выражения являются одним из самых популярных методов обработки текстов во многих языках программирования. А среда Perl имеет очень развитую и одну из самых мощных подсистем регулярных выражений. Однако слишком сложные данные очень тяжело обрабатывать без дополнительных вспомогательных инструментов. Есстественный язык вообще крайне сложно поддается какому-либо поиску семантической информации: если Вы хотите найти в тексте предложения, выражающие определенное мнение, отношение, действие или чувство по отношению к чему-либо – сделать это без знания грамматики предложений и только с помощью регулярных выражений довольно тяжело. В данной статье описывается один из подходов при работе с языком – это разбор предложений с помощью грамматики связей. Кроме определения основной функции каждого слова в предложнии, парсер грамматики связей строит граф, где все слова связаны дугами.

Пример разбора предложения парсером грамматики связей:

+----------Wd----------+
| +----Sf3----+----MVv----+
| | | |
LEFT-WALL мама.nlfsi мыла.vnpdpfs раму.ndfsv

Данные дуги-связи используются не только для определения части речи и отсечения омонимии, но и описывают более детально функцию данного слова в предложении. Например, если фраза состоит из двух прилагательных и двух существительных и нам очень нужно знать к какому все-же существительному относится каждое прилагательное.

Перловый модуль грамматики связей представляет собой объектно-ориентированный интерфейс, который можно использовать из программ на Perl. После подключения модуля можно работать с объектами соответвующим предложениям, связкам, связям, словам и коннекторам. Это позволяет значительно расширить возможности поиска в русскоязычных текстовых массивах с использованием разнообразных семантических критериев.


Литература
1. Daniel Sleator and Davy Temperley. 1991. Parsing English with a Link Grammar. Carnegie Mellon University Computer Science technical report CMU-CS-91-196, October 1991.
2. Кристиансен Т., Торкингтон Н. Perl: библиотека программиста. – СПб.: Питер, 2001

======================

Создание корпоративного хранилища данных в условиях постоянно изменяющегося бизнеса
А. В. Шовкун1, В.В. Дельцов2
1 Московский Инженерно-Физический Институт (технический университет)
2 Московский физико-технический институт (государственный университет)
vasya_deltsov@mail.ru
В работе рассмотрены основные проблемы построения корпоративных информационно-аналитических систем (КИАС) для крупных и средних компаний: необходимость оперативной адаптации системы к изменяющимся бизнес требованиям с сохранением совместимости с существующими аналитическими приложениями и, как следствие, высокая стоимость владения системой; непрозрачность информационного наполнения системы для конечных пользователей.
В качестве решения предложена технология создания КИАС на основе конфедеративного управления метаданными.

Рис. 1. КИАС как цепочка доставки информации
Предлагаемый подход решает задачу снижения себестоимости владения КИАС (до 20-50% в год от стоимости первоначальной разработки) за счет готовности системы к эволюции при изменении бизнеса. Рассмотренная архитектура дает возможность использования продуктов различных производителей в роли компонент КИАС, что позволяет построить систему на основе лучших в своем классе продуктов.
Литература
1. Slowly Changing Dimensions, R. Kimball, DBMS Magazine, 1996, http://www.dbmsmag.com/9604d05.html
2. Configuration Management Models in Commercial Environments, P. Feiler, 1991, ftp://ftp.sei.cmu.edu/pub/case-env/config_mgt/tech_rep/cm_models_TR07_91.pdf
3. Сайт "Корпоративного каталога показателей" http://bi.lanit.ru/products/emc.htm - ЛАНИТ. - 2004.


==================


Семантика квадруплетов в распределенных системах управления знаниями
Н.А. Винокуров1
1 Московский физико-технический институт (государственный университет)
2 Кафедра информатики
nikita@dgap.mipt.ru
Базы знаний представляют собой хранилище особым образом структурированной информации и средства для ее модификации, доступа и получения (вывода) новой информации, не содержащейся в явном виде в хранилище. Причем, как структуризация, так и работа с базами знаний осуществляется на том уровне абстракции, котрый концептуально приемлем для той области (областей) знаний, которым посвящена база. Одним из основных свойств, отличающих базу знаний от базы данных является самодискриптивность или рефлексивность, возможность, не опуская уровень абстракции, описать внутреннее устройство самой базы, а таже (в некоторой части) сами средства для работы со знаниями. Одной из удачных, и, на текущий момент, самых распространенных концепций, допускающей самодискриптивность является концепция RDF [1] или концепция триплетного формализма [2]. Всякое утверждение может быть представлено в виде множества триплетов – микроутверждений (фактов) с четкой структурой и семантикой (предикат-субъект-объект). На базе этого формализма появилось множество методов и средств построения онтологий и моделей различных предметных областей.
Основным недостатком распространенного подхода является ограничение логики RDF-фактографии монотонной логикой либо интуиционистской, а следовательно, ограничение области моделирования исключительно декларативными моделями. Вывод новых фактов допускается, но не противоречащих ранее описанным. В такой системе невозможно сформулировать отрицание. Исключается время, как параметр моделирования (диалектичность). Хотя, с другой стороны, полнота триплетного описания вполне позволяет сформулировать и отрицание, и эволюционность. Но это дается ценой ввода в модель множества неименованных сущностей, а следовательно, усложнением триплетной семантики и неоправданным увеличением базы [3].
Нами было предложено усовершенствование триплетной фактографии. Вводится новый параметр факта, Контекст, с дополнительной интерпретацией. Таким образом Факты теперь представляются не тройками, а четверками (Контекст – Предикат – Субъект – Объект). Интерпретация Контекста возможна как Источника факта, который представляется оставшимися параметрами (триплета). В виду однородности параметров квадруплета Контекст (равно как и Предикат и Объект) сам может являться Субъектом фактографического описания. Время вводится путем разделения модели самой базы знаний на три типа объектов: Очереди Квадруплетов (последовательность важна), Обработчики (активными устройствами, активность которых зависит исключительно от состояния Очередей) и Множества (неупорядоченного) Квадруплетов, в отличии от модели триплетных баз которые представляются только множествами неупорядоченных фактов и интерактивных средств обработки. Интерпретация квадруплетов из очередей производится относительно выбранного текущего контекста, и, в зависимости от Описания Контекста квадруплета, его триплетная часть может быть проинтерпретирована в текущем контексте как утверждение, отрицание либо даже как запрос, который вычисляется уже на Множестве квадруплетов базы. При этом сохраняется совместимость с триплетными моделями.
Системы управления знаниями вместе с квадруплетами получают поддержку многослойного моделирования, версионности, возможности для обеспечения одновременной совместной модификации базы знаний несколькими пользователями, оставаясь при этом в рамках квадруплетного формализма. Новая модель базы знаний позволяет объединять множество баз посредством очередей, тем самым увеличивая масштабируемость базы знаний, оставляя при этом высокоуровневое описание способов распределения квадруплетов по различным носителям, а также поддерживать непротиворечивость распределенной базы относительно заданного множества правил. Сохранение свойств самодискриптивности, при увеличении масштабов, дает возможность строить непосредственно информационные системы, проходя очень короткий путь от мета-онтологии и онтологии до организации и запуска бизнес-процессов на предприятиях.
Работа поддержана грантом РФФИ № 02-01-00526. На момент публикации подана заявка на получение патента в РосПатент.
Литература
1. Resource Description Framework (RDF): Concepts and Abstract Syntax. Editors: Graham Klyne, Jeremy J. Carrol, http://www.w3.org/TR/rdf-concepts
2. Tim Berners-Lee, James Hendler and Ora Lassila. The Semantic Web. Scientific American, May 2001 issue.
3. Н.Н. Непейвода. Прикладная Логика. Новосибирск, Изд-во Новосибирского Ун-та, 2000. -- 521 стр.

~


E-mail: rykov2000@mail.ru



Hosted by uCoz