Корпоративная таксономия – это иерархическая классификация организации или администрации, форма упорядочивания информации (документов, цифровых активов и др.). Рассматривается понятие корпоративной таксономии морских портов, разветвленной иерархии понятий, объектов и субъектов портов, извлекаемых из скрытых знаний неструктурированной текстовой информации и исследуемых для классификации электронных документов, а также других источников информации. Отмечено, что одной из высших форм интеллектуальной деятельности человека является понимание и извлечение смысловых единиц с их организацией в иерархическую структуру. Наиболее удобным и эффективным методом косвенной идентификации признан метод компараторной идентификации, который дедуктивным способом использует основные положения теории интеллекта. Рассматриваются процессы обработки информации в организационных информационных системах, сюръективное отображение, при котором каждый элемент области значений имеет хотя бы один прообраз. Приведена система логических уравнений, отображающая закономерности обработки сигналов. Проиллюстрирована логическая схема реализации метода компараторной идентификации для извлечения неочевидных знаний. Для составления корпоративной таксономии необходимо (помимо классов безусловной эквивалентности) выделить классы условной эквивалентности, содержащие группы близких смысловых единиц и имеющие общие признаки, которые будут собираться в один таксон. Представлено описание дескрипторов лексических единиц. Сделан вывод о том, что метод компараторной идентификации, использованный для создания корпоративной таксономии, позволяет перейти от субъективного восприятия смыслов к объективному отношению между документами в автоматизированной системе морских портов и смысловыми единицами, представленными ключевыми словами, рубриками и т. д.
моделирование, корпоративная таксономия, компараторная идентификация, логистика, морской порт
Введение
Основой структуры управления знаний в морской компании является корпоративная таксономия – иерархическая классификация организации или администрации, используемая с целью классифицирования документов, цифровых активов и другой информации, с помощью которой осуществляется не только накопление знаний и данных, но и координация отдельных элементов системы управления знаниями. В настоящее время исследования проводятся в направлении разработки метода компараторной идентификации, использующего основные положения теории интеллекта. Корпоративная таксономия представляет собой разветвленную иерархию понятий, объектов и субъектов интереса портов, извлекаемых из скрытых неочевидных знаний неструктурированной текстовой информации и используемых для классификации электронных документов и других источников информации. При автоматизации процесса составления корпоративной таксономии моделируется одна из высших форм интеллектуальной деятельности человека – понимание и извлечение смысловых единиц с их организацией в иерархическую структуру. Для решения задачи извлечения и иерархического структурирования смысловых единиц не представляется возможным использовать метод прямой идентификации. Как и в большинстве случаев для интеллектуальной обработки информации, эффективными становятся методы косвенной идентификации, наиболее удобным из которых является метод компараторной идентификации, дедуктивным способом использующий основные положения теории интеллекта.
Материалы и методы исследования
Сущность реализации компараторного метода состоит в следующем: на вход системы подается множество сигналов, представляющих собой условные знаки, служащие для передачи информации x1, x2, ..., xn (тексты документов, ключевые слова и словосочетания, области знаний менеджеров по логистике, выражаемые терминологическими понятиями, классы универсальной десятичной классификации (УДК), значения рубрикаторов и т. д.).
Входные сигналы берутся из конечных множеств x1, x2, ..., xn, причем x1 Î Х1, x2 Î Х2, ..., xn Î Хn. В результате работы системы обработки электронной информации на выход поступает определенное множество элементов y1, y2, ..., yn, представляющих результат интеллектуальной деятельности (смысл текста, денотат, дескриптор, таксон, рубрика и т. д.) [1]. При этом y1 Î Y1, y2 Î Y2, ..., yn Î Yn. Элементы y1, y2, ..., yn однозначно зависят от сигналов x1, x2, ..., xn, они связаны с помощью функций y1 = f1(x1), y2 = f2(x2), …, yn = fn (xn), которые ставят в соответствие каждому x1 Î Х1, x2 Î Х2, ..., xn Î Хn элемент y1 Î Y1, y2 Î Y2, ..., yn Î Yn.
Так как каждому из сигналов xi Î Xi соответствует вполне определенный элемент yi Î Yi, то каждая из функций fi представляет собой сюръекцию, отображающую множество Xi на множество Yi, I Î {1, 2, ..., n}. Отображение f: x ® y называется сюръективным (или сюръекцией), если каждый элемент множества Y является образом хотя бы одного элемента множества X, т. е. "y Î Y $ x Î X: y = f (x), а также предиката q = Q (y1, y2, ..., yn), соответствующего отношению Q.
В общем случае система получает k заданий, которые выполняет поочередно для различных наборов входных сигналов [2]. Закономерности обработки сигналов записываются в виде системы логических условий:
K1 (L1, L2, ..., Lk) = 1;
K2 (L1, L2, ..., Lk) = 1; (1)
Ki (L1, L2, ..., Lk) = 1,
связывающих между собой предикатные переменные L1, L2, ..., Lk. Здесь K1, K2, ..., Kj – предикаты от предикатов L1, L2, ..., Lk. Предикат L1(x1, x2, …, xn), I Î {1, 2, …, k} задан на декартовом произведении X1i, X2i, X3i , ..., Xni. Решение L1 = P1, L2 = P2, ..., Lk = Pk удовлетворяет системе уравнений (1).
Доказано, что возникает необходимость в косвенной идентификации. В данном случае наиболее удобный метод компараторной идентификации можно применять для идентификации физических и интеллектуальных объектов системы, которая удовлетворяет трем условиям: система имеет два входа x, y, один выход t и реализует предикат t = E (x, y) [3].
Цель настоящего исследования – разработка методологии применения компараторной идентификации, использующей основные положения теории интеллекта автоматизированных систем управления морскими портами.
Для решения задачи извлечения и иерархического структурирования смысловых единиц не представляется возможным использовать классический метод прямой идентификации, состоящий в определении закона преобразования y = F(x) сигнала по входному x и выходному y сигналам, при непосредственном доступе к выходным сигналам объекта.
Результаты исследований
Реализация метода компараторной идентификации для извлечения скрытых неочевидных знаний из неструктурированной текстовой информации автоматизированной системы управления может быть представлена логической схемой (рис.).
Функция понимания информации |
Функция понимания смысловой единицы f (t) |
Смысловая |
Документ d Î D |
e Î {0,1} |
Смысл w w Î Â |
Понятие r |
Реализация метода компараторной идентификации для извлечения неочевидных знаний
Документ, значением текста которого является d, определяет и понимает менеджер по логистике порта, формирует в своем сознании представление о нем [4]. Возьмем определение – смысл однозначно определяется породившим его текстом документа – и примем его равным w.
Функцию w = g(d) зависимости смысла документа от материального носителя (т. е. от документа) с зафиксированной на нем в электронной форме информацией в виде текста, имеющего реквизиты, позволяющие его идентифицировать, назовем функцией понимания текста документа [5]. Множество значений функции g, т. е. совокупность всех смыслов, отображаемых документами из множества D, будем обозначать Â. Функция g отображает множество D на множество Â. Один и тот же смысл может быть заложен в текстах различных документов. Считаем, что тексты d1 и d2 тождественны по смыслу, если в результате осмысленного решения проблемы понимания [6] менеджером по логистике порта однозначно решается некоторая проблема, посредством осмысления существенных отношений и структуры ситуации.
Воспринимая смысловую единицу t, определяемую множеством ключевых слов или словосочетаний, значений УДК и рубрикатора T, и определяя диапазон лексических единиц, специалист по логистике порта сопоставляет эти данные с определенным последовательным изложением r. Под этим изложением следует понимать обобщенное суждение о объекте, которое несет t о всевозможных константах, выражая его сущность, и по общим и специальным признакам относит его к предметам определенного класса.
Функцию r = f (t) соответствия смысловой единицы t множества T концепту r назовем функцией понимания смысловой единицы. Эта функция описывает процесс преобразования ключевого слова, значения УДК или рубрикатора в совокупность суждений о каком-либо объекте, т. е. в преобразование его в концепт или понятие. Если менеджер порта рассмотрел множество смысловых единиц T, то множество всех значений функции f, т. е. совокупность всех понятий, порождаемых элементами из множества T, будем обозначать q. Функция f отображает множество T на множество q. При этом множество q £ T. Может оказаться, что разнообразие понятий меньше разнообразия знаков значений УДК и рубрикатора, т. е. возможны такие элементы t множества T, которые соответствуют одному понятию.
Ключевые слова или словосочетания, классы УДК и рубрики, относимые менеджером к одному концепту, будем называть безусловно эквивалентными.
Для составления корпоративной таксономии необходимо, кроме классов безусловной эквивалентности, выделить классы условной эквивалентности, включающие группы близких смысловых единиц, имеющие общие признаки, которые и будут собираться в один таксон.
Обсуждение результатов исследований
Таксон включает множество объектов, имеющих один или несколько общих содержательных признаков. Смысловые единицы, входящие в класс условной эквивалентности, соответствуют близким по смыслу концептам, относящимся к одному дескриптору. Под дескриптором понимается обозначение точки заданного пространства данной предметной области, выражаемое вербально или кодом и определяющее класс близких по смыслу смысловых единиц множества T. Дескрипторы лексических единиц, соответствующих близким по смыслу концептам, как подтверждают исследования [7], часто рассматриваются в одном связном тексте, который, особенно в деловых документах порта, характеризуется единой тематикой. Таким образом, метод компараторной идентификации позволяет автоматически разделять тексты документов полнотекстовых баз данных на тождественные (по отношению к областям знаний менеджера) и разбивать информационные смысловые единицы, выражаемые ключевыми словами, рубриками и классами УДК, на классы эквивалентностей, определяющие таксоны верхнего ранга, позволяя автоматизировать процесс разработки корпоративной таксономии.
Заключение
Представлена реализация метода компарации при работе с информационными объектами корпоративной системы, в том числе для извлечения скрытых неочевидных знаний из неструктурированной текстовой информации.
Метод компаративной идентификации использован для создания корпоративной таксономии, что в дальнейшей работе позволит перейти от субъективного восприятия смыслов к объективному отношению между документами в автоматизированной системе морских портов и смысловыми единицами, представленными ключевыми словами, тэгами, словосочетаниями и рубриками документов.
1. Доровской В. А. Идентификация профессиональных знаний операторов автоматизированных систем управления: дис. … д-ра техн. наук. Херсон, 2004. 412 с.
2. Логистика: практ. энцикл. / под ред. В. И. Сергеева. М.: Изд-во МЦФЭР, 2007. 200 с.
3. Сергеева В. И. Корпоративная логистика. 300 ответов на вопросы профессионалов. М.: Инфра-М, 2004. 967 с.
4. Железняк А. А., Бордюг А. С., Жуков В. А. Создание лингвистических правил управления судном для повышения надежности работы СЭУ // Сб. науч. тр. профессор.-преподават. состава Гос. ун-та мор. и реч. флота им. адм. С. О. Макарова. СПб.: Изд-во ГУМРФ им. адм. С. О. Макарова, 2016. С. 36-44.
5. Железняк А. А., Бордюг А. С., Титов И. Л. Моделирование элементов идентификации и контроля параметров системы для интеллектуальной поддержки принятия решений // Вестн. Астрахан. гос. техн. ун-та. Сер.: Морская техника и технология. 2016. № 3. С. 75-85.
6. Бондаренко М. Ф., Шабанов-Кушнаренко С. Ю., Шабанов-Кушнаренко Ю. П. Об общей теории компараторной идентификации // Бионика интеллекта. 2008. № 2 (69). С. 13-22.
7. Балашов Е. П. Эволюционный синтез систем: моногр. М.: Радио и Связь, 1985. 328 с.