поддерживать согласованные интерфейсы, протоколы и механизмы доступа к информационным ресурсам; Синтаксическая интероперабельность. Данные, доступные из информационных источников, как правило, отличаются синтаксической неоднородностью, разнообразием моделей данных и форм представления данных. Следовательно, необходимо выработать и согласовать унифицирующий подход приведения данных к наиболее распространенным моделям данных и форматам; Сбор метаданных. Для представления сведений о ресурсах используют структурное представление метаданных, описывающих содержимое ресурса в виде набора именованных значений, в том числе, связей с другими ресурсами. Метаданные используются для автоматизированного анализа содержимого ресурса, построения поисковых индексов и позволяют обеспечить достаточно высокую точность и эффективность поиска разнотипной информации. Центральной компонентой в обслуживании слабоструктурированных и унаследованных коллекций информации является процесс сбора метаданных, в ходе которого из коллекций в соответствии с требованиями синтаксической интероперабельности извлекаются и структурируются метаданные, формируется индексная информация для обеспечения локального поиска, маршрутизации распределенных запросов, ранжирования результатов запросов; Семантическая интероперабельность. Создание и согласование стандартных прикладных профилей метаданных и онтологий упростит интеграцию разнообразных систем, позволит автоматизировать обмен метаданными, их обработку и преобразование, повысить точность и эффективность поиска. Глубина структуризации метаданных о ресурсах должна определяется задачами конкретной системы. В узкопрофессиональных системах она является высокой с тем, чтобы поддержать соответствующие процессы, возможность проведения |
Техническая интероперабельность. Для обеспечения взаимодействия между разнородиыми информационными источниками необходимо поддерживать согласованные интерфейсы, протоколы и механизмы доступа к информационным ресурсам. • Синтаксическая интероперабельность. Данные, доступные из информационных источников, как правило, отличаются синтаксической неоднородностью, разнообразием моделей данных и форм представления данных. Следовательно, необходимо выработать и согласовать унифицирующий подход приведения данных к наиболее распространенным моделям данных и форматам. • Сбор метаданных. В ситуации, когда сведения о ресурсах часто представлены в виде слабоструктурированного текста, когда поисковые системы осуществляют полнотекстовый поиск нужных данных по запросам в свободной форме, пользователь получает огромное количество информации, среди которой очень трудно выбрать полезные знания. Учитывая это обстоятельство, для представления сведений о ресурсах стали использовать структурное представление, выделять понятие метаданных, описывающих содержимое ресурса в виде набора именованных значений, в том числе связей с другими ресурсами. Метаданные используются для автоматизированного анализа содержимого ресурса, построения поисковых индексов и позволяют обеспечить достаточно высокую точность и эффективность поиска разнотипной информации. Центральной компонентой в обслуживании слабоструктурированных и унаследованных коллекций информации является процесс сбора метаданных, в ходе которого из коллекций в соответствии с требованиями синтаксической интероперабельности извлекаются и структурируются метаданные, формируется индексная информация для обеспечения локального поиска, маршрутизации распределенных запросов, ранжирования результатов запросов. 91 92 • Семантическая интероперабельность. Метаданные могут относиться к различным предметным областям, в рамках одной иметь разные выражение и интерпретацию. Создание и согласование стандартных прикладных профилей метаданных и онтологий упростит интеграцию разнообразных систем, позволит автоматизировать обмен метаданными, их обработку и преобразование, повысить точность и эффективность поиска. Глубина структуризации метаданных о ресурсах должна определяется задачами конкретной системы. В узкопрофессиональных системах она является высокой с тем, чтобы поддержать соответствующие процессы, возможность проведения специальных исследований. Тем не менее, для общих задач интеграции информационных ресурсов высокая степень структуризации не требуется и усложняет процесс. Необходимо выработать подход к наращиванию степени структуризации метаданных, который позволил бы специализировать общие схемы метаданных под потребности конечных приложений; разработать набор элементов метаданных для общей научной информации и некоторые профили метаданных конкретных научных областей, согласуя их с научным сообществом и международными стандартами; обеспечить выделение и согласование стандартных классификаторов ресурсов и тезаурусов. • Поддержка глобальной идентификации ресурсов. Использование глобально уникальных идентификаторов дает возможность установления взаимосвязей между ресурсами разных репозиториев (под репозиторием мы понимаем интероперабельный информационный источник, в указанном выше смысле) распределенной среды, объединять связанные данные отдельных репозиториев в виртуально-единые ресурсы. Это предоставит пользователям возможность производить навигацию среди ресурсов всей информационной системы, выполнять косвенный поиск, в том числе и по связям между ресурсами в разных репозиториях, упрощает задачу объединения результатов поисковых запросов разных репозиториев. |