当前位置 - 무료 법률 상담 플랫폼 - 지식재산권 전공 - 정보 자원의 반 구조화란 무엇입니까?

정보 자원의 반 구조화란 무엇입니까?

다이제스트: 네트워크 정보 자원을 보다 잘 관리하고 쿼리하려면 먼저 합리적인 정보 자원 설명 메커니즘을 구축해야 합니다. Metadata 는 네트워크 정보 자원을 설명하는 강력한 도구이지만, 새로운 정보 설명 메커니즘인 ——linking 메커니즘은 Metadata 의 내용을 표현할 수 있을 뿐만 아니라 Metadata 보다 더 풍부한 의미를 표현할 수 있으며, Metadata 자체가 극복할 수 없는 몇 가지 결함을 보완할 수 있습니다. < P > 키워드: 반정형 정보 자원 설명 Metadata linking

디지털, 네트워킹 기술의 급속한 발전에 따라 디지털 도서관 건설은 도서 정보계의 중요한 연구 방향으로 자리잡고 있으며, 여기서 네트워크 정보 자원 조직은 디지털 도서관 건설의 핵심 내용이다. 네트워크 정보 자원의 동념성, 분산, 다양성, 무질서성 등의 특징으로 인해 정보를 찾고 검색하는 것이 점점 어려워지고 있습니다. 21 세기 정보 사용자와 정보 관리자들에게 그들을 괴롭히는 것은 정보가 너무 적은 것이 아니라, 이중 이자가 너무 많은 문제이다. 따라서 네트워크 정보 자원을 합리적으로 설명하고, 네트워크 정보 자원을 구성, 순서 지정하고, 정보 활용도를 높이는 방법은 현재 중요한 연구 과제다.

1 네트워크 반정형 정보 자원

은 현재 네트워크 반정형 데이터가 점점 풍부해지고 있습니다. 완전 구조화된 데이터는 관계형 데이터베이스, 객체 지향 데이터베이스의 데이터와 같이 매우 좋은 데이터 구조를 가지고 있습니다. 완전 구조화되지 않은 데이터는 사운드, 이미지 파일 등 모달리스 데이터를 의미합니다. 반정형 데이터는 완전히 구조화된 데이터와 구조화되지 않은 데이터 사이에 있는 데이터 유형입니다.

반정형 데이터는 일정한 구조를 가지고 있지만 엄격하지 않고 변화무쌍하며 불완전합니다. < P > 네트워크 정보 수준에서 네트워크 반정형 정보의 연구 대상은 웹 페이지 수준, 웹 사이트 수준, 네트워크 수준의 세 가지 수준으로 나뉩니다.

-www 웹 페이지: 주요 연구 방향. < P > ● HTML (Hypertext Markup Language)-현재 네트워크 리소스 설명 형식 중 가장 높은 비율을 차지하고 있기 때문에 관련 연구가 많이 진행되고 있습니다. < P > ● XML (Extensible Markup Language)-새로운 온라인 데이터 교환의 표준으로서 큰 관심을 받고 있습니다. XML 은 인터넷 유망 구조 문서의 교환을 지원하는 표준 범용 태그 언어 SGML(ISO8879) 의 하위 집합입니다. HTML 에 비해 XML 은 컨텐츠 지향적이며, 보다 다양한 구조와 풍부한 의미를 가지고 있으며, 확장성, 제로 그립, 자체 설명 등의 특징을 갖추고 있어 웹상의 데이터 교환에 적합합니다. 가와L 은 데이터 구성 및 교환에 대한 사실 표기가 어렵고 대량의 XML 데이터가 웹에 나타날 것으로 예측할 수 있다. XML 데이터 모델은 반구조 데이터 모델과 많은 유사성을 가지고 있습니다. 즉, 반구조 데이터 연구에 대한 광범위한 응용 전망을 제공하는 동시에 반정형 데이터 연구의 발전을 촉진합니다. < P >-웹 사이트의 반정형 연구: 웹 콘텐츠, 앵커 텍스트, 웹 링크, 링크된 형제 관계 등을 최대한 활용해 탐색합니다. < P >-네트워크의 반정형 연구: 네트워크 정보의 반구조적 특징을 활용하고, 지능형 검색 엔진을 설계하고, 특정 주제에 대한 효율적인 검색을 제공하고, 네트워크 반정형 정보를 더 잘 구성해야 합니다. 우선 반정형 정보를 합리적으로 조직해야 한다.

2 반정형 정보 자원에 대한 설명 < P > 현재 대부분 태그가 지정된 방향 다이어그램을 반정형 데이터 모델로 사용하고 있으며, 가장 일반적인 것은 OEM (객체 교환 모델) 모델입니다. 요약하면 두 가지 주요 설명 방법이 있습니다. < P > 2.1 논리 기반 설명 형식 < P > 이미 제시된 반정형 데이터 패턴의 설명 형식에서 논리 기반 설명 형식은 1 차 논리 (first-order logic), 설명 논리 (Dess) 와 같은 중요한 유형입니다. 그것들은 매우 비슷하지만 표현력 등에서 차이가 있는데, 그 중 비교적 전형적인 것은 데이터 로그 기반 패턴 설명 형식이다. < P > 2.2 그림 기반 설명 형식 < P > 반정형 데이터는 일반적으로 태그가 지정된 직접 그래프로 표현되기 때문에 이러한 설명 형식의 한 가지 큰 장점은 패턴과 데이터가 동일한 데이터 모델 (그림 모델) 을 사용한다는 것입니다. 매우 쉽게 처리할 수 있습니다. 패턴 다이어그램은 일반적으로 루트, 가장자리에 표시가 있는 방향 그래프입니다. 해당 가장자리의 태그는 데이터 맵과 동일하거나 확장될 수 있습니다. 예를 들어 "name | address" 와 유사한 형태를 허용하거나 단항 위어와 같은 특정 형식의 규칙을 사용할 수 있습니다. 패턴 다이어그램의 노드에 대해 어느 정도 주석을 달 수 있습니다. 그 표현의 의미나 기타 특정 의미를 나타내는 것 중 가장 대표적인 것은 OEM 이다. (존 F. 케네디, Northern Exposure (미국 TV 드라마), 예술명언) 또한 개념 모델이 있습니다. 자연스럽고 간단한 방법으로 HTML 페이지의 내부 구조를 이해합니다. OEM 과는 달리 문서에 대한 개념화와 유사합니다. LIST 객체를 도입하여 그림, 트리 설명 방법으로 해결할 수 없는 LIST 테이블 문제 등 텍스트의 내용을 설명하는 매우 효율적인 상위 계층 구조를 제공합니다. 내용을 개념 모델에 자동으로 매핑하는 또 다른 규칙이 있습니다. 하지만 지금까지. 해당 쿼리 언어는 없습니다. < P > 2.3 반정형 패턴의 특징

● 먼저 데이터가 있고 그 뒤에 패턴이 있습니다. 일반적으로 먼저 조회하면 질의 결과는 데이터 구조와 해당 패턴입니다.

● 데이터 구조를 강제하는 것이 아니라 데이터의 구조 정보를 설명하는 데 사용됩니다.

● 소스 데이터의 크기를 초과하거나 초과할 수 있으며, 데이터의 지속적인 업데이트로 인해 동적으로 변하는 과정에서

● 정확성이 떨어지거나 구조의 일부를 설명하거나 데이터 처리의 여러 단계에 따라 달라질 수 있습니다.

● 네트워크처럼 복잡한 분산 환경의 요구 사항을 충족할 수 있는 유연성이 뛰어납니다.

● 데이터 처리의 어려움을 증가시킵니다.

3 메타 데이터-linking 조직 설명 < P > 웹 페이지의 반정형 정보 자원을 설명하기 위해 메타 데이터 개념을 제시했습니다. 메타 데이터 (metadata) 를 제안하는 목적이다. 도서 정보 분야의 분류법과 색인 기술을 일반 웹 프로듀서에게 보급하여 방대한 인터넷 정보 자원을 조직하는 것이다. 메타데이터 시스템은 객체를 구성하는 속성을 추출하고 정보 액세스를 용이하게 하는 강력한 범용 메커니즘으로 간주됩니다. < P > 이전에 등장한 메타데이터 형식은 MARC (주로 상세한 서지 목록에 사용됨) 로, 전 세계적으로 인정 받고 있는 비교적 성숙한 전통 기계 판독 목록 형식이다. 구조가 엄격하다. 종류가 복잡하다. 시스템이 완벽하다. 그러나 일반 네트워크 정보 자원에 대한 묘사에는 적합하지 않다. 첫째, 네트워크 정보 자원 설명 형식은 그렇게 복잡할 필요가 없습니다. 둘째, 인터넷 정보자원이 어마어마하여 목록자들이 각 홈페이지를 상세히 기재할 수 있게 했다. 상당한 인력과 물력을 소모하는 것은 비현실적이다. < P > 일반 네트워크 정보 자원을 설명하는 데 적용되는 메타데이터 표준을 연구하기 위해 일반적인 네트워크 기록 규칙을 개발했습니다. 1995 년 3 월 OCLC 와 NCSA 가 공동으로 발기한 52 명의 도서관 및 컴퓨터 네트워크계 전문가 * * * 와 함께 연구에 의해 DC (더블린 코어) 가 생겨났습니다. DC 는 각 유형의 전자 문헌의 내용과 기타 특징을 밝히는 데 적합하다. 온라인 자원을 효과적으로 구성, 분류, 색인화할 수 있습니다.

DC 는 15 가지 기본 요소로 구성되며 세 부분으로 나뉩니다. ① 내용은 제목, 주제, 설명, 소스, 언어, 연결 및 적용 범위를 설명합니다. ② 지적 재산권 섹션에는 생성자, 발행인, 기타 책임자 및 권한이 있습니다. ③ 모양 설명 섹션에는 날짜, 유형, 형식 및 식별자가 있습니다.

DC 는 네트워크 정보 자원에 쉽게 적용할 수 있습니다. 즉, 기록 데이터와 기록 개체가 동일한 파일 또는 다른 파일에 존재할 수 있습니다. < P > 3.1 DC 의 장점

● 간단한 구조: 데이터 요소의 의미, 배우기 쉽고 비카탈로그 직원도 빠르게 이해할 수 있습니다. 네트워크 자원에 대한 설명적인 카탈로그는 주로 자원 제작자가 자원을 만드는 동시에 제공한다. 이는 기록 제작 비용을 낮출 뿐만 아니라 네트워크 정보 자원의 대량 증가에 적응할 수 있다. 리소스 제작자의 설명에 따라 정보 작업자는 품질이 높고 안정성이 좋은 네트워크 리소스의 색인 및 사양 제어에 주력함으로써 사용자를 위한 효율적이고 실용적인 검색 시스템을 구축합니다.

● 반복성. DC 는 모든 원소가 반복 가능하다고 규정하고 있어 다저자나 다판 등 반복 원소의 저서 문제를 해결했다.

● 선택 사항: 최소 7 개 요소 (제목, 발행인, 형식, 유형, 식별자, 날짜 및 주제) 만 확보하면 기록 항목을 단순화할 수 있습니다.

● 확장성. 각 DC 지방판은 15 개 요소를 기반으로 새로운 요소나 새로운 수정자를 추가하여 지역별 사양으로 자료가 나타날 수 있도록 하고, 향후 확장을 위한 몇 가지 메타데이터 특성을 유지할 수 있습니다.

● 다른 메타데이터와 연결하여 자신의 부족한 부분을 보완할 수 있습니다. RDF (통합 리소스 설명 프레임워크) 에서 다른 메타데이터와 연결할 수 있습니다. < P > 3.2 메타 데이터가 존재하는 두 가지 주요 이유

● 시스템 내에서 객체를 확장할 수 있는 공통 메커니즘을 제공합니다. 이 대상이 반드시 문헌일 필요는 없다는 점에 유의해야 한다. < P > ● 메타 데이터는 시스템에서 객체를 그룹화, 정렬 및 액세스하는 데 사용할 수 있으며 정보 검색 서비스를 제공합니다. < P > 3.3 Metadata 의 결함

● 주로 문헌의 외부 특징을 설명합니다. 주제라는 요소를 사용하여 문헌의 내부 특징을 밝혔지만,

● 반구조 데이터의 구조 정보를 충분히 활용하지 못했습니다.

● 메타 데이터 메커니즘은 설명된 객체 유형을 인식하지 못합니다. < P > ● MATA 데이터 값 쌍 (이름 및 값) 은 비대칭으로 단방향으로 읽을 수 있으며 도메인 및 도메인 값 역할은 교환할 수 없습니다. < P > 실제로 일부 연구자들은 DC 와 전체 텍스트 검색 기술을 결합하여 검색 엔진을 구축했지만 실질적인 진전은 없었다. 따라서 반정형 데이터를 설명하는 메커니즘인 조인 (1inking) 메커니즘이 등장했습니다. < P > 조인 (1inking) 메커니즘과 메타데이터 사이에는 유사성이 있습니다. 즉, 객체의 속성을 추출하고 사용자에게 보다 효율적인 정보 액세스 수단을 제공할 수 있습니다.

먼저 메타데이터는 1inking 으로 표현할 수 있습니다. < P > 는 메타데이터 값 쌍을 시스템 내에서 인식할 수 있는 하위 객체로 간주하므로 메타데이터 값 쌍은 객체의 하위 객체가 되고 이름을 통해 앵커 (anchor) 와 메타데이터 값 쌍 간에 매핑이 설정됩니다.

예 1:

< docl, < author, HQ > >: 여기서 < author, HQ > 는 메타 데이터 값 쌍이고 p 로 표시되며 < <doc1, 이 있습니다 < P > 둘째, 1inking 메커니즘은 메타 데이터보다 더 풍부한 의미를 표현할 수 있으며 관계 쌍의 유형을 드러내고 대칭적입니다.

예 2:

< < "doc2". "document" > , < "HQ", "author" > Documentauthoredby >

< < "HQ", "supervisor" >, < "LJ", "supervises" >, "supervises" >

첫 번째 문장의 의미는 doc2 is the document authored by HQ 입니다. 두 번째 문장의 의미는 HQ supervises LJ 입니다. 이 예를 통해 linking 메커니즘은 메타데이터 모델이 밝힐 수 없는 관계 쌍의 유형 (문서 및 supervisor) 을 보여 줍니다. 또한 metadata 를 대칭으로 만듭니다. 여기서 HQ 는 1ink 의 "앵커" 인 doc2 에 대한 첫 번째 관계 도메인 값 또는 HQ 에 대한 다른 관계 도메인 이름을 만들 수 있습니다.

분석에 따르면 linking 메커니즘은 네트워크 반정형 정보에 대한 설명에 더 적합합니다. 네트워크 반정형 정보 자원에 대한 합리적인 설명을 바탕으로 정보 추출 및 정보 조회를 통해 보다 정확한 검색 결과를 제공하고 보다 가치 있는 정보를 제공할 수 있습니다.