ontoBox2009/11/22 20:16

굉장히 게을렀다. 사실 짬을 내면 쓸 수 있는 시간이 있었다고 생각하지만 누군가의 말처럼 눈 코가 어디 달렸는지 조차도 알지 못할 정도로 바빴기 때문에… 아 비굴한 핑계… ㅋ 각설하고.. 지난번 포스팅을 통해 온톨로지의 대상이 되는 정보와 지식에 대해 살펴보았다. 두서 없이 쓴 내용이라 논란의 여지가 많겠지만, 이제부터의 포스팅을 통해 조금씩 온톨로지의 배경에 접근해 보려 한다.

 

1. 목록은 단순하다

목록은 단순하다. 그렇다 참으로 단순하다. 목록은 실제로 우리 생활에 자주 등장한다. 장을 보러 간다. 뭘 살까? 고민해서 꼼꼼하게 살 것을 정연하게 적어가는 알뜰한 장보기, 이 때 정연하게 적어가는 그것, 그것은 목록이다. 저녁을 먹으러 중화요리집엘 갔다. 식사거리, 요리 종류 등 다양한 음식이 나열된 메뉴판에서 우육탕을 골랐다. 메뉴판(흠.. 표준어는 차림표 입니다) 그것은 목록이다.

쉽다, 목록은 쉽다. 국어사전에는 “품목과 내용을 일목요연하게 기록한 것” 이라고 정의하고 있다. 생각해 봐야 할 것은 이 목록을 왜 만드는 가, 이다. 왜 만들까?

최초의 목록은 알렉산드리아 도서관의 관장을 맡았던 칼리마쿠스의 피나케스(pinakes)목록으로 알려져 있다(문헌정보학의 이해 편찬위원회. 2004. 문헌정보학의 이해. 서울. 한국문헌정보학회. pp164). 당시 알렉산드라아 도서관에는 70여만 파피루스가 있었는데 이 방대한 자료를 효율적으로 관리하기 위해 관장님은 목록을 만드셨다.
그렇다, 목록을 만드는 이유는 효율적인 관리, 그러니까 많은 정보를 효율적으로 정리하고 편리하게 찾아 볼 수 있도록 하기 위해서이다. 장보기 목록과 음식점 메뉴판도 같은 목적이라고 생각한다. 잘 기억나지 않으니까 미리 정리해서 적어 놓은 것이고 우리는 이런 것이 있습니다, 라고 매번 말 할 수 없으니까 미리 정리해서 적어 놓은 것이다. 그 적어 놓은 것, 목록을 통해 알뜰한 장보기를 할 수 있고 어떤 음식들이 있는지 찾아 볼 수 있는 것이다.

 

2. 아무거나 목록이 될 수 있나?

그렇다면 아무거나 쭉 적어 놓으면 목록이 될 수 있을까? 될 수 있지 왜 없나. 후후. 하지만 중요한 것은 목적이다. 아무런 목적이 없다면 적어 놓아 봤자 쓸모가 없다. 오히려 혼란스럽기만 하다.
정보라는 것과 목록을 같이 보자. 광고를 하는 건 아니지만 본인은 아이튠즈를 사용해 음악을 정리하고 있다. 단 한 순간도 쉬지 않고 들을 때 6.2일이 걸려 소장한 모든 음악을 들을 수 있다. 현재 1990곡을 소장하고 있다. 아이튠즈에 음악을 넣을 때(맞는 표현인가 ㅡㅡ;) 처음 하는 일은 제목과 가수, 앨범 등 그 곡에 대한 정보를 입력하는 것이다. 만약 제목을 잘못 입력하면 어떻게 될까? 못 찾지는 않을 것이다. 인간은 위대하니까. 하지만 고생은 할 것이다. 마찬가지로 목록에 쓸데 없는 정보나 잘못된 정보를 넣게 되면 목록을 이용해서 정보를 찾을 때 꽤나 고생을 하게 될 것이다.
장보기 목록이나 메뉴판을 비교해 보자. 장보기 목록은 단순하게 살 물건의 이름이 적혀 있다. 알뜰한 주부님들은 몇 개를 살 것인지 적어 놓을 수도 있겠다. 메뉴판은(레스토랑 정도의 음식점이 그러한데) 음식의 종류에 따라 음식이나 요리의 이름과 가격이 나열되고 어떤 때는 그 음식에 대한 짤막한 설명도 함께 적혀 있다. 어떤 차이가 있는가. 메뉴판은 목록에 나열된 정보에 대해 무언가를 더 알려 준다. 가격은 얼마인지, 원재료는 어디 것인지, 어떤 재료가 들어가는지… 둘 모두 목록이지만 메뉴판이 좀 더 높은 수준의 목록이라 할 수 있을 것이다.
다시 장보기 목록과 메뉴판을 비교해 보자. 두 목록의 목적은 같지 않다. 그리고 그 목적의 수준 또한 다르다. 장보기는 나만 알면 그만인 것이다. 혹 아버지가 장을 보러 가신다면 어머니는 꽤나 자세하게 장보기 목록을 만들어 주실 것이다. 목록은 누군가가 그것을 통해 무언가를 찾을 수 있게 해주는 것이다.

그렇다면, 목록은!

목적에 따라, 찾고자 하는 것을, 그것을 설명하는 정보와 함께 나열한 것. 이라고 말할 수 있을 것이다.

 

3. 목록은 어떻게 만드나?

목록을 만드는데 공통적인 규칙은 없을 것이다. 하지만 목록을 만드는 곳, 다시 말해서 정리된 자료나 정보를 찾고자 목록을 사용하는 곳에서는 일정한 규칙을 갖고 있을 것이다. 회사나 개인에게도 규칙이 있을 것이다. 그렇지만 가장 대표적인 ‘곳’은 도서관이라고 생각한다.
도서관에는 참으로 많은 책들이 있다. 내가 다니던 대학의 도서관에는 100만권이 넘는 책이 있었다. 지금은 아마 170만권은 넘을 것 같다. 도서관에서는 이 방대한 양의 책을 찾기 쉽고 보관하기 쉽고 정리하기 쉽게 하는 방법을 잘 알고 있다. 오래 전에는, 그건 아마도 6,70년대 일 텐데.. 흠.. 80년대에도 보긴 했지만… 작은 카드에 도서관이 보관하고 있는 모든 책에 대한 정보를 하나하나 적어서 작은 함에 보관해 두었었다. 지금도 어딘가의 공공도서관에 가보면 있을지도 모르겠다. 이 카드에는 책의 제목, 지은이, 출판사, 장수, 책 크기 등 책에 대해 알 수 있는 것을 최대한 많이 적어 놓는다. 그리고 중요한 것, 어디에 그 책이 있는지 적어 둔다.
지금은 도서관에서 카드로 책을 찾지 않는다. 검색 시스템에서 제목이나 저자의 이름을 입력해서, 혹은 키워드를 입력해서 나온 결과를 통해 책을 찾을 수 있다. 이렇게 시스템, 그러니까 컴퓨터를 통해서 책(자료, 정보 등등)을 찾을 수 있는 것은 그 책에 대한 정보를 한 곳에 모아 잘 정리해 두었기 때문이다(목록으로!).
앞에서도 말했듯이 책에 대한 정보를 아무거나 아무렇게나 정리해서는 목록을 사용하는 사람이 짜증만 날 뿐이다. 일정한 규칙, 그러니까 책에 대한 정보는 제목, 저자, 출판사, 출판한 년도와 날짜를 넣는다; 책에 대한 정보는 책에 쓰여진 대로 넣는다; 키워드는 미리 정해 놓은 것들만 넣는다 와 같은 규칙들을 정해서 일정한 정보를 보여줄 수 있도록 해야 한다.

 

4. 온톨로지와는 무슨 상관이지?

목록 온톨로지의 시작이라 할 수 있다. 온톨로지는 정보 간의 관계를 통해 기계가 정보를 이해할 수 있도록 하고 이를 바탕으로 정보를 지식의 형태로 인간에게 전달 할 수 있도록 하는 것이라고 할 때, 목록은 정보가 서로 관계를 맺을 수 있는 바탕을 만들어 준다고 할 수 있다. 목록이 직접적으로 온톨로지에 이어지는 것은 아니다. 목록을 이해한다면 온톨로지를 이해하기 좀 더 쉬워질 수 있다는 것이다(개인적인 생각이다). 목록은 메타데이터의 시발점이 되었다. 목록은 정보와 정보의 정보(메타데이터)의 집합이다. 메타데이터는 온톨로지의 기초가 된다.
사실 목록은 단순하다. 목록이니까. 영어로 하면 리스트. 학문적으로는 카탈로깅, 특별히 Library Catalog라고 하지만 단순하게 목록이다. 어느 것이나 그러하겠지만 목적과 이유가 그 수준을 달리하는 것이다. 음… 그러니까 사실은 조금 어렵다 ^^;

저작자 표시 비영리 동일 조건 변경 허락
Posted by readholic
ontoBox2009/01/31 20:16

온톨로지의 종류에 대한 포스팅이 아직 따끈따끈한 터라 다음 포스트가 좀 빠르다는 생각이 들기도 한다. 사실은 본 포스팅을 준비하다 온톨로지의 종류에 대해 이야기할 필요가 있을 것 같아 급하게 쓴 것이었다. 각설하고, 온톨로지가 지식을 표현하고 포착하기 위한 도구로써 많이 연구되고 개발되고 있다는 것을 알았으니 온톨로지가 어떻게 만들어지는지도 알아봐야 할 것이다.

비단 IT 분야뿐만 아니라 다양한 분야에서 온톨로지가 화두로 떠오르면서 온톨로지 자체가 하나의 시스템으로 오해하는 경향이 있는 것 같다. 온톨로지는 데이터 모델링, 그러니까 데이터를 의미적으로 다루기 위한 이상적 방법이지 구체적인 시스템을 구현하기 위한 기술이 아니다. 다시 말해 '온톨로지 ≠ 시스템'인 것이다. 그렇다면 온톨로지를 시스템화(다음부터는 '구현'이라 한다)하기 위해서는 어떤 것들이 필요할까? 결론만 말하자면 온톨로지 구현을 위한 개발언어를 사용하면 된다.

이러한 개발언어는 정보처리기사 자격증 시험을 준비한 사람들이라면 좀 알고 있는 코볼과 C에서부터 마크업랭귀지인 HTML, XML등이 있다. 온톨로지가 마냥 웹에서만 적용될 수 있는 것은 아니니 환경에 맞는 언어를 사용하면 될 것이다. 언제부터 그랬는지는 모르겠지만 블로그에서 온톨로지를 이야기 할 때 항상 웹의 영역에서 이야기를 하고 있었으므로(필자도 잘 몰랐던 사실이지만 ㅡㅡ;) 웹 측면에서 이야기를 풀어가도록 하겠다.

온톨로지 마크업 언어는 W3C에서 표준으로 채택한 RDF/OWL과 ISO에서 표준으로 채택한 TopicMaps가 있다. 따지고 들자면 RDF/OWL과 TopicMaps도 마크업언어를 사용하기 위한 데이터 모델이지 개발언어는 아니다. RDF/OWL은 그 자체로 마크업언어이면서 데이터 모델이고, TopicMaps는 XTM, LTM 등의 마크업언어를 사용하기 위한 데이터 모델이다. 이들의 공통점은 온톨로지의 구현을 위해서 XML을 기반 언어로 사용한다는 점이다. 이외에도 메타데이터, 표준식별체계 등 온톨로지 구현과 활용을 위한 체계(기술이라 하기엔 좀 개념적인 것들이다)가 필요하다. 이들은 좀 나중에 이야기 하도록 하겠다.

이번 포스팅에서는 W3C의 웹온톨로지언어 표준인 RDF/OWL에 대해 이야기 해보고자 한다. 개체간 관계를 선정의 하여 온톨로지에서 추구하는 추론을 가능하게 하는 이 마크업언어는 RDF > RDF schema > DAML/OIL > OWL 순서로 개발되었다. OWL은 RDF/RDFs의 표현력을 보강하고 구문체계를 활용해 정보를 추론하기 위한 기반을 제공한다. 뭐가 좀 어려운데 차근차근 풀어보자

 

RDF/RDFs

자원기술구조(Resource Description Framework: RDF)는 월드 와이드 웹(World Wide Web)에서 자원에 관한 정보를 표현하기 위한 언어로 특히 웹 자원에 관한 메타데이터를 표현하기 위한 것이다. 그러나 "웹 자원"이라는 개념을 일반화함으로써, 비록 웹에서 직접 검색되지는 않더라도 웹에서 식별되는 사물에 관한 정보를 표현하기 위해서도 RDF를 사용할 수 있다.

RDF는 자원, 속성, 속성값을 하나의 단위로 취급하는 Triple의 개념을 적용하고 있다. 여기서 자원은 데이터를 의미하고 속성은 데이터와 속성값의 관계, 그리고 속성값은 그 관계의 값이다. 써놓고 나니 좀 모호한 감이 있는데 조금 쉽게 풀면, 데이터(자원)에 대한 어떤(속성) 정보(속성값)을 말해주는 것이다. 역시 어려우니 예를 하나 들어보자. 본 블로그의 포스트 중 하나인 "온톨로지를 이해해보기: 기본 요소"는 본인이 저자이다. 이 포스트를 자원이라 하고 자원을 설명하는 다음과 같은 문장을 만들 수 있다.

"온톨로지를 이해해보기: 기본 요소"의 저자는 readholic이다.

이 문장에서 속성은 포스트에 대한 하나의 정보인 저자이고 그 값은 readholic이다. RDF는 이러한 정보와 그 정보의 속성, 즉 종류를 기계가 처리할 수 있도록 하는 체계인 것이다. 이러한 데이터와 데이터에 대한 정보를 기계가 처리하기 위해서는 데이터를 분명하게 구별할 수 있어야 한다. "온톨로지를 이해해보기: 기본 요소"라는 제목으로 무수히 많은 포스트가 있을 수 있지만 저자가 readholic인 포스트는 그 중 하나이다. 따라서 앞의 문장이 참이 되기 위해서는 자원을 분명히 구별하고 그 저자도 분명히 구별해야 한다. 이 구별을 위해서 URI(Uniform Resource Identifier)와 같은 표준 식별체계를 사용하고 있다.

RDF는 기존의 메타데이터, 즉 정보에 대한 정보만을 표현한다. 그렇기 때문에 RDF에서는 속성, 즉 데이터와 데이터의 정보 간의 관계에 대한 설명을 마음대로 만들 수 없다. RDF Schema(RDFs)는 이러한 속성을 필요에 따라 재정의 할 수 있도록 하는 체계를 제공한다. 즉, RDF를 도와 보다 자세한 구조를 짜고 관계를 설명할 수 있는 규칙을 제공하는 것이다.

RDFs에서는 개념을 클래스로 정의하고 있으며 이 클래스는 상하관계를 갖는다. 속성은 표현하고자 하는 관계를 정의할 수 있으며 상하관계를 갖는다. 즉, 자원의 종류를 표시하고 그 관계를 정의하는 일이 RDFs의 역할인 것이다. RDFs에는 클래스와 속성의 유형과 활용에 대해 미리 정해진 몇 개의 어휘들이 있고 이를 통해 RDF 구문에 쓰이는 어휘 사이의 관계를 의미적으로 정의하게 된다.

 

OWL (Web Ontology Language)

DAML+OIL은 주요 관계를 지원하는 표현력이 결여된 RDF와 RDF 스키마의 모델링 요소를 확장, 강화한 언어이다. OWL은 이 DAML+OIL에 기반을 둔 온톨로지 구축 경험을 토대로 개념의 일관성을 확보하여 클래스와 속성의 개념 및 그들 사이의 관계가 보다 명료하게 정의되도록 정리한 온톨로지 언어이다. OWL은 W3C에서 표준화하고, 2004년 2월에 권고로 발표된 온톨로지 마크업 언어이다. OWL은 완전히 새로운 언어로서의 의미보다는, XML, RDF, RDFS와 같은 기존의 마크업 표준으로부터 시맨틱 웹으로의 진행을 위해 필요한 사항을 추가적으로 정의한 언어로 생각할 수 있다[각주:1].

• 왜 OWL인가
기계가 정보를 처리할 수 있도록 하는 것이 온톨로지의 목표라 할 수 있다. 기계가 정보를 처리 할 수 있자면 기계가 정보를 읽고(machine readable) 이해(machine understandable) 할 수 있어야 한다. 온톨로지가 이를 위한 방법이라면 OWL은 이를 위한 도구이다. 기계가 정보를 읽고 이해할 수 있는 환경은 사용자 정의 태그 스키마를 정의할 수 있는 XML과 유연하게 데이터를 표현할 수 있는 RDF를 바탕으로 구축된다. 그런데 XML과 RDF는 조금 한계가 있다.

XML은 문서를 구조적으로 표현할 수 있는 문법을 제공하지만 의미를 표현하는 방법은 제공하지 않는다. RDF는 정보(문서)와 정보 사이의 관계를 표현하는 데이터 모델로 정보의 간단한 의미를 표현하는 방법을 제공하지만 말 그대로 간단하다. 인간이 고개를 끄덕일 정도로 정보를 이해하지는 못한다는 말이다. 그래서 RDFs를 통해 정보의 속성과 클래스를 표현하여 의미 표현의 정도를 확장하고자 했지만 제약사항이 많다. 그래서 기계를 이용하여 웹 문서를 대상으로 유용한 추론 기능을 수행하려면 RDFs가 제공하는 기초적인 의미 표현력을 뛰어넘는 언어가 필요하게 되었고 OWL의 개발에 이르게 된 것이다. OWL은 속성과 클래스에 대하여 기술할 수 있는 더 많은 어휘를 제공한다

• OWL의 종류
OWL에는 표현력의 정도에 따라 Lite, DL, Full의 세 가지 하위 언어가 있다. 이름에서도 느껴지듯이 OWL Lite가 가장 낮은 표현력을 가지고 있는 것으로, 클래스 표현을 위한 규칙인 DL(Description Logic)(OWL의 형식적 기반이 된 논리학의 한 분야 )을 사용하지 못한다. OWL Lite는 계층적인 개념을 구조화하고 특정한 관계를 정의하는 수준이다. RDFs와 비슷하다고 할까? 따라서 OWL Lite는 이론적 복잡도가 낮기 때문에 유의어 사전이나 간단한 분류 체계 그리고 시소러스를 빠르고 손쉽게 OWL화하기 위한 용도로만 적합하다

OWL DL은 OWL 내에 포함되어 있는 DL을 모두 사용할 수 있다. 그렇기 때문에OWL DL은 훨씬 정교하게 개념의 형식적 정의를 수행할 수 있다. OWL DL은 OWL에서 정의한 모든 어휘를 포함하고 있으나 어휘를 사용할 때에는 사전에 정해진 제약 사항을 준수해야 한다. OWL DL은 계산적 완전성(Computational Completeness)[각주:2]과 결정 가능성(Decidability)[각주:3]을 유지하면서 최대의 표현력을 제공한다.

OWL Full은 OWL DL에서 정의된 모든 어휘를 활용할 수 있는 동시에, RDF를 통한 어휘의 확장 및, 자유로운 구문의 활용이 가능하다. OWL DL과 Lite에서는 미리 정의된 모든 어휘에 대해 일정한 조건에서만 활용을 할 수 있도록 규정하고 있지만 OWL Full은 이와 같은 제약이 없다. 쉽게 말하면, 필요에 따라 자유롭게 표현 어휘를 정의하여 활용할 수 있는 것이다. 하지만 추론의 완전성과 결정성을 보증할 수 없다는 단점을 가지고 있다. 사람도 즉흥적으로 이야기 할 때 불완전하고 시간이 걸리 듯이 컴퓨터가 미리 정해 놓은 규칙을 벗어나 새로운 규칙을 정하고 이를 처리하게 하기 때문이다. 

참고 문서 

RDF Primer- W3C의 RDF 공식 문서, 간단한 소개와 활용 방법을 담음. 간단히..
OWL overview – 역시 W3C의 공식 문서로 간단한 소개와 활용 방법을 담음. 간단히..
한글판 RDF Primer, OWL overview(IE에서 깨짐)

  1. Deborah L. McGuinness. Frank van Harmelen. 2004. OWL Web Ontology Language Overview. W3C. (http://www.w3.org/TR/owl-features/) [본문으로]
  2. 모든 결론이 계산 가능함을 보증할 수 있는 성질 [본문으로]
  3. 모든 계산이 특정한 시간 내에 완료될 수 있는 성질 [본문으로]
Posted by readholic
ontoBox2009/01/30 20:28

온톨로지에 대한 부족한 글을 써놓은 지도 벌써 6개월여가 다 되어간다. 이런저런 핑계를 대며 미뤄온 온톨로지에 대한 이야기들을 다시 시작해 보고자 한다. 지난번에는 온톨로지의 기본요소들은 무엇이 있는지에 대한 이야기들을 하였다. 어쩐지 '필요할까'라는 생각이 들기도 하지만 온톨로지의 종류에 대해서 한번쯤은 짚고 넘어가는 작업이 필요하다고 본다. 어쨌거나 온톨로지를 이해해보기 위한 글이니까.

 

 형식상 분류

앞선 포스트에서 온톨로지는 클래스(Class), 관계(Relation), 함수(Function), 공리(Axiom), 인스턴스(Instance)의 다섯 가지 요소를 이용하여 형식화된다고 했다. 하나의 온톨로지는 이들 요소를 모두 갖추어 형식화됨으로써 의미가 분명한 온톨로지가 될 수 있다. Uschold와 Gruninger는 의미가 분명한, 그러니까 개념과 그 개념을 나타내는 용어가 분명히 정의된 온톨로지를 형식적 온톨로지라고 보고 조금은 모호한 기준으로 온톨로지를 다음의 네 가지 형태로 구분하고 있다[각주:1].

온톨로지 유형

설명

비형식적
(highly informal)

공리 없이 자연어로 자유롭게 표현된 용어의 집합

일반 사전, 용어사전

반비형식적
(semi-informal)

자연어의 제한적이며 구조화된 형식으로 표현하여 모호성을 줄임으로써 명확성을 상당히 높인 형태

시소러스, 계층 분류

반형식적
(semi-formal)

형식적으로 잘 정의된 언어를 통해 표현한 형태

XML 스키마, XML DTD, DB 스키마

형식적
(rigorously formal)

속성 등의 형식적 의미, 논리, 논증으로 정교하게 정의된 용어로 표현한 형태

시맨틱 네트워크, RDFs, OWL

어느 정도 의역하기는 했지만 그대로 옮겨 적은 것이라 아무래도 어렵다(어렵다는 말을 너무 많이 하는 것 같지만, 어려운 걸 어떡해 ㅜㅜ). 필자가 나름 이해한 바를 여러분께 전하자면, 이 형식성이라는 것은 컴퓨터가 읽을 수 있고 처리할 수 있는 형태로 표현하는 것으로 얼마나 정확하게, 정교하게, 모호하지 않게 표현했나 하는 정도에 따라 달라진다는 것이다. 뭘 정확하게, 정교하게, 모호하지 않게 표현하는가?

"개념용어로!"

개념은 우리의 머릿속에만 존재하는 것이다. 뭐 이견이 있을 수는 있겠지만, 어떤 면에서는 맞는 말이니까. 여튼, 이 머릿속에 존재하는 것을 눈에 보이게, 컴퓨터가 처리할 수 있도록 하기 위해서는 구체적인 형태를 갖추도록 해야 할 것이다. 용어가 바로 그 구체적인 형태이며 이 용어가 얼마나 개념을 잘 표현하고 있는지, 그 관계는 얼마나 정교하게 설정되어 있는가의 정도를 통해 형식성의 정도를 결정하는 것이다.


 

 적용 범위상 분류

온톨로지는 적용 범위에 있어서 크게 상위(upper-level) 온톨로지와 하위(lower-level) 온톨로지로 구분할 수 있다. 상위 온톨로지란 다양한 영역에 적용될 수 있는 상식적인 개념들을 정의하여 우리가 일반적으로 이해하고 있는 현실 세계를 표현하고자 한다. 반면 하위 온톨로지는 경계가 있는 특정 영역의 현실 세계를 구체화하는 것을 목적으로 하고 있다. 이러한 종류의 온톨로지는 특정 영역(domain)이나 분야에 한정된 시각에서 그 영역의 개념과 개념간의 관계를 정의함으로써 특정 영역을 구체화하고 체계화하고자 한다.

Guraino는 하위 온톨로지를 보다 구체적으로 구분하여 다음의 네 가지 유형으로 온톨로지를 구분하고 있다[각주:2].

  • 상위 수준 온톨로지(top-level ontology): 매우 일반적인 개념을 묘사하는 것으로 다양한 이용자, 개발자 등을 위한 통일된 온톨로지 이론 제공
  • 도메인 온톨로지(domain ontology): 특정분야에 한정된 개념들을 제공하며 개념 규정 시 보다 정제된 정의를 요구
  • 과업 온톨로지(task ontology): 특정 과업 수행을 위한 개념을 기술하며 일반 또는 특정 영역에서 사용하는 언어를 재사용하여 상위 수준 온톨로지에 도입해 사용
  • 응용 온톨로지(application ontology): 특정 영역과 과제 온톨로지 모두에 종속되는 개념을 묘사하는 것으로 온톨로지의 특수화라고 할 수 있음

상위 수준 온톨로지는 하위 온톨로지(도메인, 과업, 응용)의 최상위 개념을 기술하여 이들 개념이 연결될 수 있는 기반을 만드는 것이라 할 수 있다. 도메인 온톨로지와 과업 온톨로지는 특정 영역, 즉 보다 구체적인 영역에서의 개념들과 행위를 정의하여 실제로 온톨로지를 활용할 수 있는 기반을 만드는 것이다. 응용 온톨로지는 특정응용분야에서 요구되는 지식을 모형화하는데 필요한 모든 정의들을 기술한다. 응용 온톨로지는 흔히 도메인 온톨로지와 업무온톨로지의 어휘들을 해당 응용분야에 맞게 구체화하고 상세화 한다.

이러한 분류는 일반화 정도에 따른 분류라고 보는 사람들도 있다. 일반화라는 말이 크게 와 닿지 않는데 다른 말로 하자면 구체성이라고 할 수 있겠다. 넓은 범위에서 좁은 범위로, 일반적인 것에서 특정적인 것으로 대상의 표현을 구체화하는 것이다. 도메인 온톨로지와 과업 온톨로지는 상위 수준 온톨로지의 개념을 특정 영역과 행위로 보다 상세화하는 – 넓은 범위에서 좁은 범위로 – 것이다. 즉, 얼마나 구체적인가의 문제인 것이다.


 

 그 밖의 분류

온톨로지는 다양한 분야에서 그 목적에 맞게 개발되고 있다. 그렇기 때문에 각 분야의 관점에 따라 분류가 다르다. 앞에서 이야기한 형식상 분류와 적용 범위상 분류가 일반적인 분류라 할 수 있다. 이 밖에 특정영역에 관계 없이 지식표현 형식의 기초가 되는 표현 온톨로지, 일반적이고 기초적인 개념을 제공하는 일반 온톨로지, 도메인 온톨로지와 일반 온톨로지 사이에서 인터페이스로 사용되는 중개 온톨로지, 개념 정의와 관계 표현 정도에 따른 중량(Heavy-weight) 온톨로지와 경량(light-weight) 온톨로지 등 형태, 영역, 개발 방법 등 다양한 온톨로지가 분류되고 있다.

이처럼 온톨로지의 유형은 일일이 언급하기도 어려울 정도로 다양하지만 지식의 명확하고 분명한 표현과 포착을 위한 도구로써 개발되고 있다는 점이 중요하다.

  1. Mike Uschold & Michael Gruninger, Ontologies : Principle, Methods and Applications, Edinburgh, Edinburgh University, 1996 [본문으로]
  2. 이현실, “온톨로지를 이용한 의학용어의 개념 모델링 사례분석 연구,” 정보관리학회지, 제21권, 제3호(2004. 9) [본문으로]
Posted by readholic
ontoBox2008/08/02 18:55
  톨로지에 대한 포스팅을 한지 꽤 되었다. 논문이다 프로젝트다 핑계를 대고 미루어 왔지만 어쩐지 이대로 놔둘 수는 없는지라 온톨로지에 한 발 더 다가갈 수 있는 글을 남겨보고자 한다.

  지난 포스팅에서 온톨로지는 "이 세상의 지식, 즉 개념을 잘 정의하고 이들 간의 관계를 설명하기 위한 체계"라고 말했었다. Gruber 씨가 말씀하셨 듯이 "온토롤지는 공유된 개념의 정형화된 명세로" 이 정의와 나의 설명(정의라 하기엔 background가 빈약하여 ㅡㅜ)은 어느 정도 일맥상통하지 않는가 자부해 본다. 그렇다고는 해도 아직 잘 모르겠는 것이 온톨로지이다. 아무래도 온톨로지를 좀 더 알기 위해서는 어떻게 생겨먹었는지 알아볼 필요가 있겠다.

온톨로지의 기본 요소


  사람에게 이목구비가 있듯이, 자동차에 차체, 엔진, 바퀴가 있듯이 온톨로지도 모양을 갖추기 위한 구성요소가 있다. 엄격히 말하자면 기본 요소라 말하는 것이 맞겠다.

  결론부터 말하자면, 온톨로지는 개념, 관계, 함수, 공리, 인스턴스의 5가지 요소를 통해 지식을 표현한다. 좀 더 어려운 말로 하면 "온톨로지는 지식은 클래스(Class), 관계(Relation), 함수(Function), 공리(Axiom), 인스턴스(Instance)의 다섯가지 요소를 이용하여 형식화된다[각주:1]" 라고 할 수 있다. 그럼 하나하나 살펴보도록 하자

1) 클래스(개념): 클래스는 앞선 포스팅에서 설명했던 개념화 또는 개념의 정의로 생각할 수 있다. 개념의 정의에 대해서는 Note 정도로 잠시 후에 이야기 해보겠다.

2) 관계: 관계는 클래스로 정의된 개념들의 상관관계를 나타내는 것으로 문장 성분으로 따지면 '~하다, ~이다' 와 같은 서술어 부분에 해당한다.

3) 함수: 이는 관계가 특정한 값을 가질 때, 즉 계속해서 사용이 되는 관계, 특정한 관계가 될 때 성립되는, 일종의 공식과 같은 것으로 이해하면 된다.

4) 공리: 공리는 일반적으로 '두루 통하는 진리나 도리'라는 의미를 가지나 온톨로지에서는 수학적 정의인 "증명이 없이 자명한 진리로 인정되며, 다른 명제를 증명하는 데 전제가 되는 원리"라는 의미로 이해하는 것이 보다 정확하다. 이 공리를 전제로 추론이 가능하게 된다.

5) 인스턴스: 데이터베이스를 공부하신 분이라면 좀 익숙하실텐데, 온톨로지에서도 역시 같은 의미로 이해하시면 될 듯하다. 인스턴스는 온톨로지에서의 실제 값, 즉 더 이상 나눌 수도 의미를 부여할 수도 없는 지경에까지 이른 데이터이다. - 어쩐지 논란의 여지가 있을 듯하나 이해하기에는 무리 없을 듯하여 pass~~ -

 그럼 이들 요소는 어떻게 써먹을까? 말로 설명하기엔 좀 복잡하니 그림으로 보면..
사용자 삽입 이미지
문장으로 나타내보면,

"SUV는 자동차의 한 종류이다"

가 된다. 즉, '자동차는 클래스다', 'SUV는 클래스다' 라는 대전제 다시 말해, Axioms에 의해 SUV와 자동차를 비교해볼 여지가 생기고 그 비교는 'A는 B의 한 종류이다'라는 관계로 정의되어 실제 값인 인스턴스에 새로의 정보 또는 의미를 부여할 수 있게 되는 것이다. 여기서 관계가 'IsKindsOf'과 같은 계속해서 사용하게 되는 경우 '함수(Fucntion)'이 되는 것이다.

  온톨로지적 추론에 의해 스포티징은 SUV의 인스턴스이므로 SUV와 자동차와의 관계에 따라 스포티징은 자동차라는 새로운 정보(또는 의미)가 생성된다.

  현재는 온톨로지를 사용하여 인간의 지식과 같은 정교한 수준의 논리적 추론은 아무래도 힘들지만 논리적 구조를 잘 짜면 가능할 수 있다(아직 해보지 않아서 ㅡㅡ;). 논리적으로, 이론적으로는 새롭게 생성된 정보, 즉 의미가 부여된 정보를 클래스로 정의하여 논리적 추론에 재사용할 수 있지만 견문이 부족한 탓에 아직 실예를 본 적은 없으므로 섣불리 말하기는 어렵다.

Note  Classification & Taxonomy
  개념을 정의하는 방법은 매우 다양하겠지만 문헌정보학의 한 영역인 정보조직에 대한 이해가 있다면 좀 더 효과적이고 효율적인 방법을 찾을 수 있을 것이다. 문헌을 체계적으로 조직, 쉽게 말해 잘 정리하기 위해서 고대부터 목록을 작성하였다. 문헌정보학의 정보조직 영역은 이러한 문헌정리를 위한 목록의 작성을 포함하여 정보의 체계적 조직에 이르는 광범위한 정보 조직 체계에 대해 연구하고 있다.
  정보를 체계적으로 조직하는 가장 큰 이유는 특정 정보를 쉽고, 빠르고, 정확하게 찾기 위해서라고 할 수 있겠다. 따라서 정보의 특성, 속성을 고려하여 공통된 특성, 속성을 같는 정보를 따로 정리하고 이러한 정보의 묶음에 쉽게 알아 볼 수 있는 이름을 붙여주면 굉장히 편리할 것이다. 하지만 어떤 정보가 언제 생길지, 얼마나 더 많이 생길지 알 수 없는 일이다. 문헌정보학에서는 지식이 정보를 포함하고 있다고 여기고 지식을 공통된 특성, 속성에 따라 먼저 나누어 묶어 두고자 연구했다. 그것이 바로 분류학이다.

  분류는 classification과 taxonomy의 측면에서 살펴 볼 수 있다. 둘 모두 분류법으로 국역되지만 둘은 조금 의미를 달리해야 한다. classification은 철학적 분류, taxonomy는 실용적 분류 정도로 볼 수 있을 것이다. 철학적 분류와 실용적 분류의 차이는 오토바이를 분류함에 따르는 차이를 예로 이해해 볼 수 있다. 오토바이를 자동차로 분류할 수 있는가. classification에서는 조금 어렵다. 자동차라 함은 네 개의 바퀴를 갖고 있으며 엔진으로 그 바퀴를 돌려 이동하는 장치 혹은 도구이다. 하지만 오토바이는 바퀴가 두 개뿐이므로 엄격한 의미에서는 자동차라 할 수 없다. 그러나 엔진을 갖고 그 힘으로 바퀴를 돌려 이동하기 때문에 어떤 의미에서는 자동차라 할 수 있다. classification은 논리적, 철학적으로 사물이나 현상, 개념 등을 유사한 것은 모으고 상이한 것은 구분한다. taxonomy에서는 조금 다른 관점에서 접근하여
시스템의 체계 및 계통 등을 일정한 규칙에 따라 분류한다. 다시 한번 오토바이의 예를 들면, 오토바이는 단순히 운송수단으로 분류될 수도 있고 2륜 원동장치로 분류될 수 있다. taxonomy는 분류의 목적 및 활용에 매우 의존적이다.

  이러한 분류의 개념을 이해한다면 개념을 정의하는데에 많은 도움이 될 것이다. 온톨로지에서 개념의 정의는 해당 온톨로지의 활용 목적을 고려해야하지만 개념적으로 정의하여 공유될 수 있어야 하므로 논리적, 철학적으로 정의하는 것 또한 중요하기 때문이다.



온톨로지 예전 포스팅
2008/04/29 - [ontoBox] - 온톨로지에 대한 쉬운 설명
2008/01/29 - [ontoBox] - 온톨로지란 무엇인가

                                                                         
  1. Oscar Corcho. Mariano Fernandez-Lopez & Asuncion Gomez Perez. Onto Web Technical Road-map v1.0. IST Programme of the Commision of the European Communities as Project No. IST-2000-29243. pp.10-11.[서휘, 2006, 온톨로지 자동구축을 위한 OWL의 어휘와 구문 사용방법에 대한 이론적 연구, 한국도서관․정보학회지, 제37권 제2호, 재인용] [본문으로]
Posted by readholic
ontoBox2008/04/29 21:11
얼마전 온톨로지에 대해 굉장히 어렵게 (본디 쉽게 이야기 하고자 했지만...) 이야기를 한 적이 있다. 이미 포스팅 된 글이라 지우기도 뭣하고 뭐 그닥 나쁜 글은 아니라 생각이 들지만 아무래도 좀 쉽게 이야기를 풀어갈 필요성을 느껴서 전혀 학문적이지 않은 온톨로지에 대한 이야기를 해보고자 한다.

온톨로지는 뭔가.

요즘 시멘틱 웹(대개 '시맨틱'이라 쓰고 있지만 우리 선생님께서는 '시멘틱'을 좋아하신다. 본인도 이편이 좋다고 생각한다. 이유는 생략)이 대세다. 시멘틱 웹이란 무엇인가에 대해 이야기를 해야겠지만 이 글은 온톨로지에 대한 이야기므로 간단하게 시멘틱 웹에 대해 이야기 하면

"시멘틱 웹은 웹 상에 존재하는 정보에 의미를 부여하여 컴퓨터가 정보를 이해할 수 있도록 하는 차세대 웹이다."


이러한 시멘틱 웹을 구현하기 위해서는 말했듯이 컴퓨터가 정보를 이해할 수 있어야 한다. 그럼 어떻게 하면 컴퓨터가 정보를 이해할 수 있을까?

컴퓨터가 정보를 이해하게 하기

컴퓨터는 좀 바보다. 인간이 가르쳐 주기 전에는 아무것도 알지 못한다. 그 정보의 내용이 뭔지, 그 정보를 어떻게 써야 하는지, 그 정보를 어떻게 이용해야 하는지 가르쳐 주기 전에는 그냥 문자로만 인식한다. 그래서 컴퓨터가 정보를 이해하게 하기 위해서는 그 방법을 알려주어야 한다. 그 방법은 대개 '추론'이라는 형태로 나타나는데 이 추론이라는 것은 어떤 조건에 의해 가능하게 된다.
두 남자가 있다. 한명은 나이가 많고 한명은 좀 어리다. 이들 간에 어떤 관계들이 있을까? 그 둘이 상하관계라면 아버지와 아들, 형과 아우, 상사와 부하직원, 선생님과 제자 등의 관계가 있을 수 있다. 수평관계라면 친구, 동료의 관계가 있을 수 있다. 이런 관계들은 직업, 역할 등과 같은 여러 조건에 따라 달라진다. 즉, 두 개의 정보 간에 어떤 조건을 기반으로 관계가 성립될 때 정보에 의미가 부여된다. 김덕배 혼자 있으면 그 자체만의 정보이지만 김득칠의 아버지인 김덕배는 아버지라는 의미가 부여되는 것이다.
그래서 이런 조건과 관계가 추론과 무슨 상관이 있나? 상관이 있다. 김덕배는 득칠이 아버지니까 아버지들을 찾을 때 득칠이는 검색되지 않고 덕배씨만 검색이 되는 것이다. 여기서 중요한 것은 김덕배씨가 아버지라는 정보는 김덕배씨 자체에는 표현되지 않았으나 득칠이와의 관계에서 아버지라는 정보가 '추론'된 것이다.

왜 컴퓨터가 정보를 이해해야 하나

그래, 왜 이해해야 하지? 그냥 김덕배씨 정보를 생성할 때 아버지라는 정보를 같이 넣으면 되잖아? 라고 생각하신다면 이 세상에 있는, 아니 적어도 온라인 상에 존재하는 모든 정보의 양을 생각해 보시라. 잘 기억은 나지 않지만 구글이 저장해 놓은 웹페이지가 10억 페이지를 넘었다고 알고 있다. 약 2년 전에 들은 소식인데, 어쟀든 10억 페이지를 일일이 수정하려면 네이버의 알바신공으로도 힘들지 않을까 한다. 시멘틱 웹은 발전하고 싶어하니 웹 상에 존재하는 정보에 의미는 부여해주고 싶다. 그런데 알바신공으로도 힘드니 자동적으로 하는 수 밖에는 도리가 없다. 그래서 컴퓨터가 정보를 이해할 수 있도록 규칙을 만드는 것이다.

규칙은 어떻게 만드나

그런데 문제는 그 규칙을 어떻게 만드는가 하는 것이다. 문서들이 워낙에 다양하니, 내용이 워낙에 다양하니, 주제가 워낙에 다양하니 그 비우를 어떻게 다 맞추나. 큰일이다.
큰일은 뭘, 훗, 다양하면 덜 다양하게 만들면 그만이지. 그럼 덜 다양한 녀석들 비우를 하나씩 맞춰주면 되지 않겠는가. 덜 다양하게 만들려면 이 세상의 것들을 공통적인 성질로 묶으면 된다. 빨강, 파랑, 노랑은 색깔, 이효리, 비, 앙드레 김은 사람 또는 연예인 그도 아님 유명인 등과 같이 공통의 성질을 갖고 있는 것들을 한데 묶어주면 조금 덜 다양하게 된다. 그리고 그렇게 덜 다양한 녀석들 사이에 어떤 관계가 있는지, 그런 관계는 어떤 때에 생성되는지를 정해주면 된다.

그러니까 온톨로지는 뭐야?

온톨로지는 그 다양한 녀석들을 조금 덜 다양하게 만들어 보자는 시도이다. 온톨로지는 간단하게 "개념의 명세화"로 설명된다. 무슨 말이냐, 우리가 보고, 듣고, 생각하고, 말하는 이 세상의 모든 것을 구체적으로 설명하고 표현하자는 말이다. 앞서 말한 덜 다양한 녀석들 사이의 관계와 그 관계가 어떤 때 생기는지를 말해줌으로써 따로따로 덜어진 정보들을 가지고 지식을 만들어 내자는 것이 온톨로지의 취지이다.
온톨로지는 이러한 덜 다양을 위해 계속해서 좁혀 들어간다. 학문 중에서도 법률, 법률 중에서도 형법, 형법 중에서도 판례, 판례 중에서도 피고. 이렇게 계속 좁혀들어가서 그 마지막에 있는 개념을 구체적으로 설명하고 그 개념이 속한 영역에 존재하는 개념들의 관계를 상황과 조건을 통해 설명하는 것이다.

아 모르겠다.

이런 뜬금없는 이야기를 듣고 온톨로지가 무엇인지 아신다면, 당신은 천재. 더 자세한 이야기는 다음번에 하기로 하고 오늘의 내용을 정리하면

온톨로지는 컴퓨터가 정보를 이해할 수 있도록, 정보를 구성하는 최소의 단위인 개념을 구체적으로 설명하고 이 구체적으로 설명된 개념들을 관계와 조건을 통해 다시 한번 설명하기 위한 체계. 라는 것이다.

음... 어렵다 어려워


온톨로지 개념 정리에 대한 어려운(?) 글
2008/01/29 - [ontoBox] - 온톨로지란 무엇인가
Posted by readholic
ontoBox2008/02/01 20:03

    "온톨로지를 한마디로 정의하기는 꽤나 어려운 일이다. 'Ontology'라는 단어는 철학의 존재론에서 왔지만 온톨로지를 시스템으로 사용하는 정보학과 전산학 분야에서는 철학에서의 온톨로지와는 조금 다르게 정의되고 있다. 뿐만 아니라 그 정의는 상황과 목적에 따라 또한 다양하게 정의되므로 "온톨로지는 무엇이다"라고 간단하게 말할 수 없다.

온톨로지를 한마디로 정의하기도 어려울뿐더러 온톨로지를 이해하는 것도 만만치 않게 어렵다. 이 글은 온톨로지를 보다 쉽게 이해 하는데 조금이나마 보탬이 되어보자하는 마음으로 쓰게 되었으니 만큼 어려운 용어는 자제하여 이야기를 풀어보고자 한다.

온톨로지의 개요

앞서 말했듯이 온톨로지의 어원은 철학의 존재론이다. (정보학, 전산학에서 온톨로지를 사용할 때에는 반드시 대문자 'O'를 사용해야 한다. 아무래도 좀 헷갈리니까) 존재론이란 실재에 대한 정확한 이해를 추구하는 학문이다.[각주:1] 실재란 것은 우리의 눈에 보이는 이 세상의 모든 것을 말하며 존재론은 이 세상을 규정하기 위해 세상에 존재하는 실체들에 대한 명확한 이해와 정의를 연구하는 학문이라 할 수 있다.

온톨로지는 이러한 존재론의 기본 철학을 정보시스템에 적용하여 정보시스템의 대상이 되는 자원[각주:2]의 개념을 명확하게 정의하고 상세하게 기술하여 보다 정확한 정보를 찾을 수 있도록 하는데 목적이 있다.

온톨로지는 크게 볼 때 정보를 효과적으로 관리하고 검색하기 위한 지향점이라 할 수 있다. 온톨로지는 이용자에게 정보만을 제공하는 기존의 정보시스템이 정보를 지식의 수준으로 제공할 수 있는 체계를 마련할 수 있도록 한다. 즉, 지식을 표현하기 위한 밑그림이라 할 수 있는 것이다. 일부에서는 온톨로지를 개념을 정의한 용어집 정도로 정의하고 있으나 개념을 정의하고 그것을 구체적인 단어로 표현하는 것은 온톨로지 구축을 위한 작업의 일부분으로 온톨로지 자체를 용어집으로 취급하기에는 온톨로지에 열정을 가진 사람들이 좀 억울하다.

온톨로지에 대한 이해를 위해 온톨로지에 대한 몇가지 대표적인 정의들을 살펴보도록하자.

온톨로지의 정의

Tom Gruber는 온톨로지를 다음과 같이 간략하게 정의하였다.

        온톨로지는 개념화의 명세이다.
        An ontology is a specification of a conceptualization.[각주:3]

간략하게 정의하였다지만 말이 조금 어렵다. Gruber의 정의를 풀어보자. 우선은 개념화란 무엇인지가 궁금하다. 개념화란 말 그대로 '무언가를 개념[각주:4]으로 만드는 것이다'라고 짧게 말할 수 있겠다. 즉, 개념화는 우리가 볼 수 있는 사물이나 추상적으로 존재하는 관념들을 구체적인 집합으로 만드는 것이다. SUV, 덤프트럭, 세단, 경차의 공통점은 '차(Vehicle)'라는 점이다. 또한 SUV, 덤프트럭은 '차'의 종류 중에서도 '트럭(Truck)'에 속하고 경차, 세단은 '자동차(Car)'에 속한다. 이렇듯 각 사물에서 공통점을 찾아내고 이를 하나의 집합 또는 범주로 나타내는 작업을 문헌정보학에서는 분류라 하며 일종의 개념화라 할 수 있다.
개념화는 어떠한 정보를 관리하기 위해 필요하다. 정보의 공통된 속성을 찾아 그 속성에 따라 정보를 나누고 나누어진 정보 중 필요한 정보만 속성을 통해 보다 빠르게 찾아내고 접근할 수 있게 하는 것이다. 개념화는 우리의 생활 속에서 빈번하게 일어난다. tagging은 그 대표적인 예라 할 수 있다. 우리가 블로깅을 하면서 태그를 달 때, 내가 쓴 글의 주제, 포함하는 단어 등을 주로 사용한다. 태그는 내가 쓴 글이 무엇에 대해 쓴 것인지 표현하고 설명하는 것이며 이것은 일종의 개념화라 할 수 있다.

그렇다면 상세는 무엇일까? 명세는 사전적으로 '분명하고 자세함[각주:5]'라는 의미를 갖고 있다. 즉, 온톨로지에서 명세는 이와 같은 의미로 사용되어 개념화된 정보, 지식의 쓰임새, 의미 등을 분명하고 자세하게 설명하는 것을 말한다.

Gruber의 정의를 살펴 보았지만 그의 정의는 너무 간략하여 온톨로지를 이해하기는 좀 어려울 것 같다. Borst의 정의를 살펴보자. 그는 Gruber의 정의를 다음과 같이 수정하였다.

         온톨로지는 공유된 개념의 정형화된 명세이다.
         Ontologies are defined as a formal specification of a shared conceptualization.[각주:6]

Borst의 정의에는 '공유'와 '정형'의 두 개념이 추가 되었다. 이는 온톨로지는 일정한 틀에 따라 명확하게 정의되고 상세하게 설명된 개념을 특정영역에서 공유된 개념, 즉 정보나 지식을 혼란 없이 사용할 수 있도록 한다는 점을 의미한다. 온톨로지에서 공유의 의미는 다양하게 해석될 수 있으나 여기서는 하나의 잘 정의된 개념을 각 분야에서 공통적으로 사용된다는 의미에서의 공유에 주목해야 한다. 또한 일정한 틀은 나중에 다루게 될 RDF/OWL, TopicMap과 같은 온톨로지 표현 언어를 말한다.

온톨로지는 무엇인가

온톨로지는 개념, 어떤 의미에서는 정보를 잘 정의하여 기계가 정보를 이해할 수 있는 기반체계을 만드는 것으로 정보의 쓰임이나 의미 등을 분명하고 자세하게 설명하는 작업과 정보를 분명하게 구별하는 기반을 세우는 작업, 기계가 정보를 이해하여 새로운 정보 또는 지식을 생산할 수 있는 체계를 작성하는 작업 등을 체계적으로 정리한 이론적 틀이라고 말할 수 있다.


온톨로지를 이해하기 위해서는 이와 관련된 수 많은 이야기들을 알아야 할 필요가 있다. 지식공학, 정보공학, 분류, 시소러스, 시맨틱 등등... 이번 글을 시작으로 이러한 이야기들을 차근차근 풀어 나가보고자 한다.

다음에는 '왜 온톨로지를 사용하는가' 혹은 '왜 사용해야 하는가'라는 주제로 이야기를 해보고자한다.


2008/04/29 - [ontoBox] - 온톨로지에 대한 쉬운 설명





                                                                         
Posted by readholic
Daily Story2008/01/26 14:08

온톨로지에 대한 정리를 해볼 필요가 있을 것 같다. 본 블로그의 목적이기도 하다만 나의 공부를 위해서는 아무래도 필요한 작업이 아닌가 생각된다. 온톨로지라는 것이 너무 광범위하고 추상적이라 아무래도 다루어야 할 요소가 많고 범위가 크겠지만 하는데까지는 해볼 요량이다.
어쩐지 욕심이라는 생각이 들기도 하지만...
온톨로지에 대한 정리글들은 ontoBox에 올릴 생각이다. 구식이지만 나쁘지는 않은 이름이란 생각이 든다.

'Daily Story' 카테고리의 다른 글

아침형 인간  (0) 2008/04/18
들려주신 분들께 감사의 말을 드립니다  (0) 2008/04/16
spam  (0) 2008/04/07
포스팅이란  (1) 2008/04/05
Ontology  (0) 2008/01/26
스킨 변경 마무리  (0) 2008/01/25
Posted by readholic