'시맨틱웹'에 해당되는 글 2건

  1. 2006.11.21 시맨틱웹의 진행 과정
  2. 2006.11.21 시맨틱웹을 준비하는 기업이 3년 후를 잡을 것이다.

3.시맨틱웹의 진행 과정


03.01.XML을 기반으로 한 시맨틱웹의 구조


시맨틱웹은 W3C에서 웹의 접근, 활용, 바른 발전을 위해 개발하는 기술과 방법의 총칭이다.

현재 시맨틱웹을 진행시키고 있는 가장 중요한 기관은 웹표준을 만드는 W3C라 할 수 있다. W3C(World Wide Web Consortium)는 1994년 10월 웹의 창시자인 팀 버너스리를 중심으로 미국 MIT 대학에서 출발했다. 현재 업계, 학계, 정부의 각종 기관 500개 이상이 회원으로 가입해 W3C를 지원하고 있다. W3C는 웹에 관한 표준을 만들면서 인터넷의 흐름을 바르고 발전적인 방향으로 이끌고 있으며, 여러 가지 문제를 조정하는 역할을 하고 있다. W3C의 궁극적 목적은 모든 인류가 여러 가지 한계와 차이를 극복할 수 있도록 누구나 웹에 접근할 수 있고(Universal Access), 접근한 웹을 활용을 도와주며(Semantic Web), 웹을 신뢰할 수 있도록(Web of Trust) 바른 방향으로 발전시키는데 힘을 쏟고 있다.
누구나 접근 가능한 웹이 웹표준의 제정과 준수로 이루어지는 것이라면 웹의 활용은 시맨틱웹의 구현으로 이루어진다. 시맨틱웹은 웹의 활용을 돕고, 웹을 신뢰할 수 있도록 도와주는 기술과 방법론의 총집합체인 셈이다.


SGML을 개선시켜 웹에 적용시킨 XML은 자동화에 좋다.

HTML 문법은 링크만 표시할 수 있을 뿐 그 외의 일은 할 수 없다. 그러나 1986년 골드파브(Goldfarb)에 의해 개발된 SGML은 문서의 구조를 설명하는 언어로 개발되었다. SGML은 문서의 형식 뿐 아니라 문서와 자료를 설명하기 위한 문법규칙으로 태그의 의미와 사용규칙을 정의해주는 언어다. SGML을 웹에 더 적합한 형태로 개선하고 쉽게 사용할 수 있도록 만든 것이 XML(eXtensible Markup Language = 확장기호표시언어)이다. 1988년에는 W3C에서 XML을 새로운 웹표준언어로 선택한다. XML은 새로운 태그를 정의해 사용할 수 있는 언어로 SGML의 웹판이라고 볼 수 있다.
HTML 태그가 미리 정의된 것과 달리 XML 태그는 XML에서 미리 정의된 것이 아니다. 즉 필요한 태그를 사용자가 직접 정의해 사용할 수 있다. HTML에서는 라는 이름의 태그가 지정되어 있었지만, XML에서는 사용자가 라는 이름의 태그를 만들어 사용할 수 있다는 뜻이다. 이것은 기존의 HTML보다 훨씬 유연하고 확장성이 좋다. 이렇게 함으로써 XML은 문서의 내용과 표현을 구분할 수 있게 되었다.

[HTML의 특징]
1. HTML은 문서 디자인용 태그가 대부분이다. 문서의 구조는 설명하지 않는다.
2. HTML 문서는 문서 내용과 디자인만 있어 기계가 문서의 의미나 구조를 파악하기 어렵다.


[XML의 특징]

1. XML은 문서의 구조를 정의하는 문법으로 문서 작성자가 태그를 만들고 정의할 수 있다.

2. XML 문서는 문서의 자료 구조, 태그의 의미 등을 설명하므로 기계가 구조를 파악할 수 있고 자동화하기 좋다.

기존의 HTML이 문서를 화면에 예쁘게 보여주기 위해 태그를 사용한 것과 달리, XML은 눈에 보이지 않는 문서의 구조나 의미도 태그로 정의할 수 있다. 이는 대단한 장점이나 사용자가 태그를 마음대로 만들 수 있기 때문에 문서 내용과 상관 없는 부적절한 태그도 사용이 가능한 점은 문제다. 즉 라는 태그는 누구나 글씨 색깔이나 크기를 바꿀 때 쓰는 태그라는 것을 알지만 라는 생전 처음 들어본 태그가 무엇을 하는지 파악하기는 쉽지 않은 것이다. 이 글씨 크기를 지정하는 태그인지, 동굴의 길이나 넓이를 나타내기 위해 만든 태그인지 바로 판별하기는 어렵다. 또한 같은 의미를 가진 다른 구조의 웹문서를 작성할 수도 있다. 라는 태그 외에도 이나 라는 태그를 사용해서 문서를 작성할 수도 있는데, 이때 사용한 라는 태그는 사실 같은 의미를 가진 태그다. 문제는 이 세 개의 태그가 같은 의미를 가진 태그라는 사실을 컴퓨터가 어떻게 이해할 수 있느냐 하는 점이다.

이런 이유로 XML이 비록 HTML보다 더 확장성이 좋고 유연하다고 하지만 시맨틱웹의 표준언어로 사용하는데는 한계가 있다. XML로 정의한 태그는 사람이 이해하기는 어렵지 않으나 기계가 자동적으로 그 의미를 이해하기는 어렵다. 특히 태그 사이의 의미 연관성을 추론하기란 매우 어렵다. 임의로 만든 태그의 사용법은 알 수 있어도 어떤 의미를 담고 있는 태그인지 파악하기는 어려운 것이 XML의 단점인 것이다.

RDF는 이런 문제를 해결하기 위해 제시된 기술이다. RDF(Resource Description Framework = 자원서술얼개)는 특정 자원에 대한 숨은자료를 설명하는 XML 기반의 프레임워크다. RDF는 자원, 속성, 속성값을 묶어서 하나의 단위로 취급하는 기술로 정보를 구성하는 자원에 대한 좀더 세밀한 설명과 관계 파악을 쉽게 해준다. 즉 RDF라는 기술을 이용하면 문서에서 사용되는 요소의 의미와 문서 사이의 관련성 표시가 쉬워지고, 기계끼리 자동화처리가 한결 쉬워진다.


XML과 RDF에 기반을 두고 있는 시맨틱 웹의 계층 구조

현재 시맨틱웹의 구조는 RDF와 같은 기술에 크게 의지하고 있다. 시맨틱웹의 초기의 구조와 요즘은 구조가 조금 다르다. 팀 버너스 리가 제안한 시맨틱웹의 계층구조는 그림과 같다. 여기서 계층적이라는 의미는 각 계층별 기술들은 독립적으로 발전해 왔지만, 시맨틱 웹을 구현하는데 있어서는 하위 계층의 기술이 상위 계층의 기술 구현의 기반이 된다는 말이다. 또한 기술의 발전의 시간적 순서는 하위계층에서부터 상위계층으로 올라가고 있다.

시맨틱웹의 2002년 계층 구조와 2005년 변화된 발표 내용

** 팀 버너스 리가 설명한 시맨틱웹의 2002년 계층 구조와 2005년 변화된 발표 내용. Ontology가 OWL 등으로 대체된 변화가 눈에 뜨인다.
Posted by 도깨비^^

댓글을 달아 주세요

13.03.시맨틱웹을 준비하는 기업이 3년 후를 잡을 것이다.


지난 3년 동안 한국은 기획력과 영업력에 의존했다.

3년 전의 포탈 순위가 계속 유지되지는 않는다. 2004년 일 평균방문자 수에서 네이버는 다음을 제치고 1위를 차지했고, 네이트는 야후를 제치고 3위로 올라섰다. 그러나 특별한 기술이나 서비스를 선보인 것이 아니라 기획력과 마케팅에 큰 영향을 받았다. 국내 포탈은 2004년에 스타를 내세운 대대적인 광고를 내보냈다. 네이버의 '전지현', 파란의 '백윤식', 야후의 '임수정', 엠파스의 '문근영' 등 스타를 내세워 광고를 했고, 이 기간 동안 꽤 홍보 효과를 봤다. 그러나 네티즌의 발길을 잡는 서비스가 없었다. 네이버가 국내 1위를 차지했다고 하지만 '검색, 뉴스, 포토, 메일, 지도 전화번호검색, 지식인, 블로그, 카페, 붐업' 등 현재 네이버의 주요 차림표를 구성하고 있는 것 중에서 네이버가 맨 처음 개발한 것은 없다. 네이버만 가능한 것도 없고, 네이버만의 기술력으로 운영되는 것도 없다. 물론 기획력과 영업력도 중요한 기업 경쟁력임은 분명하지만 장기적인 경쟁력은 아니다. 같은 종류의 서비스를 할수록 차별화된 기술이 필요하다. 기술의 우위는 비용의 우위로 나타나고, 같은 서비스일 경우 비용 우위를 가진 기업이 장기전에서 이기기 마련이다. IT기업은 차별화된 기술의 바탕 위에 기획력과 영업력을 가져야 하는 것이다. 기술 없는 기획력은 한계를 드러내기 마련이다.

우리나라의 경우 검색포탈이라 하더라도 기획자, 디자이너, 개발자가 골고루 섞여있는 반면 구글은 디자이너 한 명 없이 개발자 위주로 구성된 점을 눈여겨봐야 한다. 심지어 우리가 서비스 회사로 알고 있는 아마존닷컴조차 기술회사라고 말할 정도다. 아마존은 50만 개의 협력 사이트와 6만5천 명의 웹서비스 어플리케이션 개발자가 있다. 이들이 아마존을 이끌고 있기 때문에 아마존을 기술회사라고 말하는 것이다.


시맨틱웹 기술은 IT산업은 쇠퇴하는 사업에도 새로운 기회를 제공할 것이다.

제대로 산업이 돌아가려면 상업성에 밝은 IT기업이 먼저 세계적인 흐름을 파악하고 신기술 개발과 신규 서비스로 성장을 거듭하고, 이 기업에 들어가기 위한 지식으로 학교에서 신기술을 가르치고, 정부에서 이들 산업을 지원하기 위한 정책을 마련하는 순서가 되는 것이 일반적이다. 그런데 우리나라는 거꾸로 정부에서 과제를 정해주고 기업이 따라가는 순서로 진행되는 경우가 많다. 시맨틱웹에서도 이런 현상이 나타나고 있다. 이미 한국 정부는 2003년도부터 시맨틱웹의 중요성을 인식하고 각종 지원을 강화하기 시작했다. 정보통신부가 3년간 142억 원을 들여 시맨틱웹을 비롯한 지능형 지능형 e-비즈니스 플랫폼 기술을 개발한다고 밝힌 것은 시맨틱웹에 대한 준비를 더 이상 늦출 수 없기 때문이다. IT기업이 먼저 시장에서 움직이는 것이 아니라 정부가 먼저 기술 개발에 나서는 것이 국내의 시맨틱웹 진행상황이다.

RSS를 아바타가 음성으로 읽어주기, 여러 사이트의 주요 알맹이를 사용자가 편집해 볼 수 있는 서비스 등 개발할 수 있는 서비스가 많다. 이런 가능성을 알기에 미국 토픽스닷넷의 리치 스크렌타 CEO는 '신문이 RSS를 통해 검색엔진에 빼앗긴 사용자를 되찾아올 수 있다.'는 말을 했다. 쇠락해가는 신문사들이 RSS 활용을 적극 검토해야 하는 이유는 RSS가 지난 3년 간 몰락한 신문사를 부흥시킬 잠재력이 있기 때문이다. 초보 기술인 RSS가 이 정도라면 좀더 고급 수준의 시맨틱웹 기술을 적용시킬 경우 그 효과는 더욱 클 것이다. 시맨틱웹은 새로운 돌파구를 찾는 기업에게 기회를 제공할 것이다.


3년 후를 잡으려면 시맨틱웹을 준비해야 한다.

지금까지 설명한 것처럼 시맨틱웹은 이미 생활 속에 파고들고 있다. 따라서 시맨틱웹이란 무엇이고, 시맨틱웹이 구현될 것인가를 따지는 것은 이미 늦었다. 이제 우리가 관심 가져야 할 내용은 시맨틱웹을 어떻게 하면 좀더 쉽고, 재미있고, 유용한 서비스로 구현할 것이냐 하는 점이다. 그 이름이 시맨틱웹이건 웹2.0이건 상관 없다. 중요한 것은 웹이 많은 사람을 편하고 행복하게 하는 방향으로 나가야 하며, 이를 위해 새로운 기술을 개발해야 한다는 사실이다. 그리고 신기술을 개발하는 기업이 몇 년 이내 다가올 새로운 기회를 붙잡을 것이다.

그러나 한국에서 시맨틱웹 연구는 초기단계에 머물고 있다. 현재 시맨틱웹 연구는 주로 인공지능 분야나 데이터베이스, 전자상거래 분야에서 일부 진행되고 있을 뿐이다. 그나마 가장 활발한 분야는 XML 기반의 응용프로그램 개발 쪽이지만 시맨틱웹을 주제로 다루지는 않는다. 때문에 시맨틱웹을 적용한 응용프로그램의 개발은 아직도 요원한 상태다. 외국에서 워크샵과 컨퍼런스를 통해 활발하게 시맨틱웹에 대해 논의하고 관련 기술을 준비하며, 실제로 다양한 프로그램과 서비스를 개발해 활용단계에 들어선 것과 비교하면 꽤 늦게 대응하고 있는 상태라 할 수 있다. 사실 지금부터 시맨틱웹을 대비해도 늦지만 지금이라도 뛰어들지 않으면 2~3년 뒤에 현재의 위치를 유지할 사이트가 많지 않을 것이다.

불과 몇 년 후의 유비쿼터스 시대는 모든 기기가 융합이 되는 시대가 될 것이다. 그리고 융합의 중심은 웹이 될 것이고, 유비쿼터스웹의 특징은 자동화에 강한 시맨틱웹이 될 것이다. 이를 위해 준비할 것은 시맨틱웹 기술만이 아니다. 웹표준, 웹접근성에 관심, 웹정신에 대한 바른 철학 등이 기술에 앞서 필요하다.

3년 후에 살아남거나 새로운 기회를 잡고 싶은가? 그렇다면 시맨틱웹에 대비하고 준비해야 할 것이다. 시맨틱웹은 우리에게 곧 다가올 웹이며, 새로운 기회가 될 것이다.

Posted by 도깨비^^

댓글을 달아 주세요