2008-2009. 과학 기술 문서를 위한 정보 검색 시스템
페이지 정보
작성자 최고관리자 댓글 0건 조회 852회 작성일 20-02-04 20:21본문
과학 기술 문서를 위한 정보 검색 시스템, 한국학술진흥재단(이공계 기초연구과제 지원 사업), 연구책임자, 2008.11 ~ 2009.10.
요약: 인터넷의 발달과 함께 대용량의 문서로부터 사용자가 원하는 것을 쉽고 빠르게 찾아주는 정보 검색 시스템에 대한 요구가 폭발적으로 증가하였다. 그에 따라 정보 검색 시스템은 대형 포털 사이트에서부터 도서관, 정부 기관, 일반 기업체, 인터넷 쇼핑몰에 이르기까지 거의 모든 곳의 필수 소프트웨어로 자리 잡았다. 그러나 기존의 정보 검색 시스템은 문서에 포함된 단어 형태의 키워드를 중심으로 검색을 수행하기 때문에 다양한 그림과 수식들이 포함되어 있는 과학 기술 문서를 효과적으로 찾아주기에는 한계가 있다. 예를 들어, ‘이차방정식’을 찾고 싶은 사용자에게 ‘x^2+2x+1=0’이라는 수식이 포함된 문서를 전혀 찾아주지 못한다. 학술정보 사이트의 경우에 색인 대상 문서의 저자나 관리자에게 주요 수식과 관련된 키워드들을 일일이 등록하도록 하고 있으나 많은 시간과 노력이 들어갈 뿐만 아니라 문서 전체의 특성을 반영하지 못한다는 한계가 여전히 남아 있다. 예를 들어, ‘정규분포의 정의’를 찾고 싶은 사용자에게 정규분포에 대한 활용이나 증명이 아닌 실제 정의가 포함된 문서를 찾아주지 못한다. 이러한 문제를 해결하기 위해서 본 과제에서는 키워드 중심의 기존 정보 검색 시스템의 단점을 보완한 과학 기술 문서 전문 검색 시스템을 연구 개발한다.
요약: 인터넷의 발달과 함께 대용량의 문서로부터 사용자가 원하는 것을 쉽고 빠르게 찾아주는 정보 검색 시스템에 대한 요구가 폭발적으로 증가하였다. 그에 따라 정보 검색 시스템은 대형 포털 사이트에서부터 도서관, 정부 기관, 일반 기업체, 인터넷 쇼핑몰에 이르기까지 거의 모든 곳의 필수 소프트웨어로 자리 잡았다. 그러나 기존의 정보 검색 시스템은 문서에 포함된 단어 형태의 키워드를 중심으로 검색을 수행하기 때문에 다양한 그림과 수식들이 포함되어 있는 과학 기술 문서를 효과적으로 찾아주기에는 한계가 있다. 예를 들어, ‘이차방정식’을 찾고 싶은 사용자에게 ‘x^2+2x+1=0’이라는 수식이 포함된 문서를 전혀 찾아주지 못한다. 학술정보 사이트의 경우에 색인 대상 문서의 저자나 관리자에게 주요 수식과 관련된 키워드들을 일일이 등록하도록 하고 있으나 많은 시간과 노력이 들어갈 뿐만 아니라 문서 전체의 특성을 반영하지 못한다는 한계가 여전히 남아 있다. 예를 들어, ‘정규분포의 정의’를 찾고 싶은 사용자에게 정규분포에 대한 활용이나 증명이 아닌 실제 정의가 포함된 문서를 찾아주지 못한다. 이러한 문제를 해결하기 위해서 본 과제에서는 키워드 중심의 기존 정보 검색 시스템의 단점을 보완한 과학 기술 문서 전문 검색 시스템을 연구 개발한다.
댓글목록
등록된 댓글이 없습니다.