KACTEIL-KMA (한국어 형태소 분석기)
페이지 정보
작성자 최고관리자 댓글 0건 조회 1,911회 작성일 20-02-26 13:02본문
[개요]
KACTEIL-KMA는 건국대학교 언어분석 패키지인 KACTEIL(Ku's AnalytiCal TEchniques In Languages; 칵테일)에 속해 있는 한국어 형태소 분석기 및 품사 태거(KMA; Korean Morphological Analyzer)를 말합니다.
주개발자: 최맹식
개발언어: 자바
현재버전: v1.0
[관련 논문]
제목: 기계학습에 기반한 한국어 미등록 형태소 인식 및 품사 태깅
요약: 한국어 형태소 분석에서 미등록 형태소 오류들은 2가지 유형으로 나뉜다. 첫 번째 오류 유형은 형태소 분석기가 어떤 형태소열도 찾아내지 못하는 것이고, 두 번째 오류 유형은 등록 형태소들의 잘못된 조합을 찾아내는 것이다. 지금까지 대부분의 기존 미등록 형태소 추정 기술들은 단지 첫 번째 오류 유형에만 초점을 맞추어 왔다. 본 논문에서는 2가지 유형의 오류들의 모두 다룰 수 있는 미등록 형태소 추정 방법을 제안한다. 제안 방법은 SVM(Support Vector Machine)을 이용하여 미등록 형태소 오류들을 포함할 가능성이 있는 어절들을 검출한다. 그리고 CRFs(Conditional Random Fields)를 이용하여 검출된 어절들의 형태소 분리와 품사 태깅을 수행한다.
[데모 영상]
유튜브 영상을 보려면 여기를 클릭하세요.
[데모 시스템]
성능: Accuracy 95.21%
데모를 보시려면 여기를 클릭하시기 바랍니다.
댓글목록
등록된 댓글이 없습니다.