SSISO Community

시소당

한국어 형태소 분석기와 한국어 분석 모듈

한국어 형태소 분석기와 한국어 분석 모듈
KLT: Korean Language Technology -- (구)HAM: Hangul Analysis Module


형태소 분석기 download: Korean morphological analyzer(한국어 형태소 분석기)

사용상의 문제점, 궁금한 점은 FAQ -- Frequently Asked Questions를 참조하세요.

KLT version 2.10b

  1. KLT version 2.0에 비해 분석 정확도 및 성능이 더욱 개선되었음.

KLT version 2.0

  1. HAM version 6.0에 비해 분석 정확도 및 성능이 매우 많이 개선되었음.

HAM version 6.0

  1. HAM version 5.0에 비해 더 안정적이고 성능이 많이 좋아졌음

HAM version 5.0.0의 새로운 기능

  1. 자동 띄어쓰기 -- 띄어쓰기 오류 어절 처리 기능
  2. 복합명사 분해 오류 수정 기능 -- 복합명사 분해 사전

HAM version 4.80의 새로운 기능

  1. 유니코드 2.0 지원 가능
  2. 색인어 추출시 keyword 선별 기능
  3. 문서단위 입출력 기능 -- 어절/문장 단위뿐만 아니라

HAM version 4.70c의 새로운 기능

  1. 한글 맞춤법 검사 및 교정기 --> 나모 웹에디터 3.0에 포함된 한글 스펠러로서 "철수가학교에갔다", "국가소비자신용조합행정위원회", "이렇게붙여쓴문장도교정이됩니다"와 같이 띄어쓰기가 잘못된 오류의 교정기능이 매우 뛰어납니다.

  2. 색인어 추출시 문장 중간에 삽입되어 있는 붙여쓰기 오류어의 자동 색인 : 법률이나 규칙에서 관습적으로 붙여쓰기를 하고 있는 법령제목 "국가를당사자로하는계약에관한법률시행령중개정령"과 같이 문장 중간에 띄어쓰기를 하지 않은 어절이 포함된 경우에도 색인어를 추출합니다.

  3. 수사 어절 normalization --> "이백삼십오만원", "이백 삼십 오만원", "2백3십5만원", 235만원" 등 숫자와 한글, 띄어쓰기가 자유로운 숫자 관련 어절을 normal form으로 변환하는 기능이 추가되었습니다. "삼백사십오", "3백 4십 5" 등 수사를 숫자 "345"로 변환 기능

  4. Library interface의 단순화 --> 라이브러리를 응용 프로그램에 통합하는 방법을 매우 단순화시켜 쉽게 응용프로그램에 통합이 가능합니다.

HAM version 4.70c에 포함되어 있는 실행파일

  • 한국어 형태소 분석기 --- coran.exe
  • 한글 맞춤법 검사 및 교정기 --- kspell.exe
  • 정보검색을 위한 자동 색인 --- index.exe
  • 한글 복합명사 분해기 --- cnoun.exe
  • 한글 문장의 자동 띄어쓰기 --- space.exe
현재 Shareware 버전은 version 5.0.0이며, Shareware용은 실행파일과 라이브러리는 기능상의 제약이 있습니다. (한번에 분석되는 어절수 약 200어절로서 그 이후 어절들에 대해서는 모두 '분석성공'으로 간주합니다. 특히, 형태소 분석과 자동색인에서는 그 이후 어절들에 대해 random하게 어휘형태소를 영문자 string으로 변형시키고 있습니다) 파일 입출력을 하거나 한꺼번에 많은 문장을 분석할 경우에 뒷부분의 어절들에 대해서는 분석결과를 보장하지 않으니 유의하기 바랍니다. 또한, HAM은 2002년 12월까지만 실행할 수 있도록 되어 있습니다. HAM 실행파일 및 library에 포함되어 있는 기능들은 아래와 같습니다.

한국어 형태소 분석 라이브러리 HAM

Library License 또는 Source License 제공
  • 한국어 형태소 분석 기능
  • 정보검색 시스템을 위한 자동색인 기능
  • 한글 맞춤법 검사 및 교정 기능
  • 한국어 복합명사 분해 기능
  • 한글 문장의 자동 띄어쓰기 기능

HAM is an acronym of Hangul Analysis Module(or Model).

  • CORAN --- Korean morphological analyzer
  • INDEX --- Automatic extraction of nouns from Hangul text
  • KSPELL--- Korean spelling check
  • Hangul data --- Josa/Eomi table, Hangul title words, test data, etc
Features of HAM: Korean morphological analyzer(한국어 형태소 분석기의 특성)

Some reference sites of HAM(HAM is used at ...)

FAQ -- Frequently Asked Questions about HAM

Source or library licensing of Korean morphological analyzer HAM


E-mail: sskang AT cs.kookmin.ac.kr

599 view

4.0 stars