보유기술정보 | |
---|---|
출원번호 / 일자 | 1020060039860 (2006-05-03) |
등록번호 / 일자 | 1008420800000 (2008-06-23) |
발명자 | 중앙대학교 산학협력단 |
기술명 | 문서의 그룹별 분류방법 |
요약 | 본 발명은 텍스트를 포함한 문서를 텍스트를 기준으로 하여 문서들 간의 유사성 및 연관성에 따라 분류하고, 이렇게 분류된 문서들을 그룹화한 후 새로운 문서를 상기 그룹에 따라 분류하는 방법에 관한 것으로, 텍스트를 포함하는 문서에서 지정 단어의 출현횟수에 따라 다수의 상기 문서들을 그룹으로 나누어 분류하는 단계; 일 그룹으로 분류된 문서들의 위치를 확인하여, 그룹별로 상기 문서들의 위치에 대한 제1중점을 찾는 단계; 상기 제1중점을 중심으로 소정의 반경 내에 있는 문서만을 확인하는 단계; 상기 반경 내 문서들의 위치에 대한 제2중점을 찾는 단계; 및, 새로운 문서의 상기 지정 단어의 출현횟수에 따라 위치를 확인하여, 상기 제2중점과 근접한 그룹으로 포함시켜 분류하는 단계를 포함하는 것이다. |
서울캠퍼스 : 06974 서울특별시 동작구 흑석로 84
다빈치캠퍼스 : 17546 경기도 안성시 대덕면 서동대로 4726