Search
Duplicate

키워드 식별

키워드 식별 데이터 지도

키워드 추출 대상

PatentPia에서 키워드 추출 대상은 i) 오리지널 텍스트, ii) OCR을 통해 인지되는 텍스트입니다. 텍스트 소스에는 i) 특허, 논문, 웹소스 및 ii) 이미지 소스 등이 있습니다.

특허 키워드 추출 위치

PatentPia는 특허 명세서를 구성하는 각 부분에서 키워드를 추출합니다. 대표적인 곳으로는 i) 발명의 명칭 + 초록 + 특허 청구 범위, ii) 기술 분야 + 배경 기술 + (요약), iii) 실시예 + 발명의 설명, iv) 특허 도면 등이 있습니다. ‘발명의 명칭 + 초록 + 특허 청구 범위’에서 키워드를 추출하는 것이 가장 기본적인 키워드 추출 트랙입니다.

키워드 중요도 계산

키워드별로 추출된 위치, 출현 빈도 등을 계량하여 가중치를 부여합니다. 발명의 명칭이 가장 가중치가 높습니다.

키워드 인지

키워드처럼 보이지만 키워드가 아닌 표현 또는 키워드로서 가치가 없는 표현이 많습니다. 그리고, 너무 길이가 긴(단어수가 많은) 표현은 키워드로 취급하기 어렵습니다.

키워드 동일성 식별

표현 자체는 다르더라도 동일한 키워드로 인식해야 하는 다양한 경우가 있습니다. 대표적인 경우가 i) 영국식 영어 vs. 미국식 영어, ii) 동의어, iii) 대등 구조(A of B = BA), i) 약어, 숫자, 특수 기호(하이펀 등) 등이 있습니다.

키워드 데이터 처리 프로세스

PatentPia에서의 키워드 데이터 활용

PatentPia는 i) PatentPia GoldenCompass, ii) PatentPia Search, , iii) PatentPia My platform, iv) PatentPia Analytics, v) PatentPia Dashboard 등 PatentPia의 모든 영역에서 키워드를 활용하는 서비스를 제공하고 있습니다.

GoldenCompass 분석 서비스

PatentPia GoldenCompass의 키워드 서비스는 [Link]를 참조하세요.