Search
Duplicate

조직(권리자, 출원인, 원고/청구인, 기업 등)

조직 데이터 지도

조직 데이터 이슈

조직 데이터 출처

PatentPia가 취급하는 조직은 i) 특허의 권리자(출원인, 현재 권리자, 직전 권리자 등), ii) 이벤트의 당사자, iii) 특허 대리인, iv) 논문 저자 등 사람의 소속 기관, v) 기업-금융-경제-산업 및 소셜/마켓/뉴스 데이터 상의 영리 법인, v) 대학/연구 기관 등이 있습니다.
이벤트 당사자에는 i) 소송의 원고/피고, ii) 심판 청구인/피청구인, iii) 특허 양도의 양수인/양도인, iv) 표준 특허의 선언자, v) FDA 승인의 신청/승인 주체, vi) 국가 R&D 참여자 등이 있습니다.

조직 데이터 정비의 필요성

조직 데이터가 정비되지 않으면, 검색에서뿐만 아니라, 집계나 분석에서 심각한 품질 저가가 발생합니다. 그리고, 2개 이상의 국가 간, 2개 이상의 언어 간 또는 2개 이상의 이종 데이터 간의 cross over를 위해서 조직 데이터 정비가 필수적입니다.

조직 식별 이슈(조직 표현 vs. 고유 ID)

특허 세계 내 vs. 특허 세계 밖에서의 기업/조직 식별

대한민국 기업 또는 조직의 경우에는 대한민국 특허청(KIPO)가 제공하는 ‘출원인 번호(특허청 부여) vs. 법인 등록 번호/사업자 번호(국가 부여)’간의 공식적 맵핑 데이터로 기업을 식별합니다. 이 때문에 맵핑의 정확도는 최상위 수준으로 높습니다. 이에 따라, 법인 등록 번호와 1:1로 매칭되는 특허 세계 밖의 다른 번호(예, 상장법인 코드)와도 맵핑 정확도는 아주 높을 수 밖에 없습니다.
하지만, 대한민국 특허청에 출원한 해외 기업(예, 애플) 등은, ‘출원인 번호(특허청 부여) vs. 법인 등록 번호(국가 부여)’ 맵핑이 없기 때문에, 출원인 코드만을 사용합니다. 이에 따라, 특허 세계 밖의 데이터와의 맵핑 정확도에는 한계가 있을 수밖에 없습니다.
다만, 국가의 특허청 단위로 부여되는 그 국가 내에서의 출원인 코드는 그 국가 내에서, ‘출원인 명칭 vs. 출원인 코드 vs. 특허’ 간의 맵핑에는 높은 신뢰도로 사용될 수 있습니다. 즉, 출원인 코드 체계를 운영하는 대한민국, 일본 등에서는 출원인 코드를 활용하여, 특허셋을 맵핑할 수 있습니다. 하지만, 미국, 중국, 유럽 등에서는 출원인 코드를 공개하지 않고 있어, 출원인 명칭으로 특허셋을 맵핑해야 하기 때문에, 정확도는 한국이나 일본보다 상대적으로 낮게 됩니다.

조직 명칭 대표화(출원인 대표명화 포함)

이름은 ‘조직 명칭’ + ‘조직 유형 표기’로 구분할 수 있습니다. 예를 들면, ‘Samsung Electronics co., ltd.’에서 ‘Samsung Electronics’는 조직 명칭이며, ‘co., ltd.’는 조직 유형 표기입니다. 조직 명칭 대표화는 이름 대표화입니다. 이름 대표화가 필요한 이유는 이름 표기에서는 오타, 띄어쓰기, 음차 표기, 일부 누락 등과 같은 조직 명칭에 대한 문제 뿐만 아니라, 조직 유형 표기에서의 약어(ltd.)/원래 표기(limited), 구두점 생략 또는 불필요한 구두점 추가 등이 있습니다.
이름 대표화에는 크게 i) 1개 국가내 조직 명칭 표기 대표화, ii) n개 국가 내에서 동일 언어 내 조직 명칭 표기 대표화, iii) 이종 언어 간 조직 명칭 표기 대표화가 있습니다.

(1개/n개 국가 내)동일 언어 내 조직 명칭 표기 대표화

실제 특허 데이터나, 이벤트 데이터에는 특정 조직에 대한 무수한 이형 표기가 존재합니다. 이형 표기의 발생 원인은 크게 i) 조직 형태에 대한 표기의 다양성, ii) 조직 명칭에 대한 오기 등이 있습니다. 조직 형태 표기 중에는 ‘co., ltd’, ‘co. ltd’, ‘co. ltd.’, ‘co. limited’…등과 같이 주식회사를 표현하는데 만도 수십 개의 표기가 난립되어 사용되고 있습니다. 한국에서도 ‘(주)’, ‘주식회사’가 혼재되어 사용되고 있습니다. 특히, 제1 언어에서의 조직 형태에 제2 언어에서의 음차 표기인 경우(예, 일본어에서 ‘주식회사’를 의미하는 ‘가이시키가부사, ‘가이쉬키가부샤’ 등등, 이형 표기는 무수히 많습니다.

이종 언어 간 조직 명칭 표기 대표화

특허 데이터는 국가마다 그 국가의 공식 언어로 발행됩니다. 이에 따라, 한국에서는 ‘삼성전자’로, 미국에서는 ‘Samsung Electronics’ 등으로, 일본에서는 ‘三星電子’, 중국에서는 ‘三星电子’로 표기됩니다. 이에 따라, ‘삼성전자’ = ‘Samsung Electronics’ = ‘三星電子’ = ‘三星电子’와 같은 맵핑 데이터를 생성해야 합니다.

조직 데이터 처리 프로세스

PatentPia의 노력

조직 명칭 정비 시스템 운영

PatentPia는 2008년 이래로, 자체적으로 조직 명칭 정비 시스템을 구축하여 운영해 오고 있습니다. 특허 데이터 내에서의 i) 국가 내 및 국가 간 정비, ii) 언어 간 정비뿐만 아니라, 특허와 비특허(예, 증권 시장) 데이터 간 정비도 지속적으로 수행하고 있습니다.