检索作为评价专利新创性最关键的环节之一,对于专利稳定性、可靠性评价具有重要指导意义,对于申请前的撰写工作,甚至实验规划等都具有重要的调整和规范作用。
如果从评价专利稳定性、可靠性的目的来看检索,检索结果将直接影响到对于特定专利是否符合专利法规定,是否能够持续的维持专利权不被无效或撤销专利权。各个领域的专利检索策略会因为相关技术领域的发展状态,文献/专利等资料公开方式/方法等多种因素,需要采用不同的检索策略来获得最接近的现有技术。
检索中最常用的两个检索入口是:分类号和关键词。在不同的技术领域检索工作中,采用不同的侧重点,对于检索速度和检索结果的准确性具有重大影响。
分类号
中国专利使用的分类号系统是IPC分类号系统,英文全称为International Patent Classification,也叫《国际专利分类表》。IPC分类是根据1971年签订的《国际专利分类斯特拉斯堡协定》编制的,唯一国际通用的专利文献分类和检索工具。
根据专利申请的时间不同,国知局采用不同版本的IPC分类号对各个专利进行技术领域划分。新版本的IPC分类号会将一些专利数量较多的领域进行细分,以确保单个分类号下的专利数量不会过多,以提高基于分类号对于专利划分的有效性。
除了IPC分类号以外,还有欧洲专利分类(ECLA)、美国专利分类(USPC)、日本专利分类(FI/F-Term)、联合专利分类(CPC)等分类号体系。
在检索过程中,如果对于检索对象所处的技术领域比较熟悉,可以采用特定的分类号进行检索,大幅度提高检索的效率。这要求检索人员对于各种分类号有极高的熟悉度、敏感度,通常只有资深的审查员或长期关注特定领域的技术专家才能快速的达成分类号快速高效应用。当然,一般的检索过程中并不要求极快的速度完成检索,检索者可以一边检索一边学习相关技术领域的分类情况,进而找到适宜的分类号。对于IPC分类号以外的其他分类号,通常属于锦上添花或精密制导的检索方式,如果不熟悉的话不建议使用。
横向联系
有一些技术主题会和其他技术主题发生交叉,需要进行横向联系的拓展。同一个技术主题同时涉及多个技术领域,或者发明点在其他主题之下,然后方案总体又交叉落入当前主题领域中。对于横向联系的IPC分类号,可以在前期检索不理想的情况下开展拓展工作,通过快速浏览阅读检索到的专利,比较分类号的交叉情况,找出横向联系的分类号。或者通过IPC分类号介绍到网站进行查询,例如国知局提供的IPC分类号查询系统。
特别是当IPC分类号发生调整的时候,常常会出现IPC分类号的变化调整,及时跟进检索结果中的专利分类号变化,可以快速做到横向联系拓展。如果是交叉学科的技术发展中,各个主题之间建立新的关联,还可以借助互联网信息情报调研的方法,利用互联网高度发达自媒体对于交叉创新情况的报道,快速发掘热点领域交叉学科的横向联系。
关键词
在技术情报调研过程中,除了专利以外的其他文献大多没有专门的分类号可供查询,相应的关键词检索就更加重要的。对于关键词的选择,一般有以下几个原则:忠实表达、同物异名、充分拓展、准确完整。
对于生物医药领域的常常会面临很多困难,包括:
关键词的确定困难
检索过程中常常会遇到核心发明点难以用简单关键词来描述的问题,如果无法提取到正确的表达发明点的关键词,那么检索结果往往无法命中目标。
同物异名
现有的主流的数据库大都是采用传统的信息标引方式进行加工的,同物异名的情况广泛存在。尤其是一些新科学发现提出的技术点,不同的人可能会采用完全不同的描述方式,进行在数据库收录的时候标引成了不同的关键词。这种同物异名的情况,可能是同一个结构/元件/组织被先后命名成了两个不同的学名,例如中国大陆和中国台湾地区对于Si的命名,前者翻译成“硅”,而后者翻译成“矽”。
词汇孤岛
由于技术人员和检索者在书写和阅读资料的时候,大脑中对于信息的处理是黑匣子状态,难以完全一致,导致表达出来和阅读吸收到的信息容易出现遗漏或缺失。特别是大脑关于不同概念之间的联系,更是容易被忽视,进而在数据库收录索引的时候,无法将多个概念之间的特定联系标引到。
这和《审查指南》最新修订中关于“三步法”中技术问题确定的部分,增加了关于多个技术特征相互配合实现特定技术效果的关注,明确技术问题确定过程中不得将方案破坏性的拆分开来看待,其实也是对于这种难以直接呈现在技术结构/元件/部件等具体特征上的发明点的确认。
词汇孤岛是检索中的难点,由于数据库索引的特点,这种两个概念或多个概念之间的联系很难表示或描述,因此,在检索过程中一定要注意从其他侧面补齐这一部分的检索命中。
确定检索词
为了达到尽可能准确的检索结果,需要从多个维度优化关键词,包括:
- 意义上的准确和完整。对于关键词进行拓展,找出同义词、近义词、上下位概念、等同特征等,以及反义词,反义词由于和原关键词直接对立,常常被用于否定句式当中,目标文献中否定句式的出现反义词,并被数据库收录的可能性非常高。
- 形式上准确和完备。充分考虑外语中不同表达,英美不同拼写形式,不同词语形态,单复数形态等。
- 角度上的准确和完整。确定检索词的过程中,最直接的方式是把技术方案拆解开来,获得多个关键词。除了技术方案分解得到的关键词外,还有技术效果、具体功能作用、使用场景等角度可以作为检索关键词的确定维度。
基于上述的这些关键词确定规则,结合给定的技术方案进行分解展开是最后的落地程序,只有想明白如何进行分解展开,进而把方案的各个环境充分落实,才能选择出最恰当的检索词。
检索式
确定好分类号和关键词以后,就可以进行检索式的拟定了。当然,根据检索目标不同,检索式的调整过程中可以是从小到大,也可以是从大到小。
从小到大逐步调整检索式,可以在检索过程中不断修正检索式,根据检索过程中阅读到的文献情况,增加拓展分类号和关键词,更好的保证检全率。
从大到小的检索方式,则相反,注重于精确检索最接近预想目标的文献。检索过程中,并不要求直接拓展写出最大的范围的检索式,而是根据待检方案的阅读理解,选择分类号和关键字快速输入数据库,查看命中情况。然后根据命中情况逐渐调整检索式,一步一步的逼近待检方案的最接近现有技术。
数据库
分类号、关键词和检索式都是检索者主动操作控制的因素,也是为技术人员所公知的情况,根据检索需要多次尝试总可以不断优化检索结果,但经过优化最终能够达到最大高度是什么样,还取决于数据库收录、标引情况。
国知局的审查员使用的检索系统是S系统,可以选择的数据库包括CNABS、CNTXT、ENTXT、WOTXT、JPTXT、USTXT、CPRSABS、DWPI、SIPOABS、Patentics、VEN、STN、ScienceDirect、SpringLink、Wiley、PubMed、EMBASE、ISI Web of Knowledge、Google Scholar、CNKI、读秀、万方、维普等一系列的数据库。
一般的专利代理机构通常只会购入少数几个商业数据库,然后由商业数据库提供端口,检索商业数据库公司采购或自研的数据库资料。申请人则因为接触情报调研的频次更低,往往不会单独购买数据库,更多是利用互联网免费的检索系统进行粗略的查新。
虽然,各个数据库差距较大,但最终面对的专利文献资料是相同的,理论上采用任何一个数据库,只要收录了相应的资料,都可以检索得到。但实际检索过程中,如果对于数据库的性格理解不到位,那么选择的关键词或分类号可能就没有被数据库收录或标引到,进而导致无法检索到目标文献资料。
所以,在分类号和关键词的选择都已经充分优化的情况下,进行数据库筛选购买也是非常重要的。结合待检索技术所处领域和行业发展态势,找到对于检索目标收录最全,标引最好的商用数据库对于达到目标检索结果将会成为命中目标的最关键的一个跳板。对于数据库的选择可以借鉴情报分析专家的建议,也可以咨询同行业的专家,看看本领域技术人员都使用哪些数据库,哪些数据库的口碑较好。
最后,借助外部数据库是比较高效省力的,但如果只是针对某个特定的领域做深度调研分析,还可以选择自建数据库。近年来私人计算机性能快速增长,民用高端PC性能已经不输10年前的工作站性能,完全可以通过采购高端PC进行自建数据库检索分析。简单来说只需要两个步骤,首先找到收录最为齐全的数据库,对目标检索范围的文献导出,收集得到自建数据库的原始数据。然后对收集到的原始数据进行深度标引处理,建立属于自己的私人数据库。这样可以不受限制的对数据库进行深度加工,实现一般商业数据库所无法实现的功能。