审查员的幸运模式与Patentics自动测试比对



    许多审查员表示,有20%到30%的案子,不需要任何检索策略,只需一个申请、公开号,就能在第一屏(前20篇)快速找到对比文件。审查员们称之为lucky模式(幸运模式)。这个lucky模式,其实和我们的数十万检索报告的自动测试结果相符。
  TOP-1 TOP-20 TOP-100 TOP-400
中国申请中文模型 9.0% 27.39% 43.73% 59.44%
中国申请英文模型 9.1% 27.76% 44.78% 61.16%
中国申请透镜模型(双模型-聚焦前) 9.1% 29.79% 47.15% 63.43%
    以SIPO递交的国际检索报告为自动测试比对的标准,我们有个程序能输入公开号和时间限制,
     r/cnxxxxxx and di/cnxxxxxx
    通过算法自动排序,获得最相关的400篇文献。然后,我们把自动排序结果与审查员在该申请的检索报告中给出的X文献号比对,如果排序在第一位与X文献相同,就在第一位统计加1,如果在第二位相同,就在第二位统计加1,一直到400项。如果没有在400项之内出现,就算没有命中。然后,我们对这些命中数据进行统计处理。
    其中,最重要的是被Patentics排在第一位的(TOP-1),如果不看其它文献,就看第一篇,9%的可能该文献就是审查员心目中的X文献。大家可以做个简单的统计试验,每次输入公开号排序,浏览第一篇,同时把是否X文献记下。做100个案子,一定有9篇左右是你认定的X文献。
    看第一篇,9%成功率显然不够。许多审查员往往浏览第一屏,即排序前20篇(TOP-20)。这就是大家说的luck模式。审查员反映的luck模式命中率(20%-30%,取25%)与我们自动测试的TOP-20完全相符。在对TOP-20进行统计时,我们将第1到第20篇的命中次数进行累加,最后除以全部测试篇数,得出27%左右的命中率。就是说,如果你浏览前20篇,就会有27%的概率找到X对比文件。
    如果再花点时间多看几篇,比如100篇。X文献的命中率TOP-100是44%左右。显然增加的命中率与投入的时间不成正比。多看80篇,命中率仅增加17%。至于再多看300篇,到400篇的命中率TOP-400增加更少,仅16%。
    这本身充分验证了Patentics语义排序的科学性。最相关的排在最前,排在最前的与审查员人工找出的X文献相符率最高。排序越到后,相关度越低,与审查员人工找出的X文献相符率越低。
    有了这个统计结果,大家就可以好好规划自己的检索过程。第一屏一定要看。做4个案子一定有一个已经排在里面了!
    而且,根据我们的自动测试,命中率几乎与IPC学科无关。最多是小于1%的上下浮动。
    上面的介绍,都是基于输入一个公开号,没有任何检索策略,当然没有任何漏检的可能,一步找到对比文件。为理想检索模式。许多审查员反应,在理想模式中找出的对比文件由于相关度高,不需要公知技术搭接,更容易结案。
    对于剩下的75%案子,许多审查员问,是不是可以做下去,一直到完成检索任务。我们的答案是肯定的。
    25%命中率的方案是不给Patentics任何帮助,在全部数据库(上千万篇)里“大海捞针”。如果给系统一点帮助,用一个简单的检索式圈定一个(大)范围。不是在上千万里面排序,而是在几百万、几十万、直至你认为合适的范围内排序(像上一节介绍的在5,925篇美国专利中排序),Patentics的智能排序精度就会提高数倍。
     r/cnxxxxxxand di/cnxxxxxx and b/abc
     r/cnxxxxxxand di/cnxxxxxx and icl/h04l
     r/cnxxxxxx and di/yyyymmdd and ...
    ...
    Patentics有全套(扩充)的布尔检索系统支持各类检索需求。你可以在任意检索式后面加上排序,可以是一个词,一句话,一段文字,一个公开号(对应的全文),把自己感兴趣的主题文献排到最前面。
    为了帮助审查员尽快找到合适的对比文件。我们下一个主攻方向有2个。一是要帮助大家快速浏览前n篇文献,尽快确定是否有对比文件在里面。刚刚上线的图文浏览界面www.patentics.com/scn.htm,就是我们的一个努力成果。二是通过新的算法自动比对多元技术要素,快速分析、发现可能的对比文件。
    对于审查员来说,应该尽量充分利用Patentics已经开发的资源。如对全球5000万中、英文全文的机器标引,在“索引”中按技术主题列出。对于中国申请,我们有近1000万中国申请的全文英文翻译,提供英文机器标引的“索引”词。对中国申请的中文版的主权项,我们进一步根据技术特征进行按主题的机器标引和聚类。当然,我们还发明了中英文检索透镜(CN201310274941.X),来进一步提高排序精度。大家可以阅读微信“Patentics搜索透镜(1)”,理解不同的颜色对应不同的检索透镜作用最终对应不同的命中率。
    这样,不需任何检索策略仅输入一个公开号或申请号,Patentics的检索精度,可以通过自动分析来统计、预测。大家可以多花点心思,记下luck模式下,Patentics找出的X文献,看看与我们上面的统计测试结果是否相符?