最近專利數據庫圈出了一個大瓜,Patentics核心專利被人提無效了,結果維持專利權有效。然后就有文章《一個無效宣告拳打過去,卻發現是“核彈級”專利》說Patentics“手里真的有一顆核彈,絕對能把整個專利數據界都‘核平’了”,甚至說連“國知局內部的系統恐怕也在‘如來佛的手掌中’”。那么我們今天也來分析一下這件“核彈”專利,看看是否威力確實有那么大!
根據Patentics的說法,未被無效掉的核心專利保護的是“B and R(布爾檢索表達式和語義檢索表達式)”的技術,如果真是這樣的話,那么當前幾乎所有使用語義排序的檢索系統都會侵權,不僅是商用專利檢索工具,甚至包括百度、谷歌等可以對檢索結果作排序的系統都存在侵權風險。
所以,技術的分析必然沒有那么簡單,根據前文《專利檢索中先布爾再語義還是先語義后布爾,這是一個問題》分析,CN200810105725.1(對搜索結果重新排序的方法和系統),在授權時經歷了一次復審,最終授權版本的權利要求1如下:
了解Patentics的應該對以下“B and R(布爾檢索表達式和語義檢索表達式)”檢索式很熟悉:
B/手機 AND R/屏幕
其中“B/手機”就是一種布爾檢索表達式(權利要求中的搜索表達式),“R/屏幕”就是語義檢索表達式(權利要求中的重排序表達式)。根據步驟一先用“B/手機”檢索出一批專利,然后根據步驟二對步驟一檢索出來的專利按與“屏幕”意思的相關性進行重新排序,然后按步驟三顯示排序后的所有專利。
后審過程中的權利要求修改對這件專利的保護范圍起到了非常大的限制作用,授權的權利要求1中主要改變了兩個特征,一是增加了“其中重排序表達式與搜索表達式同時輸入”,二是刪除了對部分文檔進行排序和顯示部分文檔的技術方案(根據重排序表達式,對部分文檔進行重排序,以所述排序來顯示所述搜索結果中的部分文檔),只保留了對所有文檔進行排序并顯示所有文檔的技術方案。
復審時,Patentics對修改也作了具體的說明,將發明點明確在了顯示全部搜索結果,不對搜索結果進行取舍,從而實現在搜索結果不變少的情況下,讓用戶看到他期望優先看到的內容。
也就是說,其他系統如果也想使用“B and R(布爾檢索表達式和語義檢索表達式)”,只要不是同時輸入布爾檢索表達式和語義檢索表達式或者檢索結果不顯示所有文檔就可以避免侵權。因此也就有了很多數據庫采用的先布爾后語義和先語義后布爾的檢索模式,以及只顯示前N個語義檢索結果而不顯示完整語義檢索結果的設置。
從這個角度來看,Patentics這件專利嚴格意義上不能說是“B and R(布爾檢索表達式和語義檢索表達式)”的原創專利或基石專利,只能說是同時輸入“B and R”并且顯示所有檢索結果,這一專門針對具有查全要求的專利檢索使用場景的應用專利,技術創新談不上,更像是將專利審查員給Patentics提出的一個使用需求去申請了專利。
回到正題,無效雖然沒有成功,但無效決定中的證據1卻比復審的對比文件更近了一步。
可見證據1公開的查詢示例中,包括了布爾查詢和重排序內容,并且先根據布爾查詢獲得文檔子集,再通過計算子文檔集中的文檔與重排序內容的余弦距離來生成結果的排序列表。結果示例中,每個結果有一個得分,也就是語義檢索結果給的相關度。與Patentics這不是一樣的嗎?
在文章《一個無效宣告拳打過去,卻發現是“核彈級”專利》中寫道:“非常客觀的講,這是當前所有檢索系統里最好的表達方式,因為首先其沒有損失布爾的信息,其次它給了檢索者在閱讀檢索結果時非常大的幫助,即檢索者此時可以用上算法賦予的加成,在概率上極大的減少自己額外閱讀不相關文獻的數量,更加多快好省地獲得自己想要的結果。單純就Patentics這個功能上而言,對比目前業內的其他廠商,應該說有相似,但是能做到這個解決方案的還是少,絕大部分廠商的解決方案是基于一個語義/智能檢索推送的有限集合,比如500篇,800篇,然后在這個有限集合內進行二次布爾干預。這樣在實際檢索結果上大打折扣了。”這件專利顯然不是先做了語義檢索然后再用布爾做限定,而是先做了布爾檢索然后用語義排序。
看看無效決定,認為證據1“表示其顯示需求的重排序內容并不是以重排序表達式的方式與搜索表達式同時輸入,進而實現搜索與顯示的”,與復審決定不一樣的是,區別特征中不再提“顯示全部結果”,區別特征為:“重排序表達式包括重排序內容,其中重排序表達式與搜索表達式同時輸入”,實際解決的技術問題中仍有“顯示全部結果”的內容:“在搜索結果不減少的情況下,如何提高用戶對搜索結果的瀏覽效率,使用戶能夠更快更準確地獲得需要的信息”。
由此看來,似乎“同時輸入”是最大的發明點,那么對其他數據商來說,既然證據1已經公開了先做布爾檢索然后用語義排序的方案,那只要避免“同時輸入”這個形式上的問題,就可以做現有技術抗辯,不涉及侵權。
但放到證據1中,“同時輸入”好像僅僅只是輸入方式形式上的區別,而計算機實質上的運行步驟和結果并沒有區別。同時,從證據1公開信息來看,其將“我是一名c ++程序員,在面向對象的分析和設計方面經驗豐富,正在尋求高級開發職位”,要求的條件為“ oop”,字段的要求為“ Salary> $ 60.000”作為一個查詢(Query),應該不難認定“重排序表達式包括重排序內容”和“同時輸入”,因為將一個查詢分步驟兩次輸入,確實沒有比“同時輸入”符合常理。
證據1查詢內容原文
而證據1在第22欄第22行附近也公開了:查詢由兩個不同的部分組成:布爾查詢和匹配的偽文檔向量(也就是重排序內容)。
對于“顯示全部結果”,證據1里公布了:首先布爾查詢返回符合條件的文檔子集,接下來,通過計算偽文檔之間的余弦距離來生成結果的排序列表。無效決定里也認定了是返回所有文檔。
有意思的是,兩件專利除了使用的搜索步驟非常相似以外,連文中使用的語義算法都一樣是潛在語義索引(LSI),都是將專利通過LSI轉化為向量后計算向量的余弦距離,生成排序結果。甚至連說明書附圖也極其相似。
Patentics專利附圖
無效決定對比文件1專利附圖
正如文章《一個無效宣告拳打過去,卻發現是“核彈級”專利》所說,“2008年5月4日的申請日。要知道iPhone是2007年發布的,微信是2011年上線的,這篇專利的申請日與這些我們熟悉的日常內容一樣,即熟悉到你感覺用了它一輩子,其實在科技層面上它們都是‘上古時代’了!”但不同國家不同技術的發展時代并不相同,對中國來說是‘上古時代’的技術,對于美國可能并不是。
如果對證據1在美國專利庫中進行語義檢索或關鍵詞搜索“Boolean and semantic”(布爾 and 語義),可以發現同期美國有非常多將潛在語義索引應用在信息搜索中的專利,類似的原理解釋也都如出一轍,還有對其的不同改進。有意思的是,證據1的延續案,2009.01.27公開的US7483892B1.更是把證據1中的這類搜索方法用到了專利搜索中,寫進了權利要求19.
Patentics的老板是美籍華人,從年齡看,是國內第一批計算機程序員,當時有能力去美國發展肯定是最優的選擇,能最先接觸到硅谷最先進的算法也是很正常的事情,而Patentics在國內興起的時候,國內的計算機軟件和算法發展還非常落后,隨便帶一個技術來中國發展都大有可為。
從證據1及其同一時期的相關專利來看,語義檢索在當時的美國已經是非常通用的技術,Patentics這件專利更像是專門針對具有查全要求的專利檢索使用場景的應用專利。算法上都是傳統的潛在語義索引,與其他美國專利如出一轍。復審時將這件專利保護的布爾+語義的應用,限定到了僅保護同時輸入兩種指令,并且輸出所有檢索結果的范圍;本次無效決定中又認定了證據1也可以實現“返回所有檢索結果”,而“同時輸入”的認定也存在一定的裁定空間,并且僅僅“同時輸入”這一特征能不能支撐發明中和無效決定中所說的“搜索結果不減少的情況下,提高用戶對搜索結果的瀏覽效率,使用戶能夠更快更準確地獲得需要的信息”這一技術效果,撐起發明專利創造性的高度。
雖然這次無效沒有成功,但從證據看來也只是暫時沒被無效掉,同時復審和無效也明確了許多侵權的必備要件,判定侵權也不是那么容易的,是不是“商機”由大家自己去判斷。但在該專利仍然處于有效的情況下,國內各家專利數據庫最好在實現“B and R(布爾檢索表達式和語義檢索表達式)”時,盡量避免“布爾檢索表達式和語義檢索表達式同時輸入”和“返回所有檢索結果”兩個特征,實際檢索效果也不會有太大區別。除此之外,就只能看請求人對此專利會不會有進一步的請求了。
中企檢測認證網提供iso體系認證機構查詢,檢驗檢測、認證認可、資質資格、計量校準、知識產權貫標一站式行業企業服務平臺。中企檢測認證網為檢測行業相關檢驗、檢測、認證、計量、校準機構,儀器設備、耗材、配件、試劑、標準品供應商,法規咨詢、標準服務、實驗室軟件提供商提供包括品牌宣傳、產品展示、技術交流、新品推薦等全方位推廣服務。這個問題就給大家解答到這里了,如還需要了解更多專業性問題可以撥打中企檢測認證網在線客服13550333441。為您提供全面檢測、認證、商標、專利、知識產權、版權法律法規知識資訊,包括商標注冊、食品檢測、第三方檢測機構、網絡信息技術檢測、環境檢測、管理體系認證、服務體系認證、產品認證、版權登記、專利申請、知識產權、檢測法、認證標準等信息,中企檢測認證網為檢測認證商標專利從業者提供多種檢測、認證、知識產權、版權、商標、專利的轉讓代理查詢法律法規,咨詢輔導等知識。
本文內容整合網站:中國政府網、百度百科、最高人民法院、知乎、國家認證認可監督管理委員會、國家知識產權局、市場監督總局
免責聲明:本文部分內容根據網絡信息整理,文章版權歸原作者所有。向原作者致敬!發布旨在積善利他,如涉及作品內容、版權和其它問題,請跟我們聯系刪除并致歉!