欧美极品第一页,一区二区三区四区高清视频,久草成色在线,在线观看网站免费入口在线观看国内

推廣 熱搜: ISO9001  音樂版權  知識產權貫標  CMMI  ISO20000  科技服務  質量管理體系  知識產權  測試標準  電池 

專利檢索中先布爾再語義還是先語義后布爾,這是一個問題

   日期:2025-05-07 03:20:20     來源:專利     專利領域原創(chuàng)作者:吳正明     瀏覽:10    評論:0
核心提示:原標題:先布爾再語義還是先語義后布爾,這是一個問題隨著專利數(shù)據庫的發(fā)展,數(shù)據量全已經是一個最基本的評判指標了,智能化的傻瓜型檢索方

原標題:先布爾再語義還是先語義后布爾,這是一個問題

隨著專利數(shù)據庫的發(fā)展,數(shù)據量全已經是一個最基本的評判指標了,智能化的傻瓜型檢索方式能夠幫助企業(yè)非專業(yè)的IPR經過短期培訓也能夠勝任普通的檢索要求;因此,為了使專利數(shù)據庫的使用更加人性化,語義檢索也成為各大專利數(shù)據庫宣傳的重點。本文對一件“基石”專利價值評估值38萬美金的專利進行檢索分析。

前段時間有分析師分析了國內數(shù)據庫的專利申請情況,同時根據專利被引用次數(shù),找出了一家數(shù)據庫被19次引用的專利,這件專利被認為是該數(shù)據庫的“基石”專利,引用這件美國專利申請的企業(yè)都是微軟、阿里巴巴、百度、LEXIS NEXIS等國內外互聯(lián)網巨頭,體現(xiàn)了這件專利在相關技術上的先進性。分析師指出,這件名為“Method and System for Re-ranking Search Results”的專利,背后是基于自然語義分析的新一代智能搜索技術,通過超大規(guī)模計算智能,能自動理解不同專利文獻中蘊含的各種主題。

帶著強烈的好奇心,筆者找出了這件專利,進行了分析。這件“基石”專利價值評估值38萬美金。

專利的優(yōu)先權是中國專利CN200810105725.1(對搜索結果重新排序的方法和系統(tǒng)),這件中國專利申請在授權時遇到一些波折,經歷了一次復審,也就是說審查員曾經做出過駁回決定。以下是最終授權版本的權利要求1.

權利要求1很簡單,也說明了保護范圍較大,創(chuàng)新比較原始,從保護內容來看,實質上是布爾檢索和語義檢索聯(lián)合使用時的一種應用場景。翻譯過來大概是:

1、計算機搜索用戶輸入的關鍵詞等布爾檢索式,獲得檢索結果;

2、計算機根據用戶輸入的語義檢索式(重排序表達式),對第一步的結果進行重新排序;

3、顯示排序后的所有檢索結果。

看來這件專利應該屬于自然語義分析的新一代智能搜索技術的應用專利,而與自然語義分析本身沒太大的關系,在說明書中也是引用了一些文獻,并且核心算法并未在說明書中直接公開,僅公開了一些顯性操作過程和執(zhí)行過程。

這件中國專利在授權的權利要求1中主要改變了兩個特征,一是增加了“其中重排序表達式與搜索表達式同時輸入”,二是刪除了對部分文檔進行排序和顯示部分文檔的技術方案(根據重排序表達式,對部分文檔進行重排序,以所述排序來顯示所述搜索結果中的部分文檔),只保留了對所有文檔進行排序并顯示所有文檔的技術方案。

同族的美國授權專利中也增加了“重排序表達式為搜索查詢附帶的文本字符串,在從數(shù)據源生成搜索結果時不進行任何操作”的限定。也就是說,語義排序對布爾搜索結果只作排序,不進行再次限定等會影響布爾檢索式搜索結果的操作。

這件專利保護的實際是先布爾限定后語義排序的檢索方式,這種技術可以“使得搜索結果不減少的情況下,與用戶的關注點相關的結果會顯示在結果的最前面。使得用戶能夠首先關注他特別最期望看到的結果,同時又可以完整地看到其它結果。而且,用戶可以對同一個搜索結果根據需要進行多個不同的排序,只要修改排序表達式即可。使用用戶個性化定制的重排序表達式可以很好的滿足用戶個性化的需求,提高了對搜索結果的瀏覽效率,能夠更快更準確地獲得需要的結果。”

這件專利申請日是2008年,當時國內數(shù)據庫方面還停留在關鍵字檢索方式上,基本未涉及語義檢索,所以該數(shù)據庫能提出這樣的檢索模式和檢索思路,同時被如此多的巨頭引用,也說明了這件專利在專利數(shù)據庫檢索上的技術貢獻和應用前景是比較可觀的,帶領了國內數(shù)據庫從布爾檢索轉向智能化檢索具有里程碑的意義。

隨著專利數(shù)據庫的發(fā)展,數(shù)據量全已經是一個最基本的評判指標了,智能化的傻瓜型檢索方式能夠幫助企業(yè)非專業(yè)的IPR經過短期培訓也能夠勝任普通的檢索要求;因此,為了使專利數(shù)據庫的使用更加人性化,語義檢索也成為各大專利數(shù)據庫宣傳的重點。經研究過后,筆者發(fā)現(xiàn)當前布爾與語義的配合存在兩種方式,一種是先布爾限定后語義排序的方式;第二種是先語義檢索出固定量的專利(例如2000條),再用布爾限定在其中繼續(xù)篩選,也就是先語義后布爾的方式。

以下是筆者基于國內兩大數(shù)據庫演示三種檢索模式。

一、先布爾后語義

1、數(shù)據庫1

先用布爾檢索,在全文中搜索具有“多旋翼 or 四軸 or 多軸”關鍵詞的專利,一共111335件。

1 (1)

添加語義排序條件“CN106494640B”對結果進行排序。

最終的表達式為R:(“CN106494640B”) AND (TACD_ALL:(多旋翼 or 四軸 or 多軸)),其中R:(“CN106494640B”)部分為語義排序表達式,(TACD_ALL:(多旋翼 or 四軸 or 多軸))部分為布爾限定表達式,結果仍是111335件專利,只不過排序方式發(fā)生了變化,專利CN106494640B的公開版本CN106494640A排在了第一個。與該數(shù)據庫在幫助中心的介紹相同。

在頂部輸入框可直接輸入語義排序表達式和布爾限定表達式,R:(“CN110641729A”) AND (TACD_ALL:(無人機)),檢索結果數(shù)量變成了123382件專利,專利CN110641729A自身排在了檢索結果第一個。

單獨使用布爾檢索式(TACD_ALL:(無人機))檢索,與布爾+語義的檢索結果相同,也是123382件專利,但檢索結果排序發(fā)生了變化。

2、數(shù)據庫2

數(shù)據庫2中可直接同時輸入布爾檢索和語義排序(超級排序)的內容進行檢索,在“標題、摘要、權利要求”中搜索具有“多旋翼 or 四軸 or 多軸”關鍵詞的專利,同時根據“CN106494640B”進行排序。

最終的表達式為R=(CN106494640B) AND (TIABC=(多旋翼 OR 四軸 OR 多軸)),其中R=(CN106494640B)部分為語義排序表達式,(TIABC=(多旋翼 OR 四軸 OR 多軸))部分為布爾限定表達式。檢索結果一共52999件,其中每件專利都標記了相關度百分比,專利CN106494640B的公開版本CN106494640A排在了第二個,相關度是63.27%。

刪除語義表達式,單獨使用布爾檢索式(TIABC=(多旋翼 OR 四軸 OR 多軸))檢索,與布爾+語義的檢索結果相同,也是52999件專利,但檢索結果排序發(fā)生了變化。

我們也嘗試了在頂部輸入框直接輸入語義排序表達式和布爾限定表達式,R=(CN106124517A) AND (TIABC=(無人機)),檢索結果發(fā)生了變化,檢索結果數(shù)量變成了75229件專利。

單獨使用布爾檢索式(TIABC=(無人機))檢索,與布爾+語義的檢索結果相同,也是75229件專利,但檢索結果中無相關度百分比,排序發(fā)生了變化。

二、先語義后布爾

在各數(shù)據庫獨立的語義檢索模塊中操作時,檢索模式并非先布爾后語義的模式,而是采用了相反的先語義后布爾的模式,具體來說,是先通過語義檢索先找出固定數(shù)量的相關專利(例如2000條),再使用布爾限定在已找出來的固定數(shù)量的專利中繼續(xù)篩選符合布爾檢索條件的專利,因此這種模式下,最終的檢索數(shù)量一定小于等于通過語義檢索篩選出的專利數(shù)量,同時也一定小于等于僅布爾檢索條件的檢索結果數(shù)量。

1、數(shù)據庫1

先在語義搜索中輸入語義搜索條件CN106494640B。

檢索結果中可得到1000條檢索結果,每個結果都有相關度百分比,并且是逐漸降低的,也就是說系統(tǒng)截取了最相關的1000個檢索結果,語義檢索表達式是一串加密的代碼。

在語義檢索基礎上,使用布爾檢索條件限定IPC分類號為B64F5/60.進行二次過濾。

過濾后檢索結果為75條,也就是原1000條相關專利中,有75件專利的IPC分類號為B64F5/60.

而單獨檢索IPC分類號為B64F5/60的專利為3588條,也就是說此種方式并不是先布爾限定后語義排序,而是先語義檢索出1000條專利,在1000條結果中,再限定IPC分類號為B64F5/60的專利,共75條。

2

數(shù)據庫2

先在語義搜索中輸入語義搜索條件CN106494640B。

檢索結果中可得到2000條檢索結果,每個結果都有相關度百分比,并且是逐漸降低的,也就是說系統(tǒng)截取了最相關的2000個檢索結果。

在語義檢索基礎上,使用布爾檢索條件限定IPC分類號為B64F5/60.進行二次過濾。

過濾后檢索結果為45條,也就是原2000條相關專利中,有45件專利的IPC分類號為B64F5/60.

而單獨檢索IPC分類號為B64F5/60的專利與數(shù)據庫1相同,也是3559條,也就是說此種方式并不是先布爾限定后語義排序,而是先語義檢索出2000條專利,在2000條結果中,再限定IPC分類號為B64F5/60的專利,共45條。

三、先布爾后語義+截斷

1、數(shù)據庫1

在數(shù)據庫1獨立的語義檢索模塊中操作時,界面下方還可以同時輸入一些布爾限定條件,看起來類似先布爾后語義的模式,但從檢索結果看,仍是1000條結果。

使用IPC分類號B64F5/60對結果進行二次限定,檢索結果仍是1000條,并且檢索結果排序未發(fā)生變化。也就是說原檢索結果中所有的專利都具有IPC分類號B64F5/60.這種模式應該是先布爾后語義,同時做了相應的截斷處理,未顯示完整所有的布爾檢索結果。

2、數(shù)據庫2

在數(shù)據庫2獨立的語義檢索模塊中同時輸入布爾限定條件,檢索結果也仍是2000條結果。

使用IPC分類號B64F5/60對結果進行二次限定,檢索結果仍是2000條,并且檢索結果排序未發(fā)生變化。也就是說與數(shù)據庫1一樣,原檢索結果中所有的專利都具有IPC分類號B64F5/60.這種模式應該也是先布爾后語義,同時做了相應的截斷處理,未顯示完整所有的布爾檢索結果。

四、小結

由此以上分析,當前語義+布爾的檢索模式一共三種,并且各主要數(shù)據庫都支持這三種模式。先布爾后語義的模式是先使用關鍵詞檢索等布爾條件檢索出一個專利集合,再使用語義排序對這個集合進行相關度排序,并且顯示專利集合中所有的專利;因此,檢索結果仍然是布爾檢索的結果,只是排序發(fā)生了改變;先語義后布爾的模式是先使用語義檢索以檢索出固定數(shù)量(一般為1000或2000)的專利,在這個范圍內,再使用布爾檢索條件進一步限定,檢索結果是兩者的交集,專利數(shù)量小于等于語義檢索條件以及布爾檢索條件;最后一種先布爾后語義+截斷的模式,則是在先布爾后語義的模式下,不顯示所有檢索結果,而是截斷至前1000個或2000個。

綜上,從上述檢索結果可以看出,目前國內數(shù)據庫巨頭基于上述三種方式檢索反饋的結果數(shù)據量是不相伯仲的,那有沒有相應公司能夠開發(fā)一套具有全新檢索方式和檢索思路的專利數(shù)據庫,咱們拭目以待。

中企檢測認證網提供iso體系認證機構查詢,檢驗檢測、認證認可、資質資格、計量校準、知識產權貫標一站式行業(yè)企業(yè)服務平臺。中企檢測認證網為檢測行業(yè)相關檢驗、檢測、認證、計量、校準機構,儀器設備、耗材、配件、試劑、標準品供應商,法規(guī)咨詢、標準服務、實驗室軟件提供商提供包括品牌宣傳、產品展示、技術交流、新品推薦等全方位推廣服務。這個問題就給大家解答到這里了,如還需要了解更多專業(yè)性問題可以撥打中企檢測認證網在線客服13550333441。為您提供全面檢測、認證、商標、專利、知識產權、版權法律法規(guī)知識資訊,包括商標注冊、食品檢測、第三方檢測機構、網絡信息技術檢測、環(huán)境檢測、管理體系認證服務體系認證、產品認證、版權登記專利申請知識產權、檢測法、認證標準等信息,中企檢測認證網為檢測認證商標專利從業(yè)者提供多種檢測、認證、知識產權、版權、商標、專利的轉讓代理查詢法律法規(guī),咨詢輔導等知識。

本文內容整合網站:百度百科、搜狗百科、360百科、知乎、市場監(jiān)督總局 、國家知識產權局

免責聲明:本文部分內容根據網絡信息整理,文章版權歸原作者所有。向原作者致敬!發(fā)布旨在積善利他,如涉及作品內容、版權和其它問題,請跟我們聯(lián)系刪除并致歉!

本文來源: http://www.rumin8raps.com/zs/202109/ccaa_27552.html

 
打賞
 
更多>同類專利知識
0相關評論

專利推薦服務
專利推薦圖文
專利推薦知識
專利點擊排行
ISO體系認證  |  關于我們  |  聯(lián)系方式  |  使用協(xié)議  |  版權隱私  |  網站地圖  |  排名推廣  |  廣告服務  |  積分換禮  |  網站留言  |  RSS訂閱  |  違規(guī)舉報  |  蜀ICP備07504973號
 
主站蜘蛛池模板: 江永县| 志丹县| 克拉玛依市| 洛川县| 滕州市| 乌兰察布市| 新营市| 宁阳县| 马山县| 松溪县| 恭城| 汝州市| 商河县| 昂仁县| 抚远县| 永寿县| 武宁县| 全南县| 普格县| 台山市| 米林县| 镇宁| 梅州市| 隆安县| 崇阳县| 龙泉市| 宽城| 定日县| 北流市| 墨玉县| 榕江县| 兰溪市| 宜宾市| 寿宁县| 鄢陵县| 浪卡子县| 策勒县| 涞水县| 虹口区| 乌拉特后旗| 洛宁县|