2023年1月,國家知識產權局推出全新專利業務辦理系統,以更優化的設計、更智能的功能、更簡化的流程,為專利申請、PCT國際專利申請、外觀設計國際申請等業務提供高效便捷的“一站式”辦理平臺。
圖片來源:專利業務辦理系統
https://cponline.cnipa.gov.cn/
其中,從專利業務辦理系統的“專利審查信息查詢模塊”可以進入“專利檢索及分析系統”。新版專利檢索及分析系統實現了對原公眾檢索系統功能和數據的全面覆蓋和升級,進一步擴充了專利數據資源,優化了檢索應用功能,豐富了專利分析模型,有利于提升社會公眾專利檢索分析便利化水平。
下面我們將以ChatGPT相關專利檢索為例,對新版專利檢索及分析系統的功能和數據進行實測。
>>> PART 1
OpenAI相關專利
2023年伊始,由美國人工智能研究實驗室OpenAI研發的人工智能聊天機器人程序ChatGPT火爆全球。3月14日晚,OpenAI正式推出ChatGPT4.0版本,并宣布已經與多家企業合作,再度引發市場熱議。
據資料[1]顯示,OpenAI目前擁有一項已頒發的美國專利11521611(公告號US11521611B2.以下簡稱D1)和一項已公開的美國專利申請17/152338(公開號US2022229999A1.以下簡稱D2)。雖然這兩篇專利文獻顯示的申請人均為Palo Alto Research Center(PARC),并非OpenAI,但在調查其中的一個發明人Jesse Vig后,筆者發現:在PARC公司網站上存在幾篇關于他與OpenAI合作的文章,表明他曾經把自己發明的一些技術運用于OpenAI的GPT相關研發。可以推測,資料中顯示的兩件美國專利文獻與OpenAI相關是具有非常大可能性的。
?
D1
USING ConVERSATION STRUCTURE AND ConTENT TO ANSWER QUESTIONS IN MULTI-PART onLINE INTERACTIONS
使用會話結構和內容來對多方在線交互中問題進行回答
D1涉及用于確定對多方對話中問題的答案的計算機實現的方法,即在人們通過計算機進行多方會話時,接收這些具有多個節點的多方會話;將每個節點解析為多個元素;識別出其中包含問題的元素;構建會話節點列表,標識出各個節點之間的關系;然后基于會話節點列表產生出對所述問題的至少一個答案。
?
D2
SERVICE PLATFORM FOR GENERATING CONTEXTUAL, STYLE-ConTROLLED RESPonSE SUGGESTIONS FOR AN INCOMING MESSAGE
針對傳入消息生成適應上下文且風格受控的回復建議的服務平臺
D2涉及一種自動生成對傳入的自然語言通信的建議響應的裝置,所述裝置包括分類器、生成式自然語言模型和至少一個處理器。所述分類器已經被訓練來預測由自然語言通信表現出的一個或多個風格屬性,所述生成式自然語言模型已經被訓練來生成對自然語言通信的響應,所述至少一個處理器執行來自至少一個存儲器的計算機程序代碼,使所述裝置能接收傳入的自然語言通信,并借助經訓練的分類器確定傳入的自然語言通信的不同語言風格,然后根據經訓練的生成式語言模型來生成對應的語言風格。
下面我們就參考這兩篇專利文獻,利用國家知識產權局新版“專利檢索及分析系統”來檢索和分析ChatGPT相關專利。
>>> PART 2
專利檢索
1、主觀關鍵詞 vs 核心關鍵詞
眾所周知,在知道專利申請號或公開號的前提下進行檢索是最簡單的。例如,直接通過常規檢索,輸入“US11521611B2”,便可找到該專利文獻。
可是,通常我們進行專利檢索前是不知道專利號或專利申請號的,往往需要利用關鍵詞檢索來找出目標信息。一般情況下,很多人在檢索時習慣用主觀的關鍵詞進行檢索,但這對于專利檢索來說很容易出現檢索結果噪聲大的情況,如無關數據多、整體關聯度不高等。因此,為了全面解析專利技術方案,需要總結技術方案的創新點——客觀分析并提取重點檢索要素——確定核心關鍵詞。
例如,對于D2.我們首先從摘要的“一種自動生成對傳入的自然語言通信的建議響應的裝置”中,主觀提取出“Automatically generate(自動生成)、Natural language(自然語言)”等關鍵詞;然后我們點擊“詳覽”進入該專利的顯示界面。如圖1所示,我們先點擊全文文本進入專利的權利要求和說明書,然后點擊文本左上角“高亮”輸入關鍵詞,再點擊“高密”查看這些詞的出現頻率來確認這些主觀的關鍵詞的重要性,進而確定該專利的核心關鍵詞。
圖1
接下來我們通過高級檢索,輸入已確定的核心關鍵詞,進行進一步檢索。(如圖2所示)
步驟1:在摘要位置輸入關鍵詞“automatically generate”;
步驟2:點擊前面的“摘要”,該關鍵字會被放到編輯區中;
步驟3:使用連接符“OR”(具體根據需求使用不同連接符)帶上所有關鍵詞;
步驟4:再重復步驟1至步驟3.直到把所有關鍵詞都添加進檢索式;
步驟5:點擊最下面的檢索,進行相關信息檢索。
圖2
Tips:
若檢索的關鍵詞含空格時,則需要用引號把該關鍵詞括起來,如“natural language”不加引號則系統將按natural OR language進行檢索;
檢索式中同級算符必須一致,同時需要用括號來區分不同級別,以表示括號內的組合優先運算。
點擊檢索后,系統一共檢索出了7344條相關數據。切換成列表快速瀏覽標題后,能看到雖然其中確實包含與ChatGPT相關的文獻,但也存在較多其他領域的文獻。而且,筆者從以上關鍵詞檢索結果中,并沒有發現D1.可見,關鍵詞檢索仍然具有局限性,這是由于專利文獻中的術語存在語言種類和表達方式的不同,有時難以準確表達技術手段以及難以區分技術領域。因此,我們可以考慮利用分類號進行檢索。
2、IPC分類號檢索 vs CPC分類號檢索
眾所周知,國際專利分類號(IPC)是根據1971年簽訂的《國際專利分類斯特拉斯堡協定》編制的,由世界知識產權局(WIPO)負責維護。而聯合專利分類(Cooperative Patent Classification,簡稱CPC)是歐洲專利局(EPO)和美國專利商標局(USPTO)聯合開發的專利分類系統,于2013年1月1日正式啟用。例如,專利文獻扉頁上的著錄項目代碼58就表示CPC分類號。
CPC體系為實現與IPC的兼容,大體上沿用了IPC的分類規則。而且CPC在IPC的基礎上,對原有IPC條目涉及的技術主題進行了再細分,同時條目中也增加了許多 IPC中沒有提及的新技術所涉及的技術主題,所以CPC較 IPC而言,能夠更精準地表達發明構思。選擇正確的CPC分類號進行專利文獻的檢索,常常可以達到事半功倍的效果。
筆者通過分析D1和D2發現,兩篇文獻的CPC分類號都包括G06F40/56(自然語言生成)。ChatGPT是AIGC(AI Generated Content)的一種應用,GPT是“GenerativePre-trained Transformer”的縮寫,意思是“生成式預訓練變換模型”。因此,可以認為G06F40/56(自然語言生成)是ChatGPT相關專利的對應分類號。
于是筆者通過檢索式“CPC分類號=(G06F40/56)”進行檢索,結果獲取到3168條相關文獻。而利用“IPC分類號=(G06F40/56)”的方式進行檢索,只能找到1166條相關文獻,存在較多漏檢。通過對比這兩種檢索式得到的文獻標題,筆者發現根據CPC分類號檢索出的文獻大多都更接近于檢索目標。
>>> PART 3
專利分析
對于利用CPC分類號檢索到的3168條相關專利文獻,筆者通過點擊加入分析庫將其放進所創建的分析庫中(如圖3所示):
圖3
如果是首次加入分析庫,則需要創建一個新的分析庫。創建完畢后,可繼續尋找相關文獻并進行勾選,然后點分析庫,找到自己創建的分析庫,點擊追加到分析庫中(如圖4所示):
圖4
當分析庫構建完成后,檢索者便能對分析庫中的文獻進行分析。
可通過以下方式進入分析界面:
直接點擊分析庫中“進入分析”;
或在瀏覽界面最上方,點擊“分析”,在彈出對應的下拉菜單中選擇不同的分析方式進入分析。
在分析界面中,檢索者可以通過左邊的菜單欄選擇更有針對性的分析類型,并通過選擇不同圖表形式來進行分析(如圖5所示):
圖5
1、申請人分析
例如,檢索者可以點擊申請人分析中的“申請人趨勢分析”,然后選擇折線圖。從圖6可以看出,IBM(最上面的藍色折線)的相關專利數量領先于其他公司。眾所周知,從20世紀50年代開始,IBM就一直是人工智能領域的先驅者,它一直專注于人工智能領域,其中超級電腦”沃森(watson)”是最知名的AI項目之一。“沃森”存儲了海量的數據,可以學習語言和人類知識,而且擁有一套邏輯推理程序,可以推理出它認為最正確的答案。所以,IBM在該領域專利數量遙遙領先是不足為奇的。
圖6
Tips:
有的折線往往并不是檢索者關注的重點,可以選擇把它隱藏。
如圖6原本的分析圖會有一條明顯高于其他特定申請人的折線,該折線對應的是“其它”圖例,表示申請數量居后的多個申請人的集合。為了方便觀察申請數量居前的特定申請人圖例,檢索者可以設置隱藏這個“其它”圖例。
進一步點擊表格,檢索者就能通過數據了解到具體的申請人專利數量。如圖7所示,我們看到微軟位列第二。據報道,微軟于2019年首次注資OpenAI后,于2020年7月向OpenAI投資10億美元,在Azure云平臺上提供OpenAI技術。2021年微軟再次投資20億,Azure OpenAI集成GPT-3模型,可以直接調用相關API。2023年1月24日,微軟宣布與OpenAI再次擴大合作關系,追加投資100億,加速人工智能領域的技術突破與轉型。本輪投資后,微軟將獲得OpenAI 75%的利潤分紅權直到收回投資,之后微軟將擁有OpenAI 49%分紅權。通過專利檢索,筆者發現:微軟在上述一系列投資的同時,也在積極開展該領域的專利布局。
筆者還注意到,最近因推出“文心一言”而被推上風口浪尖的百度,在該領域也有較多專利申請,能排到第10名左右。
圖7
然后,筆者點擊前面的“+”,就會發現相對而言排名靠前的企業。百度在該領域的專利布局晚了很多,自2019年開始才有相關文獻(如圖8所示),這體現出百度在該領域的研發處于追趕的狀態。雖然百度現在發布“文心一言”有一點兒趕鴨子上架的感覺,但筆者相信只要持續投入,作為后發者的百度也有可能產出屬于中國人自己的ChatGPT。
圖8
2、發明人分析
如圖9所示,在分析欄中選擇發明人分析,從“發明人趨勢分析”中點擊表格,就能從排名靠前的發明人中看到,百度的首席技術官王海峰(WANG HAIFENG)參與了百度大部分專利。
進而筆者通過互聯網上搜索的信息得知,王海峰在2019年5月被任命為百度集團首席技術官,9月百度智能云事業群組(ACG)融入王海峰負責的CTO體系。2020年,王海峰將原AIG(AI技術平臺體系)、TG(基礎技術體系)和ACG(百度智能云事業群組)整體整合為人工智能體系(AI Group,AIG),由王海峰整體負責。而在這之后,百度就開始在自然語言生成領域上奮起直追。可見,百度的AI技術與王海峰是息息相關的。
圖9
3、區域分析
如圖10所示,在分析欄中選擇區域分析,從“區域構成分析”的圖像中可以看出,美國地區申請人的相關專利占比已經超過二分之一,而中國地區申請人的相關專利雖然相比其他國家位于前列,但是與美國相比仍然有很大差距。
圖10
為了進一步查看中國地區不同申請人的申請情況,如圖11所示,筆者選擇“區域申請人分析”,然后點擊表格,找到“CN”,點擊前面的加號,就能打開查看中國地區不同申請人的申請量。可以看到,在中國地區,百度在該領域的申請量最高,其次是華為、騰訊等。由此可知,國內的幾家大廠已經開始在中國進行專利“跑馬圈地”,至于誰率先能在市場站穩腳跟,就要看誰能先一步將技術落地了。
圖11
>>> 結 語
“ChatGPT”接續“元宇宙”、“web3”成為了AI圈的熱門關鍵詞,掀起了科技界的一場狂潮。俗話說,“外行看熱鬧,內行看門道”,借助國家知識產權局新版“專利檢索及分析系統”,知識產權工作者不僅可以“看熱鬧”,還能有效“跟蹤”相關領域的最新研發方向,了解國內外主要競爭對手及其專利布局情況。
總之,通過檢索和分析相關專利文獻,企業就可以做到“知己知彼”、提高自身的研發起點和創新效率、避免重復研發,提前做好自身專利保護與布局規劃、搶占市場先機,并在生產銷售時防范和規避侵權風險、保障企業行穩致遠。
參考資料:[1] ChatGPT: IP Strategy in the AI Space, Feb. 16. 2023
中企檢測認證網提供iso體系認證機構查詢,檢驗檢測、認證認可、資質資格、計量校準、知識產權貫標一站式行業企業服務平臺。中企檢測認證網為檢測行業相關檢驗、檢測、認證、計量、校準機構,儀器設備、耗材、配件、試劑、標準品供應商,法規咨詢、標準服務、實驗室軟件提供商提供包括品牌宣傳、產品展示、技術交流、新品推薦等全方位推廣服務。這個問題就給大家解答到這里了,如還需要了解更多專業性問題可以撥打中企檢測認證網在線客服13550333441。為您提供全面檢測、認證、商標、專利、知識產權、版權法律法規知識資訊,包括商標注冊、食品檢測、第三方檢測機構、網絡信息技術檢測、環境檢測、管理體系認證、服務體系認證、產品認證、版權登記、專利申請、知識產權、檢測法、認證標準等信息,中企檢測認證網為檢測認證商標專利從業者提供多種檢測、認證、知識產權、版權、商標、專利的轉讓代理查詢法律法規,咨詢輔導等知識。
本文內容整合網站:中國政府網、百度百科、搜狗百科、360百科、最高人民法院、知乎、市場監督總局 、國家知識產權局、國家商標局
免責聲明:本文部分內容根據網絡信息整理,文章版權歸原作者所有。向原作者致敬!發布旨在積善利他,如涉及作品內容、版權和其它問題,請跟我們聯系刪除并致歉!