最近,微信在安卓8.0.24正式版更新了新功能,名為“圖片大爆炸”。該功能通過長按圖片,可以提取到圖片上的文字進(jìn)行后續(xù)的復(fù)制粘貼以及搜索等操作,有效地解決了以往用戶在使用過程中經(jīng)常遇到的電話號碼、快遞單號、網(wǎng)址等信息以圖片的形式得到而又無法直接使用、需要手動輸入的窘迫情形。
圖1 微信對話場景
1、使用微信“圖片大爆炸”功能進(jìn)行圖片文字提取
微信圖片文字提取功能的操作及界面如圖2-圖4所示:
點(diǎn)開需要提取文字的圖片,長按屏幕上對應(yīng)該圖片的位置,即可出現(xiàn)文字提取操作選擇界面;
圖2 長按圖片導(dǎo)出“提取文字”操作界面
在彈出對話框中選擇“提取文字”操作圖標(biāo),即可在屏幕圖片上的文字進(jìn)行識別或進(jìn)一步地進(jìn)行文字涂抹選擇;
圖3 進(jìn)行圖片文字提取
選擇并用手指涂抹想要使用的字段即可供用戶輕松的進(jìn)行“呼叫”、“添加到通訊錄”、“復(fù)制”、“搜一搜”、“轉(zhuǎn)發(fā)”以及“收藏”等操作。
圖4 提取出文字支持進(jìn)一步操作
通過簡單的幾個步驟就可以輕松地實(shí)現(xiàn)圖片上文字的提取,不管是字母、數(shù)字,還是文字,都可以輕松識別和提取,進(jìn)行復(fù)制粘貼以及搜索等操作。用戶使用微信時再也不會遇到圖片上的電話號碼、快遞單號、網(wǎng)址等需要手動輸入的窘迫情形。
這一問題的解決大大提高了用戶對微信的使用體驗(yàn),隨之而來的是,越來越多的用戶對這項(xiàng)技術(shù)產(chǎn)生興趣。
那么微信是如何做到準(zhǔn)確提取圖片文字的呢?帶著這個問題,筆者對騰訊的圖片文字提取技術(shù)相關(guān)專利進(jìn)行了檢索和分析。
2、騰訊圖片文字提取技術(shù)專利分析
通過對騰訊的圖片文字提取技術(shù)相關(guān)專利檢索發(fā)現(xiàn),騰訊早在微信“圖片大爆炸”功能推出之前就已經(jīng)布局了大量的專利,從2015年至今共布局了36件發(fā)明專利。從專利年申請量方面來看,近兩年明顯較早期多,從授權(quán)狀況(授權(quán)專利按照申請年統(tǒng)計(jì),若某件專利2016年申請,2017年授權(quán),該授權(quán)量統(tǒng)計(jì)計(jì)入2016年)方面來看,騰訊的圖片文字提取技術(shù)相關(guān)專利大部分處于審查狀態(tài)中,2016年授權(quán)率達(dá)到66.67%。較多相關(guān)技術(shù)的積累和專利布局奠定了如今微信“圖片大爆炸”功能的問世。
圖5 騰訊在圖片文字提取技術(shù)領(lǐng)域的專利申請趨勢及授權(quán)狀況(申請量:件)
從專利布局的角度研判企業(yè)的市場重心,騰訊的36件圖片文字提取相關(guān)專利主要布局在中國和中國香港,同時通過PCT途徑申請專利。
圖6 騰訊在圖片文字提取技術(shù)領(lǐng)域的專利布局地域分布(單位:件)
從專利技術(shù)分布的角度研究企業(yè)的優(yōu)勢技術(shù),騰訊的36件專利涉及24項(xiàng)專利技術(shù),主要解決識別的準(zhǔn)確性、成本、文本內(nèi)容的私密性以及文本識別過程中文本的翻譯效率四個技術(shù)問題。
圖7 騰訊在圖片文字提取技術(shù)領(lǐng)域的專利技術(shù)功效分布
1) 騰訊聚焦于如何提高圖片文字識別準(zhǔn)確率的技術(shù)問題,申請了20項(xiàng)專利,主要的技術(shù)手段為通過文字檢測技術(shù)手段對圖片中的文字進(jìn)行檢測和分析,以及對文本圖像進(jìn)行圖像優(yōu)化和圖像分割的處理。其中,專利CN108830186B采用圖像優(yōu)化的技術(shù)手段,通過從文本圖像中選取已知背景區(qū)域,對于文本圖像中已知背景區(qū)域以外的剩余區(qū)域,采用插值算法分別計(jì)算這些剩余區(qū)域的背景像素值;根據(jù)該區(qū)域的背景像素值確定文本圖像的背景像素值;根據(jù)文本圖像的原始像素值和背景像素值,對文本圖像進(jìn)行背景減除,得到文本圖像的內(nèi)容圖像。這種技術(shù)可以克服陰影、邊角雜質(zhì)、紙張顏色等對提取文本內(nèi)容的影響,使得最終得到的內(nèi)容圖像中的文本內(nèi)容更加準(zhǔn)確、清晰。
圖8 專利CN108830186B文字圖像背景減除過程示意圖
再如專利CN111914825A采用文字檢測的技術(shù)手段,通過獲取包括待識別文字(包括至少一個字符組〔字符組包括至少一個字符〕)的待識別圖像,從待識別圖像中提取圖像特征,并根據(jù)圖像特征確定待識別文字所對應(yīng)候選文字的第一編碼序列以及第一概率;根據(jù)候選文字的第二編碼序列,獲取候選文字對應(yīng)的第二概率;根據(jù)第一概率和第二概率,從各候選文字的第一編碼序列中確定待識別文字對應(yīng)的目標(biāo)編碼序列,并將目標(biāo)編碼序列所表示的候選文字確定為待識別文字的識別結(jié)果。如此,可以有效降低字符組識別出錯的幾率,進(jìn)而降低待識別文字識別出錯的幾率。
圖9 專利CN111914825A中待識別文字組成示意圖
2) 降低成本方面的專利有1項(xiàng),通過圖像優(yōu)化的技術(shù)手段實(shí)現(xiàn)降低成本。
專利CN108304839B,生成目標(biāo)圖像對應(yīng)的單色分量圖像,并根據(jù)每個單色分量圖像中的角點(diǎn)和端點(diǎn),在目標(biāo)圖像中劃分待識別區(qū)域,并基于分類器,計(jì)算每個待識別區(qū)域分別對應(yīng)的文字識別概率,并根據(jù)文字識別概率在待識別區(qū)域中識別文字區(qū)域。由于識別角點(diǎn)和端點(diǎn)的過程和計(jì)算文字識別概率的過程均可以在大多數(shù)用戶終端中實(shí)現(xiàn),所以無需部署云端服務(wù)器即可在用戶終端側(cè)完成對文字區(qū)域的準(zhǔn)確識別,從而降低了實(shí)現(xiàn)成本,也可避免與云端服務(wù)器進(jìn)行數(shù)據(jù)傳輸,降低網(wǎng)絡(luò)流量的消耗。
圖10 專利CN108304839B文字圖像單色疊加過程示意圖
3) 提高文本內(nèi)容私密性方面的專利有2項(xiàng),分別通過文字檢測和圖像分割的技術(shù)手段對圖像文字進(jìn)行分類,并加以處理以防范敏感信息的泄露,提高私密性。
例如專利CN111062389A,在通過負(fù)樣本區(qū)域訓(xùn)練得到用于文字識別的第一模型之后,可以在文本區(qū)域中包含敏感信息時直接輸出設(shè)定、輸出信息,進(jìn)而從模型層面避免了識別出文字之后再甄別而造成的敏感信息泄露的風(fēng)險,提高了信息的私密性。
圖11 專利CN111062389A文字識別敏感信息甄別過程示意圖
4) 提高翻譯效率方面的專利有1項(xiàng),專利CN112183122A采用文字檢測的技術(shù)手段對圖片進(jìn)行文字識別,通過對目標(biāo)圖片進(jìn)行文字識別,得到的文字信息包括至少兩個語種的文字(包括語種不為目標(biāo)語種的文字的情況),對該文字信息中的語種不為目標(biāo)語種的文字進(jìn)行機(jī)器翻譯,得到并顯示目標(biāo)語種的文字信息,達(dá)到了不用手工輸入即可對外文文字進(jìn)行翻譯的目的,從而實(shí)現(xiàn)了提高外文文字翻譯效率的技術(shù)效果,進(jìn)而解決了由于現(xiàn)有技術(shù)中翻譯軟件需要人工輸入,造成的外文文字翻譯效率低的技術(shù)問題。
圖12 專利CN112183122A文字識別翻譯示意圖
結(jié)語
騰訊在圖片文字提取技術(shù)領(lǐng)域申請了較多的專利,聚焦于如何提高圖片文字識別準(zhǔn)確率的技術(shù)問題,進(jìn)行了較為全面的技術(shù)研發(fā)和專利布局,具有比較明顯的技術(shù)優(yōu)勢。能在實(shí)現(xiàn)圖片文字提取功能的基礎(chǔ)上保持高的圖片文字識別準(zhǔn)確率,使得微信的圖片文字識別功能更貼合用戶的使用需求和體驗(yàn)。
中企檢測認(rèn)證網(wǎng)提供iso體系認(rèn)證機(jī)構(gòu)查詢,檢驗(yàn)檢測、認(rèn)證認(rèn)可、資質(zhì)資格、計(jì)量校準(zhǔn)、知識產(chǎn)權(quán)貫標(biāo)一站式行業(yè)企業(yè)服務(wù)平臺。中企檢測認(rèn)證網(wǎng)為檢測行業(yè)相關(guān)檢驗(yàn)、檢測、認(rèn)證、計(jì)量、校準(zhǔn)機(jī)構(gòu),儀器設(shè)備、耗材、配件、試劑、標(biāo)準(zhǔn)品供應(yīng)商,法規(guī)咨詢、標(biāo)準(zhǔn)服務(wù)、實(shí)驗(yàn)室軟件提供商提供包括品牌宣傳、產(chǎn)品展示、技術(shù)交流、新品推薦等全方位推廣服務(wù)。這個問題就給大家解答到這里了,如還需要了解更多專業(yè)性問題可以撥打中企檢測認(rèn)證網(wǎng)在線客服13550333441。為您提供全面檢測、認(rèn)證、商標(biāo)、專利、知識產(chǎn)權(quán)、版權(quán)法律法規(guī)知識資訊,包括商標(biāo)注冊、食品檢測、第三方檢測機(jī)構(gòu)、網(wǎng)絡(luò)信息技術(shù)檢測、環(huán)境檢測、管理體系認(rèn)證、服務(wù)體系認(rèn)證、產(chǎn)品認(rèn)證、版權(quán)登記、專利申請、知識產(chǎn)權(quán)、檢測法、認(rèn)證標(biāo)準(zhǔn)等信息,中企檢測認(rèn)證網(wǎng)為檢測認(rèn)證商標(biāo)專利從業(yè)者提供多種檢測、認(rèn)證、知識產(chǎn)權(quán)、版權(quán)、商標(biāo)、專利的轉(zhuǎn)讓代理查詢法律法規(guī),咨詢輔導(dǎo)等知識。
本文內(nèi)容整合網(wǎng)站:中國政府網(wǎng)、百度百科、最高人民法院、知乎、國家認(rèn)證認(rèn)可監(jiān)督管理委員會、國家知識產(chǎn)權(quán)局、市場監(jiān)督總局
免責(zé)聲明:本文部分內(nèi)容根據(jù)網(wǎng)絡(luò)信息整理,文章版權(quán)歸原作者所有。向原作者致敬!發(fā)布旨在積善利他,如涉及作品內(nèi)容、版權(quán)和其它問題,請跟我們聯(lián)系刪除并致歉!