office在2003版中增加了Document Imaging工具,用它可以查看、管理、讀取和識(shí)別圖像文檔和傳真文本。其實(shí),利用它的這個(gè)功能,我們還可以把網(wǎng)頁(yè)或電子書中的文字給“摳”出來。
打開電子書,盡量采用較大的字體,翻到想要獲取的頁(yè)面,用抓圖軟件SnagIt對(duì)相關(guān)的內(nèi)容進(jìn)行抓取,然后在“文件”菜單中選擇“復(fù)制到剪貼板”命令(也可以用其他抓圖軟件,當(dāng)然最簡(jiǎn)單的是Windows中自帶的Print Screen鍵來抓取整個(gè)屏幕,然后在“畫圖”程序中對(duì)不要的部分進(jìn)行裁剪并保存,然后復(fù)制)。
在“開始”菜單的“microsoft Office工具”中打開Microsoft Office Document Imaging,在左側(cè)窗口中單擊鼠標(biāo)右鍵,選擇“粘貼頁(yè)面”,把復(fù)制的圖片粘貼到Document Imaging中,在“工具”中選擇“使用OCR識(shí)別文本”,Document Imaging的OCR識(shí)別程序就會(huì)對(duì)圖片進(jìn)行識(shí)別,完成后選擇“工具”中的“將文本發(fā)送到word”,程序會(huì)自動(dòng)打開Word文檔,展現(xiàn)在你面前的就是從圖片中“摳”出來的文字。
提示:一般而言,識(shí)別的準(zhǔn)確率可以達(dá)到95%以上,但對(duì)英文和數(shù)字的識(shí)別不是太好。
相關(guān)閱讀