學校目前是線上課程,當我把檔案下載下來,內文都是英文,只有第一頁內文可以複製,其他內文複製後貼到任何地方,不論是google 翻譯,文字檔,line的對話匡,全都是亂碼。我上網找過很多解決辦法,通常都不適用,大部分是本份檔案轉換因為字體問題,才變成亂碼。我有發現我在檔案中要複製,按下右鍵的時候,搜尋那邊只要是不能正常複製的文字就會自動轉成亂碼。我有看到有人用截圖偵測文字,但我的檔案有157頁,我覺得這個辦法可能不太適合我,我還是要複製貼上會比較有效率。我用過PDF,chrome ,IE都開啟過,全部狀況都一樣。附上圖片給各位看,不知道大家有沒有辦法
其實 pdf 可以做到「看到的文字」與「複製的文字」不同看到的文字是:「月落烏啼霜滿天,江楓漁火對愁眠」但是複製會變成:「但使龍城飛將在,不教胡馬度陰山」(參考範例一)至於複製出來是亂碼也是類似原因我上面的 pdf 是故意設計對應到錯誤的 unicode而複製出來是亂碼很大的可能是他並沒有寫入 unicode 的映射資訊(參考範例二)範例 範例一:故意映射到另外一句話 範例二:無 unicode 映射 解決方式 直接用 OCR 再人工校正 「複製文字 => 實際文字」在同一套字型下,應該是 1 對 1 關係,可以考慮用取代的方式處理
https://www.adobe.com/tw/acrobat/online/pdf-to-word.html我試著用你那範例檔轉換後,就正常化了。但要注意的是,這個雖然是adobe官方的轉換器,但終究…是否仍會造成轉換後的內容有些許差異,就不得而知了。