Python 的Big5 與UTF-8 檔案編碼轉換程式教學 - Office 指南
文章推薦指數: 80 %
介紹如何使用簡單的Python 程式處理Big5 與UTF-8 檔案的編碼轉換問題。
Big5 與UTF-8 的編碼轉換是在中文資料處理上常見的問題之一,以下介紹如何使用Python 來 ...
跳至主要導覽跳至主要內容跳至主要資訊欄介紹如何使用簡單的Python程式處理Big5與UTF-8檔案的編碼轉換問題。
Big5與UTF-8的編碼轉換是在中文資料處理上常見的問題之一,以下介紹如何使用Python來處理Big5與UTF-8編碼的互轉。
Big5轉UTF-8
Python的讀取與寫入檔案函數本身就有支援各種編碼,所以只要在開啟檔案時,正確指定檔案的編碼,就可以讓Python自動處理編碼轉換問題,以下是Big5檔案轉成UTF-8檔案的範例。
#開啟Big5輸入檔案
inFile=open("big5_input.txt","r",encoding="Big5")
#開啟UTF-8輸出檔案
outFile=open("utf8_output.txt","w",encoding="UTF-8")
#以Big5編碼讀取檔案
content=inFile.read()
#以UTF-8編碼寫入檔案
outFile.write(content)
#關閉檔案
inFile.close()
outFile.close()
檔案轉換編碼之後,結果會像這樣,編碼改變而內容維持不變。
Big5轉UTF-8
這是使用with的寫法,跟上面那段程式碼比較起來,作用完全相同,只不過寫法比較簡潔。
#使用with的寫法
withopen("big5_input.txt","r",encoding="Big5")asinFile,open("utf8_output.txt","w",encoding="UTF-8")asoutFile:
outFile.write(inFile.read())
UTF-8轉Big5
UTF-8轉Big5的程式撰寫方式也是一樣,只是將編碼調換而已,以下是一個簡單的範例。
#開啟UTF-8輸入檔案
inFile=open("utf8_input.txt","r",encoding="UTF-8")
#開啟Big5輸出檔案
outFile=open("big5_output.txt","w",encoding="Big5")
#以UTF-8編碼讀取檔案
content=inFile.read()
#以Big5編碼寫入檔案
outFile.write(content)
#關閉檔案
inFile.close()
outFile.close()
UTF-8轉Big5
參考資料:OpenHome.cc
讀者互動方式
發佈留言取消回覆發佈留言必須填寫的電子郵件地址不會公開。
必填欄位標示為*留言*顯示名稱*
電子郵件地址*
個人網站網址
主要資訊欄搜尋
近期文章
Linux使用fio硬碟I/O效能測試工具教學與範例
Python使用python-magic模組檢查檔案類型教學與範例
Python使用HTTPX建立HTTP請求教學與範例
Grafana整合Nginx網頁伺服器設定教學與範例
Python使用assert在開發階段協助除錯教學與範例
Python計算檔案SHA256雜湊檢查碼教學與範例
OHIFViewer醫學影像平台安裝與設定教學
Linux以Systemd啟動JupyterNotebook搭配Nginx反向代理設定教學
推薦網站
Udemy線上教學課程
Coursera線上教學課程
關注本站
電子郵件Facebook
公益
家扶基金會
台灣世界展望會
Yahoo奇摩公益
igiving公益網
兒福聯盟
延伸文章資訊
- 1Python 的編碼
py 檔案想要是UTF-8 以外的編碼,同樣必須在第一行放置編碼聲明。 # coding=Big5 text = '測試' print( ...
- 2Python中关于coding=utf-8以及中文字符前加u的解释 - CSDN博客
写了很久的Python了,每次写之前都要在开头加上coding=utf-8,只知道是设置编码格式,但并没有太在意,今天在写socket编程时才发现编码格式的重要性。
- 3在Python 中解碼UTF-8 | D棧
在Python 中解碼 UTF-8 字串 ... 要解碼以 UTF-8 格式編碼的字串,我們可以使用字串上指定的 decode() 方法。 此方法接受兩個引數, encoding 和 error 。
- 4Python 程式碼或註解加入中文教學,設定UTF-8 編碼- G. T. Wang
#!/usr/bin/python # -*- coding: utf-8 -*- # 中文註解 print("Hello, world.") Python 指令稿的編碼宣告必須出寫在程式碼的第...
- 5Day27 Python 基礎- 字符轉編碼操作 - iT 邦幫忙
UTF-8 是一種針對Unicode的可變長度字元編碼,英文字符一樣會依照ASCII碼規範,只占一個字節8bit,而中文字符的話,統一就占三個字節. 回顧可以參考字符編碼.