ubuntu下读取 不同编码格式的文件 读取中文
发布时间:2020-07-24 08:04:29 所属栏目:Ubuntu 来源:互联网
导读:# -*- coding: utf-8 -*- #汉字编码 unicode 0x4e00 - 0x9fa5 两万多个 #GB2312,简体中文字符集6763个常用汉字和682个全角非汉字字符,根据使用频率分两级,一级 #汉字3755个,二级汉字3008个。 #GB18030-2005 是目前最新的内码字集 #GBK 是对GB2312的 #在Wi
# -*- coding: utf-8 -*- #汉字编码 unicode 0x4e00 - 0x9fa5 两万多个 #GB2312,简体中文字符集6763个常用汉字和682个全角非汉字字符,根据使用频率分两级,一级 #汉字3755个,二级汉字3008个。 #GB18030-2005 是目前最新的内码字集 #GBK 是对GB2312的
#在Windows 环境下
#判断文件的编码格式 import chardet import codecs f = open('GB2312_set.txt','r') data = f.read() print chardet.detect(data)
#以相应的格式打开文件 with codecs.open("GB2312_set.txt",'r','UTF-16LE') as handle: #以UTF-16LE格式读取并转换为linux内部的unicode格式 for ln in handle: print ln (编辑:莱芜站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
相关内容
- 在Ubuntu上安装MariaDB:“找不到包”
- Ubuntu下apt-get安装与pip安装的区别
- 在Ubuntu / VMware上测量C中的短时间间隔
- chromedriver:ubuntu 14.04 64位上缺少各种lib依赖项
- Ubuntu LTS 系统学习使用体会和实用工具软件汇总 6.04 8.04
- Ubuntu开启ssh服务(14.04)
- install ubuntu 14.04.5 desktop with raid 1 support
- Ubuntu下使用SSH和FileZilla远程登陆
- ubuntu – 带有Open vSwitch的LXC
- Android源码 在Ubuntu上下载,编译和安装
推荐文章
站长推荐
- ubuntu安装tensorflow时使用pip安装时出现SSLErr
- bzr 工具的介绍与使用
- GUVCview-Ubuntu下视频录像更简单
- Linux Ubuntu系统上手动安装.NET Core SDK的方法
- ubuntu16.04下安装TensorFlow(GPU加速)----详细图
- navicate远程访问ubuntu上的mysql数据库
- 在 Ubuntu on Windows 下Webpack 错误:uv_inter
- ubuntu下环境变量详解 bashrc, profile, environ
- cassandra – 启用CQL二进制协议抛出YAMLExcepti
- Fuchsia开发环境setup for Ubuntu 16.04
热点阅读