ubuntu下读取 不同编码格式的文件 读取中文
发布时间:2020-07-24 08:04:29  所属栏目:Ubuntu  来源:互联网 
            导读:# -*- coding: utf-8 -*- #汉字编码 unicode 0x4e00 - 0x9fa5 两万多个 #GB2312,简体中文字符集6763个常用汉字和682个全角非汉字字符,根据使用频率分两级,一级 #汉字3755个,二级汉字3008个。 #GB18030-2005 是目前最新的内码字集 #GBK 是对GB2312的 #在Wi
                
                
                
            | 
                         # -*- coding: utf-8 -*- #汉字编码 unicode 0x4e00 - 0x9fa5 两万多个 #GB2312,简体中文字符集6763个常用汉字和682个全角非汉字字符,根据使用频率分两级,一级 #汉字3755个,二级汉字3008个。 #GB18030-2005 是目前最新的内码字集 #GBK 是对GB2312的 
 #在Windows 环境下 
 #判断文件的编码格式 import chardet import codecs f = open('GB2312_set.txt','r') data = f.read() print chardet.detect(data) 
 #以相应的格式打开文件 with codecs.open("GB2312_set.txt",'r','UTF-16LE') as handle: #以UTF-16LE格式读取并转换为linux内部的unicode格式 for ln in handle: print ln (编辑:莱芜站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!  | 
                  
相关内容
- 在Ubuntu上安装MariaDB:“找不到包”
 - Ubuntu下apt-get安装与pip安装的区别
 - 在Ubuntu / VMware上测量C中的短时间间隔
 - chromedriver:ubuntu 14.04 64位上缺少各种lib依赖项
 - Ubuntu LTS 系统学习使用体会和实用工具软件汇总 6.04 8.04
 - Ubuntu开启ssh服务(14.04)
 - install ubuntu 14.04.5 desktop with raid 1 support
 - Ubuntu下使用SSH和FileZilla远程登陆
 - ubuntu – 带有Open vSwitch的LXC
 - Android源码 在Ubuntu上下载,编译和安装
 
推荐文章
            站长推荐
            - ubuntu安装tensorflow时使用pip安装时出现SSLErr
 - bzr 工具的介绍与使用
 - GUVCview-Ubuntu下视频录像更简单
 - Linux Ubuntu系统上手动安装.NET Core SDK的方法
 - ubuntu16.04下安装TensorFlow(GPU加速)----详细图
 - navicate远程访问ubuntu上的mysql数据库
 - 在 Ubuntu on Windows 下Webpack 错误:uv_inter
 - ubuntu下环境变量详解 bashrc, profile, environ
 - cassandra – 启用CQL二进制协议抛出YAMLExcepti
 - Fuchsia开发环境setup for Ubuntu 16.04
 
热点阅读
            