问题:使用一台Linux系统的机器,终端总是显示有乱码,不是中文乱码,看起来像是英文乱码,我这强迫症又受不了了
成都创新互联公司服务项目包括坊子网站建设、坊子网站制作、坊子网页制作以及坊子网络营销策划等。多年来,我们专注于互联网行业,利用自身积累的技术优势、行业经验、深度合作伙伴关系等,向广大中小型企业、政府机构等提供互联网行业的解决方案,坊子网站推广取得了明显的社会效益与经济效益。目前,我们服务的客户以成都为中心已经辐射到坊子省份的部分城市,未来相信会继续扩大服务区域并继续获得客户的支持与信任!
解决方案:
Linux字符编码默认为UTF-8,如果出现英文乱码有可能是系统设置的编码方式为GBK。
设置locale的根本就是设置一组总共12个LC开头的变量,不包括LANG和LC_ALL。
优先 级:LC_ALL LC_* LANG
可以看出原系统设置的为中文字体显示和运行的语言环境,所有的设置都是使用的 zh_CN.gbk ,因中英文字符编码方式不同,可能造成英文字符或者空格显示有乱码。
5.退出后再次查看locale(再次登录才生效)
乱码的字符消失了。locale转变为:
缺省配置下,用
ubuntu
的文本编辑器(gedit)打开
gb18030/gbk/gb2312
等类型的中文编码文本文件时,将会出现乱码。
原因分析:
gedit
使用一个编码匹配列表,只有在这个列表中的编码才会进行匹配,不在这个列表中的编码将显示为乱码。您要做的就是将
gb18030
加入这个匹配列表。
命令行方式,适用于所有
ubuntu
用户。
复制以下命令到终端中,然后回车即可:
代码示例:
gconftool-2
--set
--type=list
--list-type=string
/apps/gedit-2/preferences/encodings/auto_detected
"[utf-8,current,gb18030,big5-hkscs,utf-16]"
图形化方式,适用于
ubuntu
用户,而不适用于
kubuntu/xubuntu
用户。
您可以遵循以下步骤,使您的
gedit
正确显示中文编码文件。
按下
alt-f2,打开“运行应用程序”对话框。
在文本框中键入“gconf-editor”,并按下回车键,打开“配置编辑器”。
展开左边的树节点,找到
/apps/gedit-2/preferences/encodings
节点并单击它。
双击右边的
auto_detected
键,打开“编辑键”对话框。
单击列表右边的“添加”按钮,输入“gb18030”,单击确定按钮。
列表的最底部新增加了一个“gb18030”。单击选中它,并单击右边的
“向上”
按钮直到
“gb18030”
位于列表的顶部为止。
单击确定按钮,关闭配置编辑器。
gedit3.x版本设置
终端输入dconf-editor
展开org/gnome/gedit/preferences/encodings
auto-detected的value中加入’gb18030′,加在uft8后面;
show-in-menu的value中加入’gb18030′
现在,您的
gedit
应该能够顺利打开
gb18030
编码的文本文件了。
gedit
3.x版本命令设置:
代码示例:
gsettings
set
org.gnome.gedit.preferences.encodings
auto-detected
"['utf-8','gb18030','gb2312','gbk','big5','current','utf-16']"
fedora
16自带的gedit文本编辑器属于gedit3.x版本,所以网上很多关于gedit设置不太适用,根本找不到
/apps/gedit-2/preferences/encodings,所以这个问题还没解决的用户可以借鉴一下gedit3.x版本设置方法。
1、首先查看当前在用的语言
2、查看系统已安装的语言包
3、终端的字符集设置(比如xshell)
三者保持一致即可。
Linux文件名、文件内容乱码,主要原因是windows上的中文编码默认是GBK,而Linux默认中文编码为UTF-8,由于编码不一致,所以导致乱码问题。
为了解决这个乱码,需要对文件进行转码,具体如下:
1、前提保证已安装了convmv;
2、具体convmv的用法:
Convmv
–f
源编码
–t
新编码
[选项]
文件名
一般常用参数:
-r
递归处理子目录
--notest
真正进行操作,默认情况下是不对文件进行真实操作的,只是一个预览
--list
显示所有支持的编码
--unescap
可以做一个转义
3、比如我们有一个utf8的文件名,要求转换成gbk编码,命令如下:
Convmv
–f
utf-8
–t
gbk
–notest
文件名
也可以使用linux下最好用的编码转换工具iconv来进行转码操作。
例子:将GBK编码的文件转换成UTF-8
iconv
-f
GBK
-t
UTF-8
gbkfile.txt
utf8file.txt
出现这种情况的原因为两种操作系统的中文压缩方式不同,在windows环境中中文压缩一般为gbk,而在linux环境中为utf8,这就导致了在windows下能正常显示
txt文件在linux环境下打开呈现了乱码状态。
解决方法:在linux用iconv命令,输入命令如下
iconv
-f
gbk
-t
utf8
file.pdf
file.pdf.utf8
此时会重生一file.utf8文件,打开之后就能正常显示中文
linux系统下修改语言配置方法有:
法一:修改/etc/profile文件,增加export
LANG=zh_CN.GB18030
法二:修改/etc/sysconfig/i18n文件,将
#LANG="en_US.UTF-8"
#SUPPORTED="en_US.UTF-8:en_US:en"
#SYSFONT="latarcyrheb-sun16"
改为
LANG="zh_CN.UTF-8"
SUPPORTED="zh_CN:zh:en_US.UTF-8:en_US:en:zh_CN.GB18030"
SYSFONT="latarcyrheb-sun16"
/etc/profile:
为系统的每个用户设置环境信息,当用户第一次登录时,该文件被执行.
/etc/sysconfig/i18n
这里存放的是系统的区域语言设置
LANG
表明你当前系统的语言环境变量设置
,这里是
zh_CN.GB18030
SUPPORTED
表明系统预置了那些语言支持
,不在项目中的语言不能正常显示
SYSFONT
定义控制台终端字体,你文本登录的时候显示的字体是
latarcyrheb-sun16
I18N
是
internationalization
的缩写形式,意即在
i
和
n
之间有
18
个字母,本意是指软件的“国际化”.I18N支持多种语言,不过同一时间只能是英文和一种选定的语言,例如英文+中文、英文+德文、英文+韩文等等;
如果在SCRT上操作时中文乱码,可依次点击options--session
options--appearance,选择character
encoding为UTF-8