PHP 頁(yè)面編碼聲明與用header或meta實(shí)現(xiàn)PHP頁(yè)面編碼的區(qū)別
php的header來(lái)定義一個(gè)php頁(yè)面為utf編碼或GBK編碼
php頁(yè)面為utf8編碼
header("Content-type: text/html; charset=utf-8");
php頁(yè)面為gbk編碼
header("Content-type: text/html; charset=gb2312");
php頁(yè)面為big5編碼
header("Content-type: text/html; charset=big5");
通常情況以上代碼放在php頁(yè)面的首頁(yè)
一.HTML頁(yè)面轉(zhuǎn)UTF-8編碼問(wèn)題
1.在head后,title前加入一行:
<meta http-equiv='Content-Type' content='text/html; charset=utf-8' />
順序不能錯(cuò),一定要在
顯示的標(biāo)題有可能是亂碼!
2.html文件編碼問(wèn)題:
點(diǎn)擊編輯器的菜單:“文件”->“另存為”,可以看到當(dāng)前文件的編碼,確保文件編碼為:UTF-8,
如果是ANSI,需要將編碼改成:UTF-8。
3.HTML文件頭BOM問(wèn)題:
將文件從其他的編碼轉(zhuǎn)換成UTF-8編碼時(shí),有時(shí)候會(huì)在文件的最開(kāi)始加上一個(gè)BOM標(biāo)簽,
在個(gè)BOM標(biāo)簽可能會(huì)導(dǎo)致瀏覽器在顯示中文的時(shí)候出現(xiàn)亂碼。
刪除這個(gè)BOM標(biāo)簽的方法:
1.可以用Dreamweaver打開(kāi)文件,并重新保存,即可以去除BOM標(biāo)簽!
2.可以用EditPlus打開(kāi)文件,并在菜單“首選項(xiàng)”->“文件”->"UTF-8標(biāo)識(shí)",設(shè)置為:“總是刪除簽名”,
然后保存文件,即可以去除BOM標(biāo)簽!
4.WEB服務(wù)器UTF-8編碼問(wèn)題:
如果你按以上所列的步驟做了,還是有中文亂碼問(wèn)題,
請(qǐng)檢查你的所使用的WEB服務(wù)器的編碼問(wèn)題
如果你使用的是Apache,請(qǐng)將配置文件里的:charset 設(shè)成:utf-8(這里僅列出方法,具體格式請(qǐng)參考apache的配置文件)
如果你使用的是Nginx,請(qǐng)將nginx.conf里的:charset 設(shè)成 utf-8,
具體找到 "charset gb2312;"或者類(lèi)似的語(yǔ)句,改成:“charset utf-8;”。
二.PHP頁(yè)面轉(zhuǎn)UTF-8編碼問(wèn)題
1.在代碼開(kāi)始出加入一行:
header("Content-Type: text/html;charset=utf-8");
2.PHP文件編碼問(wèn)題
點(diǎn)擊編輯器的菜單:“文件”->“另存為”,可以看到當(dāng)前文件的編碼,確保文件編碼為:UTF-8,
如果是ANSI,需要將編碼改成:UTF-8。
3.PHP文件頭BOM問(wèn)題:
PHP文件一定不可以有BOM標(biāo)簽
否則,會(huì)出現(xiàn)session不能使用的情況,并有類(lèi)似的提示:
Warning: session_start() [function.session-start]: Cannot send session cache limiter - headers already sent
這是因?yàn)?,在?zhí)行session_start() 的時(shí)候,整個(gè)頁(yè)面不能有輸出,但是當(dāng)由于前PHP頁(yè)面存在BOM標(biāo)簽,
PHP把這個(gè)BOM標(biāo)簽當(dāng)成是輸出了,所以就出錯(cuò)了!
所以PHP頁(yè)面一定要?jiǎng)h除BOM標(biāo)簽
刪除這個(gè)BOM標(biāo)簽的方法:
1.可以用Dreamweaver打開(kāi)文件,并重新保存,即可以去除BOM標(biāo)簽!
2.可以用EditPlus打開(kāi)文件,并在菜單“首選項(xiàng)”->“文件”->"UTF-8標(biāo)識(shí)",設(shè)置為:“總是刪除簽名”,
然后保存文件,即可以去除BOM標(biāo)簽!
4.PHP以附件形式保存文件的時(shí)候,UTF-8編碼問(wèn)題:
PHP以附件形式保存文件,文件名必須是GB2312編碼,
否則,如果文件名中有中文的話(huà),將是顯示亂碼:
如果你的PHP本身是UTF-8編碼格式的文件,
需要將文件名變量由UTF-8轉(zhuǎn)成GB2312:
iconv("UTF-8", "GB2312", "$filename");
5.截?cái)囡@示文章標(biāo)題時(shí),出現(xiàn)亂碼或者“?”問(wèn)號(hào)的問(wèn)題:
一般文章標(biāo)題很長(zhǎng)的時(shí)候,會(huì)顯示一部分標(biāo)題,會(huì)對(duì)文章標(biāo)題進(jìn)行截?cái)啵?nbsp;
由于一個(gè)UTF-8編碼格式的中文字符會(huì)占用3個(gè)字符寬度,
截取標(biāo)題的時(shí)候,有時(shí)會(huì)只截取到一個(gè)中文字符的1個(gè)字符或2字符寬度,
沒(méi)截取完整,將出現(xiàn)亂碼或“?”問(wèn)號(hào)的情況,
用下面的函數(shù)截取標(biāo)題,就不會(huì)有問(wèn)題:
function get_brief_str($str, $max_length)
{
echo strlen($str) ."<br>";
if(strlen($str) > $max_length)
{
$check_num = 0;
for($i=0; $i < $max_length; $i++)
{
if (ord($str[$i]) > 128)
$check_num++;
}
if($check_num % 3 == 0)
$str = substr($str, 0, $max_length)."...";
else if($check_num % 3 == 1)
$str = substr($str, 0, $max_length + 2)."...";
else if($check_num % 3 == 2)
$str = substr($str, 0, $max_length + 1)."...";
}
return $str;
}
三.MYSQL數(shù)據(jù)庫(kù)使用UTF-8編碼的問(wèn)題
1.用phpmyadmin創(chuàng)建數(shù)據(jù)庫(kù)和數(shù)據(jù)表
創(chuàng)建數(shù)據(jù)庫(kù)的時(shí)候,請(qǐng)將“整理”設(shè)置為:“utf8_general_ci”
或執(zhí)行語(yǔ)句:
CREATE DATABASE `dbname` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
創(chuàng)建數(shù)據(jù)表的時(shí)候:如果是該字段是存放中文的話(huà),則需要將“整理”設(shè)置為:“utf8_general_ci”,
如果該字段是存放英文或數(shù)字的話(huà),默認(rèn)就可以了。
相應(yīng)的SQL語(yǔ)句,例如:
CREATE TABLE `test` (
`id` INT NOT NULL ,
`name` VARCHAR( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE = MYISAM ;
2.用PHP讀寫(xiě)數(shù)據(jù)庫(kù)
在連接數(shù)據(jù)庫(kù)之后:
[hide]$connection = mysql_connect($host_name, $host_user, $host_pass);
加入兩行:
mysql_query("set character set 'utf8'");//讀庫(kù)
mysql_query("set names 'utf8'");//寫(xiě)庫(kù)
就可以正常的讀寫(xiě)MYSQL數(shù)據(jù)庫(kù)了。
四.JS相關(guān)的UTF-8編碼問(wèn)題
1.JS讀Cookie的中文亂碼問(wèn)題
PHP寫(xiě)cookie的時(shí)候需要將中文字符進(jìn)行escape編碼,
否則JS讀到cookie中的中文字符將是亂碼。
但php本身沒(méi)有escape函數(shù),我們新寫(xiě)一個(gè)escape函數(shù):
function escape($str)
{
preg_match_all("/[\x80-\xff].|[\x01-\x7f]+/",$str,$r);
$ar = $r[0];
foreach($ar as $k=>$v)
{
if(ord($v[0]) < 128)
$ar[$k] = rawurlencode($v);
else
$ar[$k] = "%u".bin2hex(iconv("UTF-8","UCS-2",$v));
}
return join("",$ar);
}
JS讀cookie的時(shí)候,用unescape解碼,
然后就解決cookie中有中文亂碼的問(wèn)題了。
2.外部JS文件UTF-8編碼問(wèn)題
當(dāng)一個(gè)HTML頁(yè)面或則PHP頁(yè)面包含一個(gè)外部的JS文件時(shí),
如果HTML頁(yè)面或則PHP頁(yè)面是UTF-8編碼格式的文件,
外部的JS文件同樣要轉(zhuǎn)成UTF-8的文件,
否則將出現(xiàn),沒(méi)有包含不成功,調(diào)用函數(shù)時(shí)沒(méi)有反應(yīng)的情況。
點(diǎn)擊編輯器的菜單:“文件”->“另存為”,可以看到當(dāng)前文件的編碼,確保文件編碼為:UTF-8,
如果是ANSI,需要將編碼改成:UTF-8。
五.FLASH相關(guān)的UTF-8編碼問(wèn)題
FLASH內(nèi)部對(duì)所有字符串,默認(rèn)都是以UTF-8處理
1.FLASH讀文普通本文件(txt,html)
要將文本文件的編碼存為UTF-8
點(diǎn)擊編輯器的菜單:“文件”->“另存為”,可以看到當(dāng)前文件的編碼,確保文件編碼為:UTF-8,
如果是ANSI,需要將編碼改成:UTF-8。
2.FLASH讀XML文件
要將XML文件的編碼存為UTF-8
點(diǎn)擊編輯器的菜單:“文件”->“另存為”,可以看到當(dāng)前文件的編碼,確保文件編碼為:UTF-8,
如果是ANSI,需要將編碼改成:UTF-8。
在XML第1行寫(xiě):
3.FLASH讀PHP返回?cái)?shù)據(jù)
如果PHP編碼本身是UTF-8的,直接echo就可以了
如果PHP編碼本身是GB2312的,可以將PHP轉(zhuǎn)存成UTF-8編碼格式的文件,直接echo就可以了
如果PHP編碼本身是GB2312的,而且不允許改文件的編碼格式,
用下面的語(yǔ)句將字符串轉(zhuǎn)換成UTF-8的編碼格式
$new_str = iconv("GB2312", "UTF-8", "$str");
再echo就可以了
4.FLASH讀數(shù)據(jù)庫(kù)(MYSQL)的數(shù)據(jù)
FLASH要通過(guò)PHP讀取數(shù)據(jù)庫(kù)中的數(shù)據(jù)
PHP本身的編碼不重要,關(guān)鍵是如果數(shù)據(jù)庫(kù)的編碼是GB2312的話(huà),
需要用下面的語(yǔ)句將字符串轉(zhuǎn)換成UTF-8的編碼格式
$new_str = iconv("GB2312", "UTF-8", "$str");
5.FLASH通過(guò)PHP寫(xiě)數(shù)據(jù)
一句話(huà),F(xiàn)LASH傳過(guò)來(lái)的字符串是UTF-8格式的,
要轉(zhuǎn)換成相應(yīng)的編碼格式,再操作(寫(xiě)文件、寫(xiě)數(shù)據(jù)庫(kù)、直接顯示等等)
還是用iconv函數(shù)轉(zhuǎn)換
6.FLASH使用本地編碼(理論上不推薦使用)
如果想讓FLASH不使用UTF-8編碼,而是使用本地編碼
對(duì)于中國(guó)大陸地區(qū)而言,本地編碼是GB2312或GBK
AS程序內(nèi),可以添加以下代碼:
System.useCodepage = true;
那么FLASH內(nèi)所有字符都是使用GB2312的編碼了
所有導(dǎo)入到FLASH或者從FLASH導(dǎo)出的數(shù)據(jù),都應(yīng)該做相應(yīng)的編碼轉(zhuǎn)換
因?yàn)槭褂帽镜鼐幋a,會(huì)造成使用繁體中文地區(qū)的用戶(hù)產(chǎn)生亂碼,所以不推薦使用
用header或meta實(shí)現(xiàn)PHP頁(yè)面編碼的區(qū)別
一、頁(yè)面編碼
1. 使用 <META http-equiv="content-type" content="text/html; charset=xxx"> 標(biāo)簽設(shè)置頁(yè)面編碼
這個(gè)標(biāo)簽的作用是聲明客戶(hù)端的瀏覽器用什么字符集編碼顯示該頁(yè)面,xxx可以為GB2312,GBK,UTF-8(和MySQL不同,MySQL是 UTF8)等等。因此,大部分頁(yè)面可以采用這種方式來(lái)告訴瀏覽器顯示這個(gè)頁(yè)面的時(shí)候采用什么編碼,這樣才不會(huì)造成編碼錯(cuò)誤而產(chǎn)生亂碼。但是有的時(shí)候我們會(huì) 發(fā)現(xiàn)有了這句還是不行,不管xxx是哪一種,瀏覽器采用的始終都是一種編碼,這個(gè)情況我后面會(huì)談到。
請(qǐng)注意,<meta>是屬于html信息的,僅僅是一個(gè)聲明,它起作用表明服務(wù)器已經(jīng)把HTML信息傳到了瀏覽器。
2. header("content-type:text/html; charset=xxx");
這個(gè)函數(shù)header()的作用是把括號(hào)里面的信息發(fā)到http標(biāo)頭。
如果括號(hào)里面的內(nèi)容為文中所說(shuō)那樣,那作用和<META>標(biāo)簽基本相同,大家對(duì)照第一個(gè)看發(fā)現(xiàn)字符都差不多的。但是不同的是如果有這段 函數(shù),瀏覽器就會(huì)永遠(yuǎn)采用你所要求的xxx編碼,絕對(duì)不會(huì)不聽(tīng)話(huà),因此這個(gè)函數(shù)是很有用的。為什么會(huì)這樣呢?那就得說(shuō)說(shuō)HTTPS標(biāo)頭和HTML信息的差 別了:
https標(biāo)頭是服務(wù)器以HTTP協(xié)議傳送HTML信息到瀏覽器前所送出的字串。
因?yàn)閙eta標(biāo)簽是屬于html信息的,所以header()發(fā)送的內(nèi)容先到達(dá)瀏覽器,通俗點(diǎn)就是header()的優(yōu)先級(jí)高于meta(不知道可 不可以這樣講)。加入一個(gè)php頁(yè)面既有header("content-type:text/html; charset=xxx"),又有<META http-equiv="content-type" content="text/html; charset=xxx">,瀏覽器就只認(rèn)前者h(yuǎn)ttp標(biāo)頭而不認(rèn)meta了。當(dāng)然這個(gè)函數(shù)只能在php頁(yè)面內(nèi)使用。
同樣也留有一個(gè)問(wèn)題,為什么前者就絕對(duì)起作用,而后者有時(shí)候就不行呢?這就是接下來(lái)要談的Apache的原因了。
3. AddDefaultCharset
Apache 根目錄的 conf 文件夾里,有整個(gè)Apache的配置文檔httpd.conf。
用文本編輯器打開(kāi)httpd.conf,第708行(不同版本可能不同)有AddDefaultCharset xxx,xxx為編碼名稱(chēng)。這行代碼的意思:設(shè)置整個(gè)服務(wù)器內(nèi)的網(wǎng)頁(yè)文件https標(biāo)頭里的字符集為你默認(rèn)的xxx字符集。有這行,就相當(dāng)于給每個(gè)文件都 加了一行header("content-type:text/html; charset=xxx")。這下就明白為什么明明meta設(shè)置了是utf-8,可瀏覽器始終采用gb2312的原因。
如果網(wǎng)頁(yè)里有header("content-type:text/html; charset=xxx"),就把默認(rèn)的字符集改為你設(shè)置的字符集,所以這個(gè)函數(shù)永遠(yuǎn)有用。如果把AddDefaultCharset xxx前面加個(gè)“#”,注釋掉這句,而且頁(yè)面里不含header("content-type…"),那這個(gè)時(shí)候就輪到meta標(biāo)簽起作用了。
總結(jié):
來(lái)個(gè)排序
header("content-type:text/html; charset=xxx")
AddDefaultCharset xxx
<META http-equiv="content-type" content="text/html; charset=xxx">
如果你是web程序員,給你的每個(gè)頁(yè)面都加個(gè)header("content-type:text/html; charset=xxx"),保證它在任何服務(wù)器都能正確顯示,可移植性強(qiáng)。
至于那句AddDefaultCharset xxx,要不要注釋就仁者見(jiàn)仁了。反正我是注釋掉了,不過(guò)我寫(xiě)頁(yè)子也要寫(xiě)header(),便于放到服務(wù)器上能正常顯示。
二、數(shù)據(jù)庫(kù)編碼
PHP 程序在查詢(xún)數(shù)據(jù)庫(kù)之前,首先執(zhí)行 mysql_query(“SET NAMES xxxx”);其中 xxxx 是你網(wǎng)頁(yè)的編碼(charset=xxxx),如果網(wǎng)頁(yè)中 charset=utf8,則 xxxx=utf8,如果網(wǎng)頁(yè)中 charset=gb2312,則xxxx=gb2312,幾乎所有WEB程序,都有一段連接數(shù)據(jù)庫(kù)的公共代碼,放在一個(gè)文件里,在這文件里,加入 mysql_query(“set names”)就可以了。
SET NAMES 顯示客戶(hù)端發(fā)送的 SQL 語(yǔ)句中使用什么字符集。因此,SET NAMES 'utf-8'語(yǔ)句告訴服務(wù)器“將來(lái)從這個(gè)客戶(hù)端傳來(lái)的信息采用字符集utf-8”。它還為服務(wù)器發(fā)送回客戶(hù)端的結(jié)果指定了字符集。(例如,如果你使用一 個(gè)SELECT語(yǔ)句,它表示列值使用了什么字符集。)
PHP頁(yè)面編碼統(tǒng)一
MySQL數(shù)據(jù)庫(kù)編碼、html頁(yè)面編碼、PHP或html文件本身編碼要全部一致。
1、MySQL數(shù)據(jù)庫(kù)編碼:建立數(shù)據(jù)庫(kù)時(shí)指定編碼(如gbk_chinese_ci),建立數(shù)據(jù)表、建立字段、插入數(shù)據(jù)時(shí)不要指定編碼,會(huì)自動(dòng)繼承數(shù)據(jù)庫(kù)的編碼。
數(shù)據(jù)庫(kù)連接時(shí),也有編碼,可以在連接完數(shù)據(jù)庫(kù)后,執(zhí)行
mysql_query('SET NAMES gbk');//將gbk換成你的編碼,如utf8。
2、html頁(yè)面的編碼,指的是這一行的設(shè)置:
<meta http-equiv="Content-Type" content="text/html; charset=gbk" />
3、PHP或html文件本身的編碼:用editplus打開(kāi)php文件或html文件,另存時(shí),選擇的編碼,如果數(shù)據(jù)庫(kù)和頁(yè)面編碼是gbk,則這兒的編碼選擇ansi;如果數(shù)據(jù)庫(kù)和頁(yè)面編碼是utf-8,則這兒也選擇utf-8。
4、另外要注意的是,Javascript或Flash中傳遞的數(shù)據(jù)是utf-8編碼,如果數(shù)據(jù)庫(kù)和頁(yè)面編碼是gbk,要進(jìn)行轉(zhuǎn)碼,然后寫(xiě)入數(shù)據(jù)庫(kù)。
iconv('utf-8', 'gbk', $content);
5、在PHP程序中,可以加上一行,來(lái)指定PHP源程序的編碼:
header('Content-type: text/html; charset=gbk');
如對(duì)本文有疑問(wèn),請(qǐng)?zhí)峤坏浇涣髡搲瑥V大熱心網(wǎng)友會(huì)為你解答?。?點(diǎn)擊進(jìn)入論壇