找回密码
 FreeOZ用户注册
查看: 1781|回复: 31
打印 上一主题 下一主题

[技术问题] UTF8的简体中文版的Discuz6已经有下载

[复制链接]
跳转到指定楼层
1#
发表于 31-5-2008 12:48:39 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
提示: 作者被禁止或删除, 无法发言

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?FreeOZ用户注册

x
UTF8的简体中文版的Discuz6已经有下载,技术员是不是可以考虑升级一下?UTF8提供更好的技术前景和多语言兼容性。

http://comsenz.com/downloads

http://download.comsenz.com/Discuz/6.1.0/Discuz_6.1.0_SC_UTF8.zip

当然如果可以找一个英文界面顺便装上就更完美了。
回复  

使用道具 举报

2#
发表于 1-6-2008 11:47:48 | 只看该作者
因为论坛现在主要是中文和英文,这两种语言编码是完全兼容的,而且GBK和UTF8也是可以一一对应的,而转换编码涉及到数据库的内容编码转换,存在一定风险,所以除非是有更充足的理由需要转换编码,暂时还没有计划切换到UTF8编码。
回复  

使用道具 举报

3#
 楼主| 发表于 1-6-2008 12:08:34 | 只看该作者

回复 #2 ubuntuhk 的帖子

提示: 作者被禁止或删除, 无法发言
那就试验一下嘛,如果数据库转换成功了,就转过来好了。比较啥,整个互联网都没需要更充分的理由,就逐渐的转用UTF8了。
回复  

使用道具 举报

4#
 楼主| 发表于 1-6-2008 12:15:54 | 只看该作者
提示: 作者被禁止或删除, 无法发言
我们公司编一套程序,我负责测试,看了一下网页源代码的中文部分,用的不是UTF8,也不是GBK,而是一串一串的数字!就是在发明UTF8,GBK以前,给西文网页提供的一种显示双字节汉字的方案。
我马上提出了这个问题。我们公司的技术员也说了同样的话,让我举例说明,除非有更明确测理由,他们才会更换编码,我很自豪放弃了。........直到现在,你要是去我们公司的网站,看那个程序部分的超文本源代码,你看到的不是UTF8的汉字,也不是GBK的汉字,而是一串一串的数字。
回复  

使用道具 举报

5#
发表于 1-6-2008 12:31:17 | 只看该作者

回复 #4 xblues 的帖子

呵呵,如果是先html的源码里面,应该是GBK或者UTF8的编码,要是你们公司的技术员有能耐发明出一套符合HTML协议的汉字编码方案,俺就要佩服得五体投地了
回复  

使用道具 举报

6#
发表于 1-6-2008 13:50:14 | 只看该作者

回复 #4 xblues 的帖子

is the numbers looks like
复制代码
回复  

使用道具 举报

7#
 楼主| 发表于 1-6-2008 14:26:53 | 只看该作者

回复 #6 ubuntuhk 的帖子

提示: 作者被禁止或删除, 无法发言
你是这样地。你赶快试试,数据库万一转换成功的话就赶快转了吧,否则我可耍就跟你赖皮了。

局长我想学日语,你教我两句好不好?
回复  

使用道具 举报

8#
发表于 1-6-2008 21:57:02 | 只看该作者
原帖由 xblues 于 1-6-2008 12:15 发表
我们公司编一套程序,我负责测试,看了一下网页源代码的中文部分,用的不是UTF8,也不是GBK,而是一串一串的数字!就是在发明UTF8,GBK以前,给西文网页提供的一种显示双字节汉字的方案。
我马上提出了这个问题。 ...

xblues兄给PM个网址吧,这种我还真没见过。

Discuz的UTF8版不是已经有得下载,而是每个版本都提供UTF8版下载,包括最新版的6.1。但是Xblues兄,我一直有个疑问:经常都听人说未来的趋势是UTF8,除了所谓的SEO分值更高、存储字节不同之外,它究竟有什么好?又好在什么地方?所谓的SEO分值更高,区别能有多大明显(我对此持怀疑态度)。如果它真的那么好,为什么新浪、QQ、21CN、163以及国内大部分网站都采用的GBK编码?

至于Discuz的SEO优化,昨天又看到这样一篇文章,建议开启TAG功能的,大家参考一下,有何高见不妨交流一下。
http://www.ismole.net/viewthread.php?tid=599&page=1#pid1941
回复  

使用道具 举报

9#
发表于 1-6-2008 22:09:09 | 只看该作者
另外,还有一种说法,就是如今的搜索引擎已经越来越智能化,各个搜索引擎网站也在调查自己的策略,比如以前alexa相对偏重于国外网站或UTF8编码,如今这一现象已经有修正,也就是说无论你采用UTF8还是GBK,分值区别都不会太大。以前不能识别动态地址的现象也有了进步,静态地址不再和以前那样占有更多优势。

如果这种情况属实,岂不是用不用UTF8、静态地址都没太大所谓了?

我近来用UTF8编码给论坛搞了个首页(未完全做好),论坛依旧使用GBK,结果发现google的收录数量这段时间一直在下降,而百度不变,不知道是不是跟这个有关系。
回复  

使用道具 举报

10#
 楼主| 发表于 1-6-2008 22:09:32 | 只看该作者

恩,你自己读一下吧

提示: 作者被禁止或删除, 无法发言
  1. option value="526|5613">电流探头</option>
  2.         <option value="526|15922">服务/校准</option>
  3.         <option value="526|13524">高压探头</option>
  4.         <option value="526|13523">固网管理系统</option>

  5.         <option value="526|5441">逻辑分析仪</option>
  6.         <option value="526|5464">频谱分析仪</option>
  7.         <option value="526|5449">其它</option>
  8.         <option value="526|5436">曲线绘图仪</option>
  9.         <option value="526|13535">取样示波器</option>
  10.         <option value="526|15921">任意波形函数发生器(带宽在250MHz以上)</option>
  11.         <option value="526|8360">任意波形函数发生器(带宽在250MHz以上)</option>
  12.         <option value="526|5466">矢量网络分析仪</option>

  13.         <option value="526|13537">矢量信号分析仪</option>
  14.         <option value="526|13530">示波器,10GHz及以上带宽</option>
  15.         <option value="526|13532">示波器,带宽在1GHz和2.5GHz之间带宽</option>
  16.         <option value="526|13531">示波器,带宽在2.5GHz和10GHz之间</option>
  17.         <option value="526|13533">示波器,带宽在300MHz和1GHz之间带宽</option>

  18.         <option value="526|13534">示波器,小于300MHz带宽</option>
  19.         <option value="526|13540">视频图像质量分析仪</option>
  20.         <option value="526|13541">视频远距离监控</option>
  21.         <option value="526|8363">数据定时/脉冲/码型发生器</option>
  22.         <option value="526|13536">通信网络负荷测试系统</option>
  23.         <option value="526|13528">网络管理系统</option>
  24.         <option value="526|13529">下一代视频压缩&#
复制代码
回复  

使用道具 举报

11#
发表于 1-6-2008 22:27:39 | 只看该作者

回复 #8 挖按 的帖子

我也有点怀疑UTF和GBK编码对SEO的分值是否有影响,我认为一个好的搜索引擎,在内部都会正确地识别网页的编码,然后再搜索引擎内部统一转成UTF8来进行处理,而GBK和UTF8是可以一一对应的,所以在搜索引擎内部应该不会存在转换问题。

至于sina、qq、souhu等大站都是使用GBK编码,我想主要是考虑到网页浏览器的兼容性问题,因为国内用户大部分操作平台的默认编码是GBK,如果网页是UTF8,而没有规范地标识编码类型,有些浏览器可能反而不能正确识别而导致乱码。
回复  

使用道具 举报

12#
 楼主| 发表于 1-6-2008 22:28:49 | 只看该作者
提示: 作者被禁止或删除, 无法发言
搜索引擎排名开始侧重于UTF,后来由于很多网站不执行新的标准,所以又不得不照顾老的编码。就等于通用语言是世界语,可以满足全部要求,而大家一定要说本国语言,所以联合国大会就要为每一种语言之间的交流雇佣一个翻译一样。大家都使用一种标准编码,无疑会降低开发和维护成本。

我觉得你最好还是不要在同一个网站里引用两种编码,这样,有时候用户切换页面的时候会显示出错。

UTF包括了所有可能的语言的编码,所以,使用任何一种语言都不是问题,这就是他的最大优势。新浪、QQ、21CN、163的主要用户限于中文用户,当然还在照顾一些老系统,采用了保守方式。对于这些网站来说,技术优势的因素是次要的,多语言也是次要因素。而对于跨国企业的网站,由于需要降低开发成本,内容和开发统一,无一不采用了UTF8的编码。

我觉得选择封闭的编码GBK,还是选择开放的编码UTF8,主要是看你的网站的着眼点了。而解释为什么一定要用UTF8而不是GBK呢,就像要我解释为什么1+1=2一样,我解释不出来。当年XP刚推出的时候,大家都说用不上XP,98更好,每一年就都放弃了98。Vista推出以后,大家还是一样的论调,可最后还不一样抛弃xp。如果仅仅是上网这一目的来看,那windows 95 就够用了。
回复  

使用道具 举报

13#
发表于 1-6-2008 22:37:37 | 只看该作者
原帖由 xblues 于 1-6-2008 20:09 发表
option value="526|5613">电流探头
        服务/校准
        高压探头
        固网管理系统

        逻辑& ...


翻译完毕(其实x兄错怪你们技术员了,他用的就是UTF8编码),看来你们公司是经营电子检测设备的

option value="526|5613"&gt;电流探头
        服务/校准
        高压探头
        固网管理系统

        逻辑分析仪
        频谱分析仪
        其它
        曲线绘图仪
        取样示波器
        任意波形函数发生器(带宽在250MHz以上)
        任意波形函数发生器(带宽在250MHz以上)
        矢量网络分析仪

        矢量信号分析仪
        示波器,10GHz及以上带宽
        示波器,带宽在1GHz和2.5GHz之间带宽
        示波器,带宽在2.5GHz和10GHz之间
        示波器,带宽在300MHz和1GHz之间带宽

        示波器,小于300MHz带宽
        视频图像质量分析仪
        视频远距离监控
        数据定时/脉冲/码型发生器
        通信网络负荷测试系统
        网络管理系统
        下一代视频压缩
回复  

使用道具 举报

14#
发表于 1-6-2008 22:45:43 | 只看该作者

回复 #12 xblues 的帖子

部分认同X兄的观点,对于采用GBK和UTF8,各有各的优点,采用GBK的优点在于网页中的中文文本内容被各种古老的中文字编辑器所兼容,而且与ASCII编码兼容,所以如果网站内容只有中文和英文,就不必刻意追求用UTF8编码,GBK足矣;而UTF8是大一统的编码,对于涉及多国语言的网站是不二选择。

至于SEO的影响因素,我还是认为编码因素是次要的,比如最近FreeOZ在google中的索引页面大幅减少,我查看了一下原因,原来是我设置成只允许archiver内容被索引,其它动态页面和伪静态页面都被我在robots.txt中设置为禁止索引,过了一段时间之后,这个设置对google搜索引擎产生了作用,结果我发现,archiver中的内容无法排在前面(可能是因为archiver的内容没有加重、加亮、字体大小等格式造成)。不过这个设置对baidu还没产生作用,不知道是否因为baidu忽视robots.txt这个文件的设置。
回复  

使用道具 举报

15#
 楼主| 发表于 1-6-2008 22:48:57 | 只看该作者

回复 #14 ubuntuhk 的帖子

提示: 作者被禁止或删除, 无法发言
我现在想要和局长学习日语。请技术员帮忙。
回复  

使用道具 举报

16#
 楼主| 发表于 1-6-2008 22:49:34 | 只看该作者
提示: 作者被禁止或删除, 无法发言
予算と目的に応じたプロモーションが可能です。 パソコンからモバイルまで、特定の商品やサービスを探しているユーザーに、的を絞った広告を掲載することができます。
回复  

使用道具 举报

17#
 楼主| 发表于 1-6-2008 22:52:54 | 只看该作者

还有阿拉伯语

提示: 作者被禁止或删除, 无法发言
وغير عربية او دارسين للغة العربية ، عاملين معا لإهداء الدارس الجاد كل ما يتعلق بشبكة جامعة من المصادر المساعدة لدراسة اللغة العربية ولتقريب المهتمين بمختلف أشكال الثقافة العربية
هنا ستجدون: الدروس ، المنتديات ، الألعاب ، إضافة إلى قاموس ، وكلها موجهة لمساعدة الدارس على تعلم اللغة العربية بشكل مفصل ومتين جميع المستلزمات موفرة مجانا للتحميل بفضل مجهودات أعضائنا مشكورين،ولا نحصل على اية أرباح من أي جزء من هذا الموقع
المرجو دعمنا على إيماننا بأن التعاون بين أفراد بمختلف الإهتمامات ومن مختلف
回复  

使用道具 举报

18#
发表于 1-6-2008 22:54:28 | 只看该作者

回复 #17 xblues 的帖子

哟,我发现FreeOZ对日文和阿拉伯文都支持得这么好啊
回复  

使用道具 举报

19#
 楼主| 发表于 1-6-2008 22:55:22 | 只看该作者
提示: 作者被禁止或删除, 无法发言
兀賴賱丕 賵爻賴賱丕 亘賰賲 賮賷 噩賲毓賷鬲賳丕 貙 賳丨賳 丕賱兀毓囟丕亍 賲賳 賲賳 兀氐賵賱 毓乇亘賷丞 賵睾賷乇 毓乇亘賷丞 丕賵 丿丕乇爻賷賳 賱賱睾丞 丕賱毓乇亘賷丞 貙 毓丕賲賱賷賳 賲毓丕 賱廿賴丿丕亍 丕賱丿丕乇爻 丕賱噩丕丿 賰賱 賲丕 賷鬲毓賱賯 亘卮亘賰丞 噩丕賲毓丞 賲賳 丕賱賲氐丕丿乇 丕賱賲爻丕毓丿丞 賱丿乇丕爻丞 丕賱賱睾丞 丕賱毓乇亘賷丞 賵賱鬲賯乇賷亘 丕賱賲賴鬲賲賷賳 亘賲禺鬲賱賮 兀卮賰丕賱 丕賱孬賯丕賮丞 丕賱毓乇亘賷丞
賴賳丕 爻鬲噩丿賵賳: 丕賱丿乇賵爻 貙 丕賱賲賳鬲丿賷丕鬲 貙 丕賱兀賱毓丕亘 貙 廿囟丕賮丞 廿賱賶 賯丕賲賵爻 貙 賵賰賱賴丕 賲賵噩賴丞 賱賲爻丕毓丿丞 丕賱丿丕乇爻 毓賱賶 鬲毓賱賲 丕賱賱睾丞 丕賱毓乇亘賷丞 亘卮賰賱 賲賮氐賱 賵賲鬲賷賳 噩賲賷毓 丕賱賲爻鬲賱夭賲丕鬲 賲賵賮乇丞 賲噩丕賳丕 賱賱鬲丨賲賷賱 亘賮囟賱 賲噩賴賵丿丕鬲 兀毓囟丕卅賳丕 賲卮賰賵乇賷賳貙賵賱丕 賳丨氐賱 毓賱賶 丕賷丞 兀乇亘丕丨 賲賳 兀賷 噩夭亍 賲賳 賴匕丕 丕賱賲賵賯毓
丕賱賲乇噩賵 丿毓賲賳丕 毓賱賶 廿賷賲丕賳賳丕 亘兀賳 丕賱鬲毓丕賵賳 亘賷賳 兀賮乇丕丿 亘賲禺鬲賱賮 丕賱廿賴鬲賲丕賲丕鬲 賵賲賳 賲禺鬲賱賮 丕賱賲噩鬲賲毓丕鬲 賷賲賰賳 兀賳 賷賰賵賳 賲購孬賿賲賽乇丕 賱賽兀賻亘賿毓賻丿賽
绱犳潗,绱犳潗闆
回复  

使用道具 举报

20#
发表于 1-6-2008 22:57:04 | 只看该作者

回复 #19 xblues 的帖子

貌似古文
回复  

使用道具 举报

21#
 楼主| 发表于 1-6-2008 22:57:26 | 只看该作者

回复 #18 ubuntuhk 的帖子

提示: 作者被禁止或删除, 无法发言
你傻笑啥,快点转换编码去。
回复  

使用道具 举报

22#
发表于 1-6-2008 23:34:02 | 只看该作者

讨论编码我喜欢,呵呵,UTF-8有不少缺点的。。。

1. 变长编码,大部分CJK字符需要3个字节,导致存储空间浪费
2. 编码未考虑字符读音,正则表达式不能应用在UTF-8编码的中文上,但GBK就可以
3. UTF-8在主流的Windows平台上并不是标准编码,而且Unix平台和Windows平台的UTF-8规范有差别(Windows的UTF-8不完全遵守标准)
4. 编码容错能力差(由于变长编码的原因)
5. 同样的程序算法,在处理UTF-8编码上更慢,也是由于变长编码所致,导致搜索,比较,排序,计数等变得比定长编码慢一些(比如统计字符串长度,在定长编码中是O(1),在UTF-8中就不是)
6. 。。。。
当然Unicode是大势所趋,谁也挡不住,但是最终的Unicode编码方案不见得就是UTF-8,其实UTF-16也很有竞争力的,对各种语言也更公平,事实上Windows的底层就是UCS2编码(UTF16的子集)。而UNIX由于历史遗留原因不得不选择了打补丁方式的UTF-8,而非革命性的UTF16。
回复  

使用道具 举报

23#
发表于 2-6-2008 00:28:10 | 只看该作者
原帖由 coredump 于 1-6-2008 23:34 发表
1. 变长编码,大部分CJK字符需要3个字节,导致存储空间浪费
2. 编码未考虑字符读音,正则表达式不能应用在UTF-8编码的中文上,但GBK就可以
3. UTF-8在主流的Windows平台上并不是标准编码,而且Unix平台和Windows平 ...

这个强~综上所述,既然搜索引擎都对旧编码有所照顾了,也能解析动态地址了,俺们用UTF8还是用GBK都没啥所谓啦?那FreeOZ也可以不用转啦。

BTW:X兄用的是google的语言工具吧? 另外,我想你们公司的同事在写网页源码的时候肯定是用了转换工作,否则那么多的文字要一个个去找特殊字符的写法,再Ctrl+C、Ctrl+V,估计会把写源码的人搞崩溃。
回复  

使用道具 举报

24#
发表于 2-6-2008 00:43:10 | 只看该作者
对了,关于网页使用编码,我还有个现象,一直百思不解,请各位打开这个网址为例:
http://para2000.org/wings/manufactures-text.html

默认的网页编码是ISO西欧编码,可以看到正常的布局,每一行四个图标。

如果在IE中点右键,选择UTF8编码,布局不会乱;但是如果选择GB2312,布局马上就变乱了,一行三个图标,第四个被挤到下一行居中显示了!

再请看它的源码,图标部分每一行都是同样的总宽度:660,四个图标的宽度都是相同的160。也就是说它的每一行表格形式都是固定的,即使编码不同,那也只是显示的网页编码不同而已,但底层的源代码都是一样的!即使要乱,也应该是文字显示成乱码,而不应该是网页的布局。有时候类似这种怪现象也是我犹豫要不要换成UTF8的原因,唉。。。
  1. <TABLE BORDER=0>
  2. <TR>
  3. <TD ALIGN="center" VALIGN="middle" WIDTH=660 HEIGHT=48>
  4. <a href="advance/index.html"><img src="advance/logo_s.gif" border="0" width="160" height="27" alt="Advance"></a>
  5. <a href="aerodyne/index.html"><img src="aerodyne/logo_s.gif" border="0" width="160" height="27" alt="Aerodyne"></a>
  6. <a href="aeros/index.html"><img src="aeros/logo_s.gif" border="0" width="160" height="27" alt="Aeros"></a>
  7. <a href="aircross/index.html"><img src="aircross/logo_s.gif" border="0" width="160" height="27" alt="AirCross"></a>
  8. </TD>
  9. </TR>
  10. <TR>
  11. <TD ALIGN="center" VALIGN="middle" WIDTH=660 HEIGHT=48>
  12. <a href="airwave/index.html"><img src="airwave/logo_s.gif" border="0" width="160" height="27" alt="Airwave"></a>
  13. <a href="apco/index.html"><img src="apco/logo_s.gif" border="0" width="160" height="27" alt="Apco"></a>
  14. <a href="axis/index.html"><img src="axis/logo_s.gif" border="0" width="160" height="27" alt="Axis"></a>
  15. <a href="bioair/index.html"><img src="bioair/logo.gif" border="0" width="160" height="27" alt="Bio-Air-Technologies"></a>
  16. </TD>
  17. ......以下基本相同,略过。
复制代码
回复  

使用道具 举报

25#
发表于 2-6-2008 01:04:02 | 只看该作者

回复 #24 挖按 的帖子

你提到的这个问题和什么编码关系不大,你试试用UTF8显示这个页面看看,也是和GBK一样的结果。

我认为,问题的根源在于你的风格设置里面涉及到了宽度不同的字体(你可以试试禁用风格,然后再选择不同的字体来看这个页面的效果):
  1.   <STYLE>
  2.     <!--
  3.     A {text-decoration: none;}
  4.     a:hover {text-decoration: none; color: red; cursor: hand;}
  5.     .titre {font-size: 10pt; color: black; font-family: "Arial, Helvetica"; font-weight: 100}
  6.     .copy   {font-size: 8pt; color: black; font-family: "Arial, Helvetica"; text-align: left; line-height: 1; font-weight: 100}
  7.     .soustitre {font-size: 10pt; color: white; font-family: "Arial, Helvetica"; font-weight: 600}
  8.     .webmaster {font-size: 10pt; color: black; font-family: "Times, Arial, Helvetica"; font-weight: 100}
  9.     -->
  10.   </STYLE>
复制代码
回复  

使用道具 举报

26#
发表于 2-6-2008 01:08:43 | 只看该作者

回复 #22 coredump 的帖子

对,我很赞同老乞丐的观点,UTF8的文字处理软件还存在一些兼容性问题(特别是一些没有考虑到Unicode支持问题的软件),而双字节的GBK编码就基本上没有这些兼容性问题。

还有,为什么现在流行的是UTF8而不是UTF16,其实也是兼容性问题,因为UTF8兼容ASCII编码,而UTF16不兼容ASCII,而且UTF16还存在一个致命的字节顺序问题,这样导致在不同体系结构的计算机之间交换文件或Internet上传输数据就会存在高低字节兼容性问题。

PS,手机上用的也是USC2(UTF16编码)。
回复  

使用道具 举报

27#
 楼主| 发表于 2-6-2008 01:32:18 | 只看该作者
提示: 作者被禁止或删除, 无法发言
你们要气死我呀?
回复  

使用道具 举报

28#
发表于 2-6-2008 01:38:24 | 只看该作者
原帖由 ubuntuhk 于 2-6-2008 01:04 发表
你提到的这个问题和什么编码关系不大,你试试用UTF8显示这个页面看看,也是和GBK一样的结果。
我认为,问题的根源在于你的风格设置里面涉及到了宽度不同的字体(你可以试试禁用风格,然后再选择不同的字体来看这个 ...

我用的是XP默认的IE6,UTF8和默认的原ISO编码显示一样,用GBK就变乱了。我也估计问题可能是出在CSS上,研究中。。。
回复  

使用道具 举报

29#
发表于 2-6-2008 01:42:27 | 只看该作者

回复 #28 挖按 的帖子

我是用FF3看的,UTF8和GBK的效果一样,都是4列的图标变成3列了。

还有个别西欧字符只能用西文编码查看,用UTF8和GBK都显示不正常。
回复  

使用道具 举报

30#
发表于 2-6-2008 01:48:04 | 只看该作者

回复 #27 xblues 的帖子

呵呵,虽然说UTF8有一些缺点,但是毕竟是一个潮流和趋势,有空的时候,我还是会试试的。
回复  

使用道具 举报

您需要登录后才可以回帖 登录 | FreeOZ用户注册

本版积分规则

小黑屋|手机版|Archiver|FreeOZ论坛

GMT+10, 28-4-2024 19:42 , Processed in 0.064878 second(s), 45 queries , Gzip On, Redis On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表