连续字符自动换行的解决方案

文本的排版依据语言的不同会有一些格式上的要求,比如简体中文中类似逗号、分号等标点符号不会出现在一行的开头,对于英文来讲就是一个完整单词不会 在两行显示,浏览器会依据类似这样的原则来显示文本。但是由于网页有宽度限制的,连续的超长的字母、数字或标点符号超出其所在区域宽度的限制而导致影响页 面视觉,如例1所示。这个问题在显示用户输入信息时尤为突出,这里就是要说如何解决这个问题。

CSS3草案中,对文本的处理新增了两个新属性word-wrapword-break来解决这个问题:

  1. {word-wrap:break-word;} :依照亚洲语言和非亚洲语言的文本规则,允许在字内换行,且允许非亚洲语言文本行的任意字内断开
  2. {word-break:break-all;} : 内容将在边界内换行,如需要则词内换行(word-break)也行发生

下面是常见浏览器的支持情况:

IE6/7[1] Firefox2/3[2] Opera3+ Safari9.5+/Chrome
{word-wrap:break-word;} td元素需设置其宽度
例4例5
不支持 不支持 不支持td元素
例4例5
{word-break:break-all;} 不支持连续的符号
例3
不支持 不支持 支持
  • [1] 在MSDN的CSS Compatibility and Internet Explorer中可以看出,IE8会像IE6和IE7一样支持word-wrap和word-break这两个属性,但我在IE8beta2上测试来看却不支持这两项,由于IE8还处于beta阶段,且我相信IE8最终会支持的,所以在页头声明<meta content="IE=7" http-equiv="X-UA-Compatible" />使IE8按照IE7来解释页面是一个不错的办法。
  • [2] Firefox3.1将会支持word-wrap属性

由于{word-break:break-all;}导致英文和数字可读性严重下降且无法使连续符号换行,所以{word-wrap:break-word;}是一个相对较好的选择。

但面对浏览器的如此糟糕支持,所以不能不借助JavaScript来解决这个问题,即当浏览器不支持CSS解决方案时,在连续字符串的适当位置插入&#8203;字符(当然还可以用<wbr />和&shy;,这三个字符在浏览器中的支持情况请看ppk的《The wbr tag》),这些字符写在浏览器中不会显示,却使长字符串换行。具体实现代码如下:

function fnBreakWordAll(o){
var o = o || {},
iWord = o.word || 13,
iRe = o.re || '[a-zA-Z0-9]',
bAll = o.all || false,
sClassName = o.className || 'word-break-all',
aEls = o.els || (function(){
var aEls = [],
aAllEls = document.getElementsByTagName('*'),
re = new RegExp('(?:^|\\s+)' + sClassName + '(?:\\s+|$)');
for(var i =0,iLen = aAllEls.length; i < iLen ; ++i){
if(re.test(aAllEls[i].className)){
aEls[aEls.length] = aAllEls[i];
}
}
return aEls;
})() || [],
fnBreakWord = function(oEl){
// 基于http://www.hedgerwow.com/360/dhtml/css-word-break.html修改
if(!oEl || oEl.nodeType !== 1){
return false;
}else if(oEl.currentStyle && typeof oEl.currentStyle.wordWrap==='string'){
breakWord = function(oEl){
oEl.runtimeStyle.wordWrap = 'break-word';
return true;
}
return breakWord(oEl);
}else if(document.createTreeWalker){
var trim = function (str) {
str = str.replace(/^\s\s*/, '');
var ws = /\s/,
i = str.length;
while (ws.test(str.charAt(--i)));
return str.slice(0, i + 1);
}
breakWord = function(oEl){
var dWalker=document.createTreeWalker(oEl,NodeFilter.SHOW_TEXT,null,false);
var node,s,c = String.fromCharCode('8203'),
//re = /([a-zA-Z0-9]{0,13})/;
re = new RegExp('('+ iRe +'{0,' + iWord + '})');
while (dWalker.nextNode()){
node = dWalker.currentNode;
s = trim(node.nodeValue).split(re).join(c);
node.nodeValue = s;
}
return true;
}
return breakWord(oEl);
}
};
for(var i=0,n=aEls.length; i<n; ++i){
var sUa = navigator.userAgent,
sTn = aEls[i].tagName.toLowerCase() ;
if((/Opera/).test(sUa) || (/Firefox/).test(sUa) || ((/KHTML/).test(sUa) &&
(sTn === 'td' || sTn === 'th')) || bAll){
fnBreakWord(aEls[i]);
}
}
}

具体应用请看演示实例

fnWordBreakAll函数提供一些定制参数,使用方法和参数含义如下:

fnWordBreakAll({word:15,re:'[\\w]',all:true});
参数 说明
word 正整数,默认是13 在这个字数内的单词不会被插入\u8203,印象中超过13个字母的单词不多,这可以保证绝大部分单词不会被打碎
re 正则表达式,默认[a-zA-Z0-9] 单词的正则表达式,用以确定一个单词是哪些字符组成,注意\的转义
all 布尔值,默认false 确定是否在所有的浏览器中执行,默认在Opera和Firefox,以及当class应用在th或td的Safari上执行,这个主要用在.word-break-all没有定义时,会对IE加上样式
className 合法class名,默认word-break-all 执行函数的元素对应属性名

这个函数的核心部分修改自Hedger Wang 整理了一个JavaScript解决方案《Cross Browser Word Breaker》,其利用document.createTreeWalker和 split方法给非IE浏览器的每个字符间加入了&#8203;,它用在纯中文文本基本上没有什么问题,但是如果你仔细观察他给出的例子就会发现 文本中有英文或数字时,虽然解决了换行问题,但是使文本难以阅读,且增大了字符间的间距,所以我在此基础上做了上面的改进。

posted @ 2009-03-24 10:22  Fernando  阅读(966)  评论(0编辑  收藏  举报