自动生成文章摘要[JavaScript 版本]
By dknt From bbs.blueidea.com
搜了搜这个,发现找不到答案。所以自己写了一个,很多程序绕过这个问题,往往人工来决定在何处截断,太麻烦了。
实现内容:截断一段含有HTML代码的文本,但是不会出现围堵标记没有封闭的问题。
一个PHP版本的在这里!:自动生成文章摘要[PHP版本]。
function Generate_Brief(text,length){
if(text.length < length) return text;
var Foremost = text.substr(0,length);
var re = /<(\/?)(BODY|SCRIPT|P|DIV|H1|H2|H3|H4|H5|H6|ADDRESS|PRE|TABLE|TR|TD|TH|INPUT|SELECT|TEXTAREA|OBJECT|A|UL|OL|LI|BASE|META|LINK|HR|BR|PARAM|IMG|AREA|INPUT|SPAN)[^>]*(>?)/ig;
var Singlable = /BASE|META|LINK|HR|BR|PARAM|IMG|AREA|INPUT/i
var Stack = new Array(), posStack = new Array();
while(true){
var newone = re.exec(Foremost);
if(newone == null) break;
if(newone[1] == ""){
var Elem = newone[2];
if(Elem.match(Singlable) && newone[3]!= ""){
continue;
}
Stack.push(newone[2].toUpperCase());
posStack.push(newone.index);
if(newone[3] == "") break;
}else{
var StackTop = Stack[Stack.length-1];
var End = newone[2].toUpperCase();
if(StackTop == End){
Stack.pop();
posStack.pop();
if(newone[3] == ""){
Foremost = Foremost+">";
}
}
};
}
var cutpos = posStack.shift();
Foremost = Foremost.substring(0,cutpos);
return Foremost;
}
测试用例如下:
[input] truncate as charactors
本文的任何文字和图片都不容许以任何方式转载,违者将诉诸法律手段处理!!!请严肃对待!
;
这位是娃娃,他是我弟弟。是一只很酷又非常可爱的小狗。
他今年已经两岁了,虽然个头很小,但是气势一点也不逊色大狗。非常敢于同恶势力作斗争
娃娃的显著特点就是可爱,尤其是把耳朵背在后面的时候显得特别可爱,仿佛一只乖巧的小猫咪。他还会站起来跳舞,比如你要给他什么好吃的时候他就会这样做。毕竟这是他的一种赖以谋生的工作方式,这年头,不会点技术能有饭吃吗。
他还有一个特点就是很酷,尽管我们是兄弟,但是他从来没有巴结我们人类的臭毛病。午后,当灿烂的阳光透过窗子照射进来,娃娃会自己找到合适的位置,趴在地板上,让光束尽情地抚摸他。他的卧姿是那么的安详而威严,仿佛一位神圣的诗人,颔轻轻的抬起望着窗外陷入无尽的沉思,眼中闪耀着圣徒般的光芒。当你轻轻的从他身边走过,他会悠闲的转过头来看看你,用一种冷漠而平静的眼光,然后又将头转向原来的方向,颔再次轻轻的抬起,沉浸着,迷恋着...
他是那么可怜,作为一个温室小狗他每天只能呆在家里睡觉或者淘气。他的生活是那么的空洞,那么的乏味,那么的无奈。因为智力的问题,他经常做一些傻事,也常常直接或间接的伤到自己(直接就是吃了大东西卡住嗓子之类的,间接就是到处撒尿被我收拾了)。但是这又能怨他吗?他又不是自己想那么傻的。智商不高是上天决定的,他也控制不了的。娃娃是那么的傻,一只纯粹的傻狗,我终究没能教会他C语言编程。
娃娃是讲义气而且很重感情的,当你伤心的时候他会缓缓走过你身边,他用那种关怀的眼神看着你,仿佛在用墨西哥语说"What can I do for you?"。当你在将要离开家的前一个晚上,他又会走到你的床前,你把他抱起来,他会眼泪汪汪的看着你,饱含深情让你久久不能入睡
傻娃娃,现在不在我身边了,我很想念他。
下面是傻娃娃的表情SHOW!!!
举头望明月
"哼,为什么欺负我,讨厌"
"呀,惨了,这下可怎么办啊,下不去了..."
"唉,愁啊,真没办法."
"呜呜,我好可怜啊,放了我吧,我都要哭了,好伤感阿..."
"喂!怎么的你!跟你说话没听着啊!"
"呵,小样的,你活腻歪了吧!"
"嘿!我是凶恶的大老虎!"
[briefing]
function Do(){
var sOriginal = HtmlDecode(document.getElementById("Original").innerHTML);
var iLength = parseInt(document.getElementById("Length").value);
if(isNaN(iLength) || iLength]*(>?)/ig;
var Singlable = /BASE|META|LINK|HR|BR|PARAM|IMG|AREA|INPUT/i
var Stack = new Array(), posStack = new Array();
while(true){
var newone = re.exec(Foremost);
if(newone == null) break;
if(newone[1] == ""){
var Elem = newone[2];
if(Elem.match(Singlable) && newone[3]!= ""){
continue;
}
Stack.push(newone[2].toUpperCase());
posStack.push(newone.index);
if(newone[3] == "") break;
}else{
var StackTop = Stack[Stack.length-1];
var End = newone[2].toUpperCase();
if(StackTop == End){
Stack.pop();
posStack.pop();
if(newone[3] == ""){
Foremost = Foremost+">";
}
}
};
}
var cutpos = posStack.shift();
Foremost = Foremost.substring(0,cutpos);
return Foremost;
}
[Ctrl+A 全选 注:如需引入外部Js需刷新才能执行]
这个测试用例应该是好使,如果不行,请在纯IE下打开本页面。
主要问题是文章不能超过20000字,还差一个 HTMLencode, HTMLdecode 没有写进去。没办法只好嵌入了。
HTMLencode, HTMLdecode 在 http://cs02.100steps.net/new/onejsneeded.js 定义。不是我写的,如果需要自己去拿吧。
我的空间速度对大家来说可能会比较慢,那我也没办法了...