去html代码的正则 推荐
'==================================================
'函数名:ScriptHtml
'作 用:过滤html标记
'参 数:ConStr ------ 要过滤的字符串
'==================================================
Function ScriptHtml(Byval ConStr,TagName,FType)
Dim Re
Set Re=new RegExp
Re.IgnoreCase =true
Re.Global=True
Select Case FType
Case 1
Re.Pattern="<" & TagName & "([^>])*>"
ConStr=Re.Replace(ConStr,"")
Case 2
Re.Pattern="<" & TagName & "([^>])*>.*?</" & TagName & "([^>])*>"
ConStr=Re.Replace(ConStr,"")
Case 3
Re.Pattern="<" & TagName & "([^>])*>"
ConStr=Re.Replace(ConStr,"")
Re.Pattern="</" & TagName & "([^>])*>"
ConStr=Re.Replace(ConStr,"")
End Select
ScriptHtml=ConStr
Set Re=Nothing
End Function
1 content=ScriptHtml(content,"br",1) ‘去掉所有<br>HTML标记
2 content=ScriptHtml(content,"a",2) ‘去掉所有<a></a>和两个标记之间的内容
如 <a href=www.126.com>www.126.com</a> 把这一段全去了
3 content=ScriptHtml(content,"td",3) ‘去掉<td>和</td>HTML标记
如 <td>士大夫撒</td> 把<td> </td> 去掉了 但士大夫撒还保留
依次类推把其他HTML标记都过滤了 div objdect什么的 自己看吧