C#网站生成静态页面的实例讲解

在一些需要经常更新页面数据的网站中,一般访问量不是很大的都直接发布的是带后台代码,每次访问都是有数据库交互的。但是一旦访问量增加了,那么这些服务器开销变成本就要考虑进来了,像一些文章,后台编辑后,文章内容存入数据库,如果1000人访问,如果还是每次取数据库,那这1000次的io访问就显得比较大了,一个好的方法就是,文章确定之后,做成静态页面,而这个做的方法由程序来做,就是递归遍历整个网站,将网站内容都访问一遍,然后生成这些页面的静态文本页面,在将这些页面发布,这样对浏览者而言,他看到的还是同一个地址,同一份文章,只是这份是静态的而言。这样就提升了网站的效率节约了资源;

下面附上一份C#遍历网站内容,然后生成内容页面代码:

private ArrayList htmlCreatedList = new ArrayList();
    /// <summary>
    /// 递归实现页面静态化功能
    /// </summary>
    /// <param name="urlString">要访问的页面链接地址</param>
    public void SaveHtmlCode(string urlString)
    {
      if (htmlCreatedList.Contains(urlString))
      {
        return;
      }
      string htmlCode = GetHtmlCodeFromUrl(urlString);
      string htmlPath = urlString.ToPhysicalPath();
      string direcHtmlPath = Path.GetDirectoryName(htmlPath);
      if (!Directory.Exists(direcHtmlPath))
      {
        Directory.CreateDirectory(direcHtmlPath);
      }
      File.WriteAllText(htmlPath, htmlCode);
      htmlCreatedList.Add(urlString);
      var urlList = GetUrlLinkFromHtmlCode(htmlCode);
      string urlTemp = string.Empty;
      foreach (string url in urlList)
      {
        urlTemp = url;
        urlTemp = Regex.Replace(urlTemp, "href\\s*=\\s*", "");
        urlTemp = urlTemp.Replace("\"", "");
        urlTemp = urlTemp.Replace("\\", "/");
        urlTemp = WebConfigInfo.UrlPrefix + urlTemp;
        SaveHtmlCode(urlTemp);
      }
    }
    /// <summary>
    /// 通过HttpWebRequest页面链接的html代码
    /// </summary>
    /// <param name="urlString">页面链接地址</param>
    /// <returns>页面链接对应的html代码</returns>
    private string GetHtmlCodeFromUrl(string urlString)
    {
      HttpWebRequest hwRequest = (HttpWebRequest)WebRequest.Create(urlString);
      hwRequest.UserAgent = "User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705";
      hwRequest.Accept = "*/*";
      hwRequest.KeepAlive = true;
      hwRequest.Headers.Add("Accept-Language", "zh-cn,en-us;q=0.5");
      HttpWebResponse hwResponse = (HttpWebResponse)hwRequest.GetResponse();
      Stream streamResponse = hwResponse.GetResponseStream();
      StreamReader readerOfStream = new StreamReader(streamResponse, System.Text.Encoding.GetEncoding("utf-8"));
      string strHtml = readerOfStream.ReadToEnd();
      readerOfStream.Close();
      streamResponse.Close();
      hwResponse.Close();
      return strHtml;
    }
    ///<summary>
    ///正则表达式匹配出html代码中的超链接
    ///</summary>
    ///<param name="htmlCode">要找出超链接的html代码</param>
    ///<returns></returns>
    private IEnumerable<string> GetUrlLinkFromHtmlCode(string htmlCode)
    {
      string strRegex = "href\\s*=\\s*(?:[\"'](?<1>[^\"'.#:]*)[\"'])";
      Regex r = new Regex(strRegex, RegexOptions.IgnoreCase);
      MatchCollection ms = r.Matches(htmlCode);
      IEnumerable<string> listUrl = from Match cc in ms select cc.ToString().Replace("&", "&");
      return listUrl.Distinct();
    }
  }

给string 扩展了一个方法。

public static string ToPhysicalPath(this string urlString)
    {
      System.Uri uri = new System.Uri(urlString);
      string htmlPath = string.Format("{0}\\Html\\{1}\\", System.Web.HttpContext.Current.Request.PhysicalApplicationPath, uri.AbsolutePath);
      string[] querys = uri.Query.Split(new char[] { '?', '&', '=' }, StringSplitOptions.RemoveEmptyEntries);
      htmlPath += string.Join(string.Empty, querys);
      htmlPath += querys.Length.Equals(0) ? "Index.html" : ".html";
      htmlPath = htmlPath.Replace("/", "\\");
      htmlPath = htmlPath.Replace("\\\\", "\\");
      return htmlPath;
    }

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对我们的支持。如果你想了解更多相关内容请查看下面相关链接

(0)

相关推荐

  • C#引用类型和值类型的适用场合和区别

    1.值类型 值类型包括:数值类型,结构体,bool型,用户定义的结构体,枚举,可空类型. 值类型的变量直接存储数据,分配在托管栈中.变量会在创建它们的方法返回时自动释放. 所有的值类型都是密封(seal)的,所以无法派生出新的值类型. 2.引用类型 引用类型包括:数组,用户定义的类.接口.委托,object,字符串,null类型,类. 引用类型的变量持有的是数据的引用,数据存储在数据堆,分配在托管堆中,变量并不会在创建它们的方法结束时释放内存,它们所占用的内存会被CLR中的垃圾回收机制释放. C

  • C#将Excel转成PDF的方法

    PS:公司的业务中有个超级大的作业就是把OFFICE文档转成PDF,我猜之前没程序猿们,公司那些人应该是一个个手动转.强烈为猿们感叹,帮你们做了这么多事,还在那抱怨....无法满足你们的需求啊: 微软net平台提供了对Office文档非常好的支持:其中有com组件直接集成到了VS中.利用这些API可以快速的免去N多繁琐的工作: 以下代码是翻阅了公司的代码,一个个敲出来的:奉上代码: using System; using System.Collections.Generic; using Sys

  • c#操作mongodb插入数据效率

    mongodb的数据插入速度是其一个亮点,同样的10000条数据,插入的速度要比Mysql和sqlserver都要快,当然这也是要看使用者怎么个使用法,你代码如果10000次写入使用10000次连接,那也是比不过其他数据库使用事务一次性提交的速度的. 同样,mongo也提供的一次性插入巨量数据的方法,因为mongodb没有事务这回事,所以在在C#驱动里,具体方法是InsertManyAsync()一次性插入多个文档.与之对应的是InsertOneAsync,这个是一次插入一个文档: Insert

  • C#实现QQ邮箱发送邮件

    闲着蛋疼.计划着改善公司的邮件服务.怎料公司网络封闭的太厉害了.我只能在家里利用开放点的网络来测试发送邮件: 利用qq邮箱发送到公司的企业邮箱上: 前提准备,登陆qq邮箱开启stmp服务.不开启的话没法通过代码登陆到你的邮箱: 查询腾讯qq邮箱的smtp主机地址为:smtp.qq.com  端口是587,或者465 using System; using System.Collections.Generic; using System.Linq; using System.Text; using

  • C#将PPT文件转换成PDF文件

    这里在提供C#代码,将PPT转成PDF.直接上代码: 要引入Microsoft.Office.Interop.PowerPoint; 版本12.0.0.0: using System; using System.Collections.Generic; using System.IO; using System.Linq; using System.Text; using System.Runtime.InteropServices; using Microsoft.Office.Interop

  • C#用委托BeginInvoke做异步线程

    一个应用场景,浏览器上传一个文件,此文件后台调用文件转换,需要耗费相当长的时间,这样,如果是一个线程同步式的做下去,那么用户在浏览器上感觉就是卡住了,卡卡卡卡,这里我们利用委托的BeginInvoke和EndInvoke方法操作线程,BeginInvoke方法可以使用线程异步地执行委托所指向的方法.然后通过EndInvoke方法获得方法的返回值(EndInvoke方法的返回值就是被调用方法的返回值),或是确定方法已经被成功调用,说白了就是相当于开个多线程,你用户文件保存了之后,响应返回,这个Be

  • C#实现Word转为PDF的方法

    这里主要提供一种将word文档转成PDF文档的实现: 具体实现看c#代码:要引入Microsoft.Office.Interop.Word;版本12.0.0.0 using System; using System.Collections.Generic; using System.IO; using System.Linq; using System.Text; using System.Runtime.InteropServices; using Microsoft.Office.Inter

  • C#自动类型转换与强制类型转换的讲解

    自动类型转换 隐式类型转换 - 这些转换是 C# 默认的以安全方式进行的转换, 不会导致数据丢失.例如,从小的整数类型转换为大的整数类型,从派生类转换为基类. 转换规则 从存储范围小的类型到存储范围大的类型. 整数具体规则为: byte→short(char)→int→long→float→double 也就是说byte类型的变量可以自动转换为short类型,示例代码: byte b = 10; short sh = b; 在类型转换时可以跳跃.示例代码: byte b1 = 100; int

  • mongodb使用c#驱动数据插入demo

    Mongodb提供了多种开发语言的驱动,java,python,c++,c# 等,这里选用c#驱动作为测试: 首先上mongo官网下载驱动.Ps:官方网站经常连接不顺利. 还不如直接在vs的nuget管理包中搜索mongoDB.driver. 需要引入的命名空间: using MongoDB.Bson; using MongoDB.Driver; Driver是驱动核心,Bson是和数据格式相关的: 定义一个mongo客户端,一个mongodb,一个数据集合: protected staticI

  • C#后台调用前台JS函数方法

    总结了公司其他人的一些C#后台调用前台的方法: 方法一: 假设前台页面的JS脚本标签中有如下函数: <script> function A() { alert("hello word!"); } </script> 那么在这个页面的后台代码可以这样去实现在C#后台调用前台这个A()函数: 首先在前台拖放一个ItlResult控件id=itlResult; 然后在c# 后台代码中这样调用: itlResult.Text ="<script lang

随机推荐