大型门户网站实现的十四大技术小结

一、全文搜索
Lecene框架 <基于LUCENE的搜索引擎研究与实现>
二、缓存
实现页面级的URL缓存 <基于网络爬虫的有效URL缓存>
三、生成静态文件
比如说,一个首页可能会员由多个部分组成,每个模块生成一个静态文件,然后才用服务器端包含SSI技术进行组装,其默认的后缀是.shtml
四、静态文件分布存储于独立的服务器
CSS,JS,图片,文件等,用一个Apache服务器来处理请求
五、分布式开发
各服务器间的数据同步,像新浪一样发区域的服务器数据的同步;便于使用服务器的集成,服务器可分为:WEB服务器、Session服务器、数据库服务器、静态文件服务器等等,一个WEB服务就可能由几十台机器集成后共同提供服务,负载均衡器的使用
六、数据库的拆分
数据库表的拆分和数据库表字段的拆分
七、搜索引擎优化
SEO
八、访问监控
JMS
九、单元测试,高并发访问测试
十、开发文档的制作
E-R图,类关系图,需求说明书,详细设计说明书,数据字典等E-R图
  E-RE-R图也即实体-联系图(Entity Relationship Diagram),提供了表示实体型、属性和联系的方法,用来描述现实世界的概念模型。  E-R方法:是“实体-联系方法”(Entity-Relationship Approach)的简称。它是描述现实世界概念结构模型的有效方法。  构成E-R图的基本要素是实体型、属性和联系,其表示方法为:  · 实体型(Entity):具有相同属性的实体具有相同的特征和性质,用实体名及其属性名集合来抽象和刻画同类实体;在E-R图中用矩形表示,矩形框内写明实体名;比如学生张三丰、学生李寻欢都是实体。如果是弱实体的话,在矩形外面再套实线矩形。  · 属性(Attribute):实体所具有的某一特性,一个实体可由若干个属性来刻画。在E-R图中用椭圆形表示,并用无向边将其与相应的实体连接起来;比如学生的姓名、学号、性别、都是属性。如果是多值属性的话,再椭圆形外面再套实线椭圆。如果是派生属性则用虚线椭圆表示。  · 联系(Relationship):联系也称关系,信息世界中反映实体内部或实体之间的联系。实体内部的联系通常是指组成实体的各属性之间的联系;实体之间的联系通常是指不同实体集之间的联系。在E-R图中用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1 : 1,1 : n或m : n)。 比如老师给学生授课存在授课关系,学生选课存在选课关系。如果是弱实体的联系则在菱形外面再套菱形。作E-R图的步骤:
   ⑴确定所有的实体集合  ⑵选择实体集应包含的属性  ⑶确定实体集之间的联系  ⑷确定实体集的关键字,用下划线在属性上表明关键字的属性组合  ⑸确定联系的类型,在用线将表示联系的菱形框联系到实体集时,在线旁注明是1或n(多)来表示联系的类型
十一、动态部署
Ant等工具的使用
十二、表单提交验证
客户端验证和服务器端验证,有一点要注意和说明的是:通过服务器端验证失败后,要返回到客户表单提交前的页,并把客户提交前输入所有的信息显示出来,提示客户出错的地方以便其进行修改。最好是可以定义一些全局的验证规则,如果E-mail的验证
十三、AJAX异步调用技术的使用
遮罩层的使用,应用于部分数据的验证如果登录名,加载等待信息的提示
十四、各项数据的备份
有独立的备份服务器,做到数据的同步备份

(0)

相关推荐

  • 大型门户网站实现的十四大技术小结

    一.全文搜索 Lecene框架 <基于LUCENE的搜索引擎研究与实现> 二.缓存 实现页面级的URL缓存 <基于网络爬虫的有效URL缓存> 三.生成静态文件 比如说,一个首页可能会员由多个部分组成,每个模块生成一个静态文件,然后才用服务器端包含SSI技术进行组装,其默认的后缀是.shtml 四.静态文件分布存储于独立的服务器 CSS,JS,图片,文件等,用一个Apache服务器来处理请求 五.分布式开发 各服务器间的数据同步,像新浪一样发区域的服务器数据的同步:便于使用服务器的集

  • Oracle Portal及其门户网站开发概述

    正在看的ORACLE教程是:Oracle Portal及其门户网站开发概述.摘要: Portal是IT领域的新技术,是企业信息化工作的发展方向之一.本文首先介绍了Oracle Portal的定义.特点,接着阐述了portal的体系结构.随后本文介绍了Oracle9iAS Portal的功能特点及基于它的企业门户网站的开发.最后本文简要探讨了基于portal的门户网站开发的问题. 关键词: oracle portal,门户,网站,信息入口,企业入口 引言 Oracle Portal为企业提供了一个

  • Apache 防盗链的技术小结

    一. 遭遇图片盗链 个人网站使用的是国外付费空间,有流量限制.今天是 2007.03.29,收到主机商的通知邮件,提醒我本月的流量即将超出配额.--超出流量,就要向万恶的美帝资本家交银子,吓我一跳,平常网站的流量根本使用不完,马上查看 awstats 的日志分析,没有发现什么异常.于是把 access log 日志拉下来,用逆火网站日志分析器检查了一下站点盗链情况,发现本站的 深圳高交会之神州龙芯 CPU 映象记[图文] 以及 香港2005年春季行(3) - 庙街风光等原创文章中的图片,被许多网

  • JS+CSS实现的日本门户网站经典选项卡导航效果

    本文实例讲述了JS+CSS实现的日本门户网站经典选项卡导航效果.分享给大家供大家参考.具体如下: 这里介绍的是来自日本门户网站的一款CSS+JavaScript选项卡导航菜单,银灰色风格,看来日本人和中国人的审美是接近的,都喜欢这种风格,如果你要用的话,直接拷贝代码部分到你的网页中,注意你需要修改编码才行,日本的编码和中国可是不一样哦,只要把文字改为中国的就行了. 运行效果截图如下: 在线演示地址如下: http://demo.jb51.net/js/2015/js-css-japan-web-

  • 网站的反采集技术

    网站的反采集技术 前一段时间同几个朋友聊起内容采集的事情,因为我从未涉足这个领域,就自以为可以找到一个方法来反采集,经过一段时间的研究,似乎是有办法做到的,不是说完全阻止采集,而是让采集的成本变高,或者让采集后的内容无法使用,或者说采集后的内容要花很多人工来分析,过滤. 下面的方法,转自别人的文章,作者:翟振恺(小琦),我摘录了反采集的部分内容. 一.分页文件名规则防采集对策 大部分采集器都是靠分析分页文件名规则,进行批量.多页采集的.如果别人找不出你的分页文件的文件名规则,那么别人就无法对你的

  • python爬取新闻门户网站的示例

    项目地址: https://github.com/Python3Spiders/AllNewsSpider 如何使用 每个文件夹下的代码就是对应平台的新闻爬虫 py 文件直接运行 pyd 文件需要,假设为 pengpai_news_spider.pyd 将 pyd 文件下载到本地,新建项目,把 pyd 文件放进去 项目根目录下新建 runner.py,写入以下代码即可运行并抓取 import pengpai_news_spider pengpai_news_spider.main() 示例代码

  • ASP网站生成静态html页面技术小结

    生成HTML方法主要步骤只有两个: 一.获取要生成的html文件的内容  二.将获取的html文件内容保存为html文件 我在这里主要说明的只是第一步:如何获取要生成的html文件的内容:  目前常用获取html文件的内容的方法有以下几种: 1. str="<html标记>内容</html标记>"  str=str&"<html标记>内容</html标记><html标记>数据库读取内容....</htm

  • 门户网站构建CSS框架的规则

    第一部:关于构建CSS框架我们要实现的目的: 1.实现标准化,具备主流平台适应性的前端实现: 2.快速开发,在站点风格确定后,前端不应该成为整个项目里瓶颈: 3.重构的需求,尽可能的让类和区块样式可重用: 4.分离结构和表现的需求,遵守了语义化结构的约定; 5.构架完全符合金融网特色的CSS框架. 6.对代码进行必要的搜索引擎优化. 第二部:关于CSS命名的一些约定: 1.不使用大写形式的类名和id名; 2.尽可能使用描述性的英文单词的组合作为类名和id名; 3.id名及类名的多个英文单词之间使

  • PHP 程序员的调试技术小结

    本文介绍调试 PHP 应用程序的各种方法,包括在 Apache and PHP 中打开错误报告,以及通过在一个简单的 PHP 脚本中放置策略性的 print 语句,找到更困难的 bug 的源头.还会介绍用于 Eclipse 的 PHPEclipse 插件,这是一个灵活的开发环境,具有实时语法解析能力,还会介绍 PHPEclipse 的 DBG 调试器扩展. 简介 有许多 PHP 调试技术可以在编码的时候节约大量时间.一个有效却很基本的调试技术就是打开错误报告.另一个略微高级一点的技术包括使用 p

  • 构建Vue大型应用的10个最佳实践(小结)

    这些是我构建大型Vue项目得出的最佳实践,这些技巧将帮助你更高效的编码,并且使其更容易维护和协作. 在我今年的自由职业生涯中我有幸开发了一些大型Vue程序.我所说的这些项目使用了大量Vuex stores

随机推荐