大型门户网站实现的十四大技术小结

2025-03-28 13:37:25

一、全文搜索
Lecene框架 <基于LUCENE的搜索引擎研究与实现>
二、缓存
实现页面级的URL缓存 <基于网络爬虫的有效URL缓存>
三、生成静态文件
比如说，一个首页可能会员由多个部分组成，每个模块生成一个静态文件，然后才用服务器端包含SSI技术进行组装，其默认的后缀是.shtml
四、静态文件分布存储于独立的服务器
CSS，JS，图片，文件等，用一个Apache服务器来处理请求
五、分布式开发
各服务器间的数据同步，像新浪一样发区域的服务器数据的同步；便于使用服务器的集成，服务器可分为：WEB服务器、Session服务器、数据库服务器、静态文件服务器等等，一个WEB服务就可能由几十台机器集成后共同提供服务，负载均衡器的使用
六、数据库的拆分
数据库表的拆分和数据库表字段的拆分
七、搜索引擎优化
SEO
八、访问监控
JMS
九、单元测试，高并发访问测试
十、开发文档的制作
E-R图，类关系图，需求说明书，详细设计说明书，数据字典等E-R图
　　E-RE-R图也即实体-联系图(Entity Relationship Diagram)，提供了表示实体型、属性和联系的方法，用来描述现实世界的概念模型。　　E-R方法:是“实体-联系方法”（Entity-Relationship Approach）的简称。它是描述现实世界概念结构模型的有效方法。　　构成E-R图的基本要素是实体型、属性和联系，其表示方法为：　　· 实体型(Entity)：具有相同属性的实体具有相同的特征和性质，用实体名及其属性名集合来抽象和刻画同类实体;在E-R图中用矩形表示，矩形框内写明实体名；比如学生张三丰、学生李寻欢都是实体。如果是弱实体的话，在矩形外面再套实线矩形。　　· 属性(Attribute)：实体所具有的某一特性，一个实体可由若干个属性来刻画。在E-R图中用椭圆形表示，并用无向边将其与相应的实体连接起来；比如学生的姓名、学号、性别、都是属性。如果是多值属性的话，再椭圆形外面再套实线椭圆。如果是派生属性则用虚线椭圆表示。　　· 联系(Relationship)：联系也称关系，信息世界中反映实体内部或实体之间的联系。实体内部的联系通常是指组成实体的各属性之间的联系；实体之间的联系通常是指不同实体集之间的联系。在E-R图中用菱形表示，菱形框内写明联系名，并用无向边分别与有关实体连接起来，同时在无向边旁标上联系的类型（1 : 1，1 : n或m : n）。比如老师给学生授课存在授课关系，学生选课存在选课关系。如果是弱实体的联系则在菱形外面再套菱形。作E-R图的步骤：
　　　⑴确定所有的实体集合　　⑵选择实体集应包含的属性　　⑶确定实体集之间的联系　　⑷确定实体集的关键字，用下划线在属性上表明关键字的属性组合　　⑸确定联系的类型，在用线将表示联系的菱形框联系到实体集时，在线旁注明是1或n(多）来表示联系的类型
十一、动态部署
Ant等工具的使用
十二、表单提交验证
客户端验证和服务器端验证，有一点要注意和说明的是：通过服务器端验证失败后，要返回到客户表单提交前的页，并把客户提交前输入所有的信息显示出来，提示客户出错的地方以便其进行修改。最好是可以定义一些全局的验证规则，如果E-mail的验证
十三、AJAX异步调用技术的使用
遮罩层的使用，应用于部分数据的验证如果登录名，加载等待信息的提示
十四、各项数据的备份
有独立的备份服务器，做到数据的同步备份

大型门户网站实现的十四大技术小结

一.全文搜索 Lecene框架 <基于LUCENE的搜索引擎研究与实现> 二.缓存实现页面级的URL缓存 <基于网络爬虫的有效URL缓存> 三.生成静态文件比如说,一个首页可能会员由多个部分组成,每个模块生成一个静态文件,然后才用服务器端包含SSI技术进行组装,其默认的后缀是.shtml 四.静态文件分布存储于独立的服务器 CSS,JS,图片,文件等,用一个Apache服务器来处理请求五.分布式开发各服务器间的数据同步,像新浪一样发区域的服务器数据的同步:便于使用服务器的集
Oracle Portal及其门户网站开发概述

正在看的ORACLE教程是:Oracle Portal及其门户网站开发概述.摘要: Portal是IT领域的新技术,是企业信息化工作的发展方向之一.本文首先介绍了Oracle Portal的定义.特点,接着阐述了portal的体系结构.随后本文介绍了Oracle9iAS Portal的功能特点及基于它的企业门户网站的开发.最后本文简要探讨了基于portal的门户网站开发的问题. 关键词: oracle portal,门户,网站,信息入口,企业入口引言 Oracle Portal为企业提供了一个
Apache 防盗链的技术小结

一. 遭遇图片盗链个人网站使用的是国外付费空间,有流量限制.今天是 2007.03.29,收到主机商的通知邮件,提醒我本月的流量即将超出配额.--超出流量,就要向万恶的美帝资本家交银子,吓我一跳,平常网站的流量根本使用不完,马上查看 awstats 的日志分析,没有发现什么异常.于是把 access log 日志拉下来,用逆火网站日志分析器检查了一下站点盗链情况,发现本站的深圳高交会之神州龙芯 CPU 映象记［图文] 以及香港2005年春季行(3) - 庙街风光等原创文章中的图片,被许多网
JS+CSS实现的日本门户网站经典选项卡导航效果

本文实例讲述了JS+CSS实现的日本门户网站经典选项卡导航效果.分享给大家供大家参考.具体如下: 这里介绍的是来自日本门户网站的一款CSS+JavaScript选项卡导航菜单,银灰色风格,看来日本人和中国人的审美是接近的,都喜欢这种风格,如果你要用的话,直接拷贝代码部分到你的网页中,注意你需要修改编码才行,日本的编码和中国可是不一样哦,只要把文字改为中国的就行了. 运行效果截图如下: 在线演示地址如下: http://demo.jb51.net/js/2015/js-css-japan-web-
网站的反采集技术

网站的反采集技术前一段时间同几个朋友聊起内容采集的事情,因为我从未涉足这个领域,就自以为可以找到一个方法来反采集,经过一段时间的研究,似乎是有办法做到的,不是说完全阻止采集,而是让采集的成本变高,或者让采集后的内容无法使用,或者说采集后的内容要花很多人工来分析,过滤. 下面的方法,转自别人的文章,作者:翟振恺(小琦),我摘录了反采集的部分内容. 一.分页文件名规则防采集对策大部分采集器都是靠分析分页文件名规则,进行批量.多页采集的.如果别人找不出你的分页文件的文件名规则,那么别人就无法对你的
python爬取新闻门户网站的示例

项目地址: https://github.com/Python3Spiders/AllNewsSpider 如何使用每个文件夹下的代码就是对应平台的新闻爬虫 py 文件直接运行 pyd 文件需要,假设为 pengpai_news_spider.pyd 将 pyd 文件下载到本地,新建项目,把 pyd 文件放进去项目根目录下新建 runner.py,写入以下代码即可运行并抓取 import pengpai_news_spider pengpai_news_spider.main() 示例代码
ASP网站生成静态html页面技术小结

生成HTML方法主要步骤只有两个: 一.获取要生成的html文件的内容二.将获取的html文件内容保存为html文件我在这里主要说明的只是第一步:如何获取要生成的html文件的内容: 目前常用获取html文件的内容的方法有以下几种: 1. str="<html标记>内容</html标记>" str=str&"<html标记>内容</html标记><html标记>数据库读取内容....</htm
门户网站构建CSS框架的规则

第一部:关于构建CSS框架我们要实现的目的: 1.实现标准化,具备主流平台适应性的前端实现: 2.快速开发,在站点风格确定后,前端不应该成为整个项目里瓶颈: 3.重构的需求,尽可能的让类和区块样式可重用: 4.分离结构和表现的需求,遵守了语义化结构的约定; 5.构架完全符合金融网特色的CSS框架. 6.对代码进行必要的搜索引擎优化. 第二部:关于CSS命名的一些约定: 1.不使用大写形式的类名和id名; 2.尽可能使用描述性的英文单词的组合作为类名和id名; 3.id名及类名的多个英文单词之间使
PHP 程序员的调试技术小结

本文介绍调试 PHP 应用程序的各种方法,包括在 Apache and PHP 中打开错误报告,以及通过在一个简单的 PHP 脚本中放置策略性的 print 语句,找到更困难的 bug 的源头.还会介绍用于 Eclipse 的 PHPEclipse 插件,这是一个灵活的开发环境,具有实时语法解析能力,还会介绍 PHPEclipse 的 DBG 调试器扩展. 简介有许多 PHP 调试技术可以在编码的时候节约大量时间.一个有效却很基本的调试技术就是打开错误报告.另一个略微高级一点的技术包括使用 p
构建Vue大型应用的10个最佳实践(小结)

这些是我构建大型Vue项目得出的最佳实践,这些技巧将帮助你更高效的编码,并且使其更容易维护和协作. 在我今年的自由职业生涯中我有幸开发了一些大型Vue程序.我所说的这些项目使用了大量Vuex stores

大型门户网站实现的十四大技术小结

相关推荐

随机推荐