浅谈如何降低软件复杂性

前言

在进行软件开发时,我们常常会追求软件的高可维护性,高可维护性意味着当有新需求来时,系统易扩展;当出现bug时,开发人员易定位。而当我们说一个系统的可维护性太差时,往往指的是该系统太过复杂,导致给系统增加新功能时容易出现bug,而出现bug之后又难以定位。

那么,软件的复杂性又是如何定义的呢?

John Ousterhout给出的定义如下:

Complexity is anything related to the structure of a software system that makes it hard to understand and modify the system.

可见,软件的复杂性是一个很泛的概念,任何使软件难以理解和难以修改的东西,都属于软件的复杂性。为此,John Ousterhout提出了一个公式来度量一个系统的复杂性:

公式中,表示系统中的模块,表示该模块的认知负担(Cognitive Load,即一个模块难以理解的程度),表示在日常开发中在该模块花费的开发时间。

从公式上看,一个软件的复杂性由它的各个模块的复杂性累加而成,而模块复杂性 = 模块认知负担 * 模块开发时间,也就是模块的复杂性即和模块本身有关,也跟在该模块上花费的开发时间有关。需要注意的是,如果一个模块非常难以理解,但是后续开发过程中几乎没有涉及到它,那么它的复杂性也是很低的。

导致软件复杂的原因

导致软件复杂的原因可以细分出很多种来,而概括起来莫过于两种:依赖(dependencies)和隐晦(obscurity)。前者会让修改起来很费劲而且容易出现bug,比如当修改模块1时,往往也涉及到模块2、模块3、... 的改动;后者会让软件难以理解,定位一个bug,甚至是仅仅读懂一段代码都需要花费大量的时间。

软件的复杂性往往伴随着如下几种症状:

霰弹式修改(Change amplification)。当只需要修改一个功能,但又不得不对许多模块作出改动时,我们称之为霰弹式修改。这通常是因为模块之间耦合过重,相互依赖太多导致的。 比如,有一组Web页面,每个页面都是一个HTML文件,每个HTML都有一个背景属性。由于各个HTML的背景属性都是分开定义的,因此如果需要把背景颜色从橙色修改为蓝色时,就需要改动所有的HTML文件。

霰弹式修改的典型例子

认知负担(Cognitive load)。当我们说一个模块隐晦、难以理解时,它就有过重的认知负担,这种情况下往往需要读者花费大量时间才能明白该模块的功能。比如,提供一个不带任何注释的calculate接口,它有2个int类型的入参和一个int类型的返回值。从该函数的签名上看,调用者根本无法得知函数的功能是什么,他只能通过花时间去阅读源码来确定函数功能后才敢去调用该函数。

int calculate(int val1, int val2);

不确定性(Unknown unknowns)。相比于前两种症状,不确定性的破坏性更大,它通常指一些在开发需求时,你必须注意的,但是又无从得知的点。它常常是因为一些隐晦的依赖导致的,会让你在开发完一个需求之后感觉心里很没谱,隐约觉得自己的代码哪里有问题,但又不清楚问题在哪,只能祈祷在测试阶段能够暴露而不要漏洞商用阶段。

如何降低软件的复杂性

对 “战术编程” Say No!

很多程序员在进行特性开发或bug修复时,关注点往往是如何简单快速让程序跑起来,这就是典型的战术编程(Tactical programming)方法,它追求的是短期的效益——节省开发时间。战术编程最普遍的体现就是在编码之前没有进行模块设计,想到哪里就写到哪里。战术编程在系统前期可能会比较方便,一旦系统庞大起来、模块之间的耦合变重之后,添加或修改功能、修复bug都会变得寸步难行。随着系统变得越来越复杂,最后不得不对系统进行重构甚至重写。

与战术编程相对的就是战略编程(Strategic programming),它追求的是长期的效益——增加系统可维护性。仅仅是让程序跑起来还不足以满足,还需要考虑程序的可维护性,让后续在添加或修改功能、修复bug时都能够快速响应。因为考虑的点比较多,也就注定战略编程需要花费一定的时间去进行模块设计,但相比于战术编程后期导致的问题,这一点时间也是完全值得的。

战术编程 VS 战略编程

让模块更“深”一点!

一个模块由接口(interface)和实现(implementation)两部分组成,如果把一个模块比喻成一个矩形,那么接口就是矩形顶部的边,而实现就是矩形的面积(也可以把实现看成是模块提供的功能)。当一个模块提供的功能一定时,深模块(Deep module)的特点就是矩形顶部的边比较短,整体形状高瘦,也即接口比较简单;浅模块(Shallow module)的特点就是矩形顶部的边比较长,整体形状矮胖,也即接口比较复杂。

深模块 VS 浅模块

模块的使用者往往只看到接口,模块越深,模块暴露给调用者的信息就越少,调用者与该模块的耦合性也就越低。因此,把模块设计得更“深”一点,有助于降低系统的复杂性。

那么,怎样才能设计出一个深模块呢?

更简单的接口

简单的接口比简单的实现更重要,更简单的接口意味着模块的易用性更好,调用者使用起来更方便。而简单的实现 + 复杂的接口这种形式,一方面影响了接口的易用性,另一方面则加深了调用者与模块的耦合。因此,在进行模块设计时,最好遵守“把简单留给别人,把复杂留给自己”的原则。

异常也属于接口的一部分,在编码过程中,应该杜绝没经过处理,就随意将异常往上抛的现象,这样只会增加系统的复杂性。

更通用的接口

在设计接口时,你往往有两种选择:(1)设计成专用的接口;(2)设计成通用的接口。前者实现起来更方便,而且完全可以满足当前的需求,但可扩展性低,属于战术编程;后者则需要花时间对系统进行抽象,但可扩展性高,属于战略编程。通用的接口意味着该接口适用的场景不止一个,典型的就是“一个接口,多个实现”的形式。

有些程序员可能会反驳,在无法预知未来变化的情况下,通用就意味着过度设计。过度通用确实属于过度设计,但对接口进行适度的抽象并不是,相反它可以使系统更有层次感,可维护性也更高。

隐藏细节

在进行模块设计时,还要学会区分对于调用者而言,哪些信息是重要的,哪些信息是不重要的。隐藏细节指的就是只给调用者暴露重要的信息,把不重要的细节隐藏起来。隐藏细节一则使模块接口更简单,二则使系统更易维护。

如何判断细节对于调用者是否重要?以下有几个例子:

1、对于Java的Map接口,重要的细节:Map中每一个元素都是由<Key, Value>组成的;不重要的细节:Map底层是如何存储这些元素、如何实现线程安全等。

2、对于文件系统中的read函数,重要的细节:每次读操作从哪个文件读、读多少字节;不重要的细节:如何切换到内核态、如何从硬盘里读数据等。

3、对于多线程应用程序,重要的细节:如何创建一个线程;不重要的细节:多核CPU如何调度该线程。

进行分层设计!

设计良好的软件架构都有一个特点,就是层次清晰,每一层都提供了不同的抽象,各个层次之间的依赖明确。不管是经典的Web三层架构、DDD所提倡的四层架构以及六边形架构,抑或是所谓的Clean Architecture,都有着鲜明的层次感。

在进行分层设计时,需要注意的是,每一层都应该提供不同的抽象,并要尽量避免在一个模块中出现大量的Pass-Through Mehod。比如在DDD的四层架构中,领域层提供了对领域业务逻辑的抽象,应用层提供了对系统用例的抽象,接口层提供了对系统访问接口的抽象,基础设施层则提供对如数据库访问这类的基础服务的抽象。

所谓的Pass-Through Mehod是指那些“在函数体内直接调用其他函数,而本身只做了极少的事情”的函数,通常其函数签名与被其调用的函数签名很类似。Pass-Through Mehod所在的模块通常都是浅模块,让系统增加了无谓的层次和函数调用,会使系统更加复杂。

Pass-Through Mehod(选自《A Philosophy of Software Design》中的例子)

学会写代码注释!

注释是降低软件复杂性的性价比极高的一种手法,它只需要花费20%的时间,即可获取80%的价值。它可以提高晦涩难懂的代码的可读性;可以起到隐藏代码复杂细节的作用,比如接口注释可以帮助开发者在没有阅读代码的情况下快速了解该接口的功能和用法;如果写的好,它还可以改善系统的设计。

具体如何写好代码注释,参考《教你写好代码注释》一文。

总结

软件的复杂性是我们程序员在日常开发中所必须面对的东西,学会如何 “弄清楚什么是软件复杂性,找到导致软件复杂的原因,并利用各种手法去战胜软件的复杂性” 是一门必备的能力。有句话说得很好,“代码质量决定生活质量”,当你把软件的复杂性降低了,bug减少了,系统可维护性更高了,自然也就带来了更好的生活质量。

模块设计是降低软件复杂度最有效的手段,学会使用“战略编程”的方法,并坚持下去。我们常常提倡“一次把事情做对”,但这对于模块设计而言并不适用,几乎没有人可以第一次就把一个模块设计成完美的模样。二次设计是一个非常有效的手法,与其在系统腐化之后再花大量时间进行重构或重写,还不如在第一次完成模块设计后,再花点时间进行二次设计,多问问自己:是否有更简单的接口?是否有更通用的设计?是否有更简洁高效的实现?

"罗马不是一天建成的",降低软件的复杂性也一样,贵在坚持。

以上就是浅谈如何降低软件复杂性的详细内容,更多关于如何降低软件复杂性的资料请关注我们其它相关文章!

(0)

相关推荐

  • 如何最大限度地降低多线程C#代码的复杂性

    分支或多线程编程是编程时最难最对的事情之一.这是由于它们的并行性质所致,即要求采用与使用单线程的线性编程完全不同的思维模式.对于这个问题,恰当类比就是抛接杂耍表演者,必须在空中抛接多个球,而不要让它们相互干扰.这是一项重大挑战.然而,通过正确的工具和思维模式,这项挑战是能应对的. 本文将深入介绍我为了简化多线程编程和避免争用条件.死锁等其他问题而编写的一些工具.可以说,工具链以语法糖和神奇委托为依据.不过,引用伟大的爵士音乐家 Miles Davis 的话:"在音乐中,没有声音比有声音更重要.&

  • 浅谈Java如何实现一个基于LRU时间复杂度为O(1)的缓存

    LRU:Least Recently Used最近最少使用,当缓存容量不足时,先淘汰最近最少使用的数据.就像JVM垃圾回收一样,希望将存活的对象移动到内存的一端,然后清除其余空间. 缓存基本操作就是读.写.淘汰删除. 读操作时间复杂度为O(1)的那就是hash操作了,可以使用HashMap索引 key. 写操作时间复杂度为O(1),使用链表结构,在链表的一端插入节点,是可以完成O(1)操作,但是为了配合读,还要再次将节点放入HashMap中,put操作最优是O(1),最差是O(n). 不少童鞋就

  • 如何理解软件系统的高并发

    概述 当前,数字化在给企业带来业务创新,推动企业高速发展的同时,也给企业的IT软件系统带来了严峻的挑战.面对流量高峰,不同的企业是如何通过技术手段解决高并发难题的呢? 引言 软件系统有三个追求:高性能.高并发.高可用,俗称三高.三者既有区别也有联系,门门道道很多,全面讨论需要三天三夜,本篇讨论高并发. 高并发(High Concurrency).并发是操作系统领域的一个概念,指的是一段时间内多任务流交替执行的现象,后来这个概念被泛化,高并发用来指大流量.高请求的业务情景,比如春运抢票,电商双十一

  • 简述C++的复杂性

    1. C++真的很复杂吗 这个问题的答案是肯定的.从C++语言本身的发展和组成来看,C++语言并不是一种单一."纯粹"的编程语言,他有着复杂的内部结构. 最初,C++仅仅是在C的基础上附加了一些object-oriented(面向对象)的特性.C++最初的名字是"C with Class".以后C++不断的创新和发展,融入了procedural(过程化),object-oriented(面向对象),functional(函数化),generic(泛型)以及metap

  • 详解软件系统稳定性的三大秘密

    何谓系统稳定性? 控制系统理论认为:系统受到某种干扰而偏离正常状态,当干扰消除,如果系统的扰动能逐渐收敛并最终恢复正常状态,则系统是稳定的:反之,系统偏离越来越大,则是不稳定的,所以,稳定性是系统抗干扰和返回平衡状态的能力. 对于经典的传递函数的软件系统,一般我们讲的稳定指的是BIBO稳定,即有界输入有界输出稳定.一个系统如果对任意有界输入得到有界输出,它就是BIBO稳定的.一句话,稳定的系统对于各种输入需要有符合预期的输出. 随着软件复杂性越来越高,稳定性的保障越来越难,随着服务规模越来越大,

  • Java 实现Redis存储复杂json格式数据并返回给前端

    问题背景 在Java Web项目中,经常需要前端请求数据,后台从数据库中查询并计算最后返回json格式数据给前端. 而每次请求都需要计算一次可能比较浪费时间,这时我们可以将计算好的结果保存在redis中,下次请求时先判断redis中是否已经存在,如果是则直接从redis里取出返回,因为是在内存中,所以比较快. 而自己在项目中遇到的json格式数据比较复杂,下面记录一下redis存储对象和json格式数据的几种方式以及遇到的问题. 存储方式 1. 直接使用String存储 String类型是Red

  • 浅谈如何降低软件复杂性

    前言 在进行软件开发时,我们常常会追求软件的高可维护性,高可维护性意味着当有新需求来时,系统易扩展:当出现bug时,开发人员易定位.而当我们说一个系统的可维护性太差时,往往指的是该系统太过复杂,导致给系统增加新功能时容易出现bug,而出现bug之后又难以定位. 那么,软件的复杂性又是如何定义的呢? John Ousterhout给出的定义如下: Complexity is anything related to the structure of a software system that ma

  • 浅谈软件工程师的自我修养

    概述 "对于知识,要求知若渴:对于自己,要虚怀若谷."优秀的软件工程师一定是在软件开发的道路上前行者.自学是其成长的一个重要手段,在自学的过程中,我们是可以通过考试的方式来收敛思绪,督促自己学习,从而提高自己的基本素质.诚然,原则和模式是软件工程质量的基石.但技术是工具, 是为人服务的,而不是相反的.我们不能为了迎合某种技术而束手束脚,让自己特别难受.与此同时,要让自己的能力发挥到极致,良好的心境是必须要有的,因为软件工程中的一个核心因素是人的因素. 诚然,在软件开发过程中,我们不仅要

  • 浅谈java中OO的概念和设计原则(必看)

    一.OO(面向对象)的设计基础 面向对象(OO):就是基于对象概念,以对象为中心,以类和继承为构造机制,充分利用接口和多态提供灵活性,来认识.理解.刻划客观世界和设计.构建相应的软件系统.面向对象的特征:虽然各种面向对象编程语言相互有别,但都能看到它们对面向对象基本特征的支持, 即 "抽象.封装.继承.多态" : – 抽象,先不考虑细节 – 封装,隐藏内部实现 – 继承,复用现有代码 – 多态,改写对象行为 面向对象设计模式:是"好的面向对象设计",所谓"

  • 浅谈jQuery 选择器和dom操作

    浅谈jQuery 选择器和dom操作 JQuery选择器 1.基本选择器 基本选择器是JQuery中最常用的选择器,也是最简单的选择器,它通过元素id.class 和标签名来查找DOM元素.这个非常重要,下面的内容都是以此为基础,逐级提高的. 1)."$("#id")",获取id指定的元素,id是全局唯一的,所以它只有一个成员. 2)."$(".class")",获取class指定的元素,不同的元素可以具有相同的class属性

  • 浅谈JavaScript编程语言的编码规范

    JavaScript 编程语言作为最流行的客户端脚本语言,早已被众多 Web 开发人员所熟悉.随着 Web2.0 时代的到来和 Ajax 技术的广泛应用,JavaScript 也逐渐吸引着更多的视线.工作中要求越多的是对 JavaScript 语言的深入学习,灵活运用,和对编码质量的保证. 对于熟悉 C/C++ 或 Java 语言的工程师来说,JavaScript 显得灵活,简单易懂,对代码的格式的要求也相对松散.很容易学习,并运用到自己的代码中.也正因为这样,JavaScript 的编码规范也

  • 浅谈linux下的串口通讯开发

    串行口是计算机一种常用的接口,具有连接线少,通讯简单,得到广泛的使用.常用的串口是RS-232-C接口(又称EIA RS-232-C)它是在1970年由美国电子工业协会(EIA)联合贝尔系统.调制解调器厂家及计算机终端生产厂家共同制定的用于串行通讯的标准.串口通讯指的是计算机依次以位(bit)为单位来传送数据,串行通讯使用的范围很广,在嵌入式系统开发过程中串口通讯也经常用到通讯方式之一. Linux对所有设备的访问是通过设备文件来进行的,串口也是这样,为了访问串口,只需打开其设备文件即可操作串口

  • 浅谈Zookeeper开源客户端框架Curator

    zookeepercurator Curator是Netflix开源的一套ZooKeeper客户端框架. Netflix在使用ZooKeeper的过程中发现ZooKeeper自带的客户端太底层, 应用方在使用的时候需要自己处理很多事情, 于是在它的基础上包装了一下, 提供了一套更好用的客户端框架. Netflix在用ZooKeeper的过程中遇到的问题, 我们也遇到了, 所以开始研究一下, 首先从他在github上的源码, wiki文档以及Netflix的技术blog入手. 看完官方的文档之后,

  • 浅谈Mysql哪些字段适合建立索引

    1 数据库建立索引常用的规则如下: 1.表的主键.外键必须有索引: 2.数据量超过300的表应该有索引: 3.经常与其他表进行连接的表,在连接字段上应该建立索引: 4.经常出现在Where子句中的字段,特别是大表的字段,应该建立索引: 5.索引应该建在选择性高的字段上: 6.索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引: 7.复合索引的建立需要进行仔细分析:尽量考虑用单字段索引代替: A.正确选择复合索引中的主列字段,一般是选择性较好的字段: B .复合索引的几个字段是否经常同

  • 浅谈架构模式变迁之从分层架构到微服务架构

    前言 谈到软件系统设计的方法论,在代码层面,有我们熟悉的23种设计模式(design pattern),对应到架构层面,则有所谓的架构模式(architecture pattern).它们分别从微观和宏观的角度指导着我们设计出良好的软件系统,因此,作为一个软件工程师,我们不仅要熟悉设计模式,对常见的架构模式也要熟稔于心.正如看到一个设计模式的名字脑里就能浮现出大致的结构图,当我们看到一个架构模式的名字时,也要马上想到对应的架构图及其基本特点.比如,当谈到分层架构时,我们就应该想起它的架构图是怎样

  • 浅谈Linux的虚拟内存

    由来 虚拟内存 毋庸置疑,虚拟内存绝对是操作系统中最重要的概念之一.我想主要是由于内存的重要"战略地位".CPU太快,但容量小且功能单一,其他 I/O 硬件支持各种花式功能,可是相对于 CPU,它们又太慢.于是它们之间就需要一种润滑剂来作为缓冲,这就是内存大显身手的地方. 上图是虚拟内存最简单也是最直观的解释. 操作系统有一块物理内存(中间的部分),有两个进程(实际会更多)P1 和 P2,操作系统偷偷地分别告诉 P1 和 P2,我的整个内存都是你的,随便用,管够.可事实上呢,操作系统只

随机推荐