性能需求分析
3.2.1. 概述
首先对2003年和2004年的全年税收业务量进行了统计,总结出税收业务量的增长趋势,
对2005至2009年的全年税收业务量进行了估算
以此为依据,同时结合税收业务量分布特点,按照省集中和全国集中两种模式,对用户访问量、系统处理能力、存储容量、网络流量等4个主要方面进行初步分析估算。
有必要指出的是,网络流量的估算与联网机构的接入方式密切相关,但是哪些联网机构可以集中接入,集中接入的层次,及集中接入机构的业务量在总业务量的占比各地差异很大;从地域上考虑,各联网机构在各省的集中程度也不尽相同,比如说,国税在部分省做到了省集中、而在另一部分省尚未做到省集中,至于地税、财政和部分城市商业银行的情况就更为复杂。
另外,在进行后续的估算中,考虑到税票业务量是本系统处理的主要业务,其他业务与税票相比,业务量相对较小。因此,我们暂以税票业务量作为估算的基础。
3.2.2. 业务量统计
通过对国库局综合业务报表系统提供的全国各省税票业务量进行分析统计,得出如下结论,2003年全国税票业务总量大约有2.1
亿笔,2004年全国税票业务总量大约有2.4亿笔;全国税票业务年增长率大约在15%左右。同时对各地上横向联网后,税票业务量变化趋势进一步考察发现,上横向联网后的第一年,某些地区税票业务量有突发性增长因素(如浙江,在上横向联网后的第一年,税票业务量增长了100%),所以我们假设税票业务量每年增长趋势在20%左右。
税票业务量的大小直接影响到对系统处理能力、存储容量、网络流量等性能指标的高端要求,由于各省经济发达程度和税收的差异,造成各省的税票业务量存在很大差异。为了做到按需投资,合理配备资源,避免浪费,我们将各省根据2004年税票业务量大小分为4类:
1.按分库级分类
(1) 特大型,税票年业务量达到3500万及以上
包括上海、广州、南京、北京4个分库。
(2) 大型,税票年业务量达到1500万及以上,3500万以下
包括石家庄、沈阳、杭州、福州、济南、武汉、成都、大连、宁波、重庆、天津11个分库或营管部管辖分库。
(3) 中型,税票年业务量达到1000万及以上,1500万以下
包括太原、呼和浩特、长春、哈尔滨、合肥、南昌、郑州、长沙、南宁、西安、兰州、贵阳、昆明、乌鲁木齐、青岛、海口、深圳、厦门18个分库或营管部管辖分库。 (4) 小型,年业务量在1000 万以下
包括银川、西宁、拉萨3个分库。 2.按中心支库级分类
(1) 特大型,税票年业务量达到1000万及以上
如:佛山市中心支库。
(2) 大型,税票年业务量达到500万及以上,1000万以下
如:苏州市中心支库。
(3) 中型,税票年业务量达到100万及以上,500万以下
如:常熟市中心支库。 (4) 小型,年业务量在100万以下
如:安顺市中心支库。 3.按县支库级分类
(1) 特大型,税票年业务量达到500万及以上
如:广东佛山顺德。
(2) 大型,税票年业务量达到100万及以上,500万以下
如:江苏苏州吴江。
(3) 中型,税票年业务量达到30万及以上,100万以下
如:山东淄博淄川。
(4) 小型,税票年业务量在30万以下
如:陕西咸阳长武县。
3.2.3. 省集中模式性能需求
3.2.3.1. 税票业务量分省估算
表3-1 2004—2009年税票业务量统计及增长情况估算表 年度 2004 特大型 3500万笔 2005 4200万笔 2006 5040万笔 大型 1500万笔 1800万笔 2160万笔 中型 1000万笔 1200万笔 1440万笔 720万笔 600万笔 小型 500万笔 2007 6048万笔 2592万笔 3110万笔 3732万笔 1728万笔 2074万笔 2488万笔 8万笔 2008 7258万笔 1037万笔 2009 8079万笔 1244万笔 3.2.3.2. 用户访问量估算
表3-2 用户访问量计算
并发用地市 数 特大型 大型 中型 小型 说明: 1 按照连接联网中心的税务征收机关数目为地市数的5倍;财政和地市数一样;商业银行为地市数的2倍计算,加上国库核算自身,那么一个地市将有对应10倍的联网机构用户。 2 日均访问量按照每个联网机构一个用户计算 3 高峰访问量按照一个国库机构2个手工用户,1个实时用户,每20 20 15 10 数 200 200 150 100 问量 200 200 150 100 问量 600 600 450 300 峰值数 值 480 480 360 240 160 160 120 80 联网机构日均访高峰访并发用户户平均个税务机关1个手工用户,1个实时用户,每个银行1个手工用户,1个实时用户,每个财政2个手工用户,高峰时段为每月10,20,30日上午9:00-11:00,下午2:00-4:00 4 并发用户峰值数按高峰访问量的80%同时访问计算 5 并发用户平均值按照日均访问量的80%计算 3.2.3.3. 系统处理能力计算
省集中模式数据中心处理能力计算
根据以上税票业务量统计及增长情况估算表,同时考虑到扣税业务的发生在时间上分布存在不规则性的特点,作如下假设:
高峰交易日业务量假定
假设全年税票业务量集中在11个月处理,每月处理全年业务量的1/11,每月的业务量平均分布在三旬当中,每旬业务量的80%集中发生在每旬的后三天。在最不理想的情况下,假定后三天的业务量的80%集中在每旬的最后一天处理。则高峰交易日业务量计算公式为:
高峰日交易量 = 年业务量/11/3*80%*80%(笔/天) 平均交易日业务量假定
假设每年的正常工作日为200天,则平均交易日业务量计算公式为:
平均日交易量 =年业务量/200(笔/天)
系统处理能力TPM-C值计算公式为:TPM-C = M*M0/T/M1 M为日交易量,包括对数据库更新、查询、增加、删除等操作。
计算TPM-C的目的是为了确定机器的处理能力,由于在每天的业务处理过程中,业务发生的频度不尽相同,一般情况下是按照8/2原则,具体来说,在20%的工作时间内业务人员要处理80%的业务。
M0为一个应用交易所对应的标准交易个数,推荐值为8-20,由于系统体系结构的不同、应用服务器的结构不同,各个厂商的推荐值也不同,如:HP公司推荐为10。
T为交易的高峰时间,使用2/8原则,如:每日工作时间为8小时,那么交易的高峰时间T=8*20%=1.6小时。
M1为机器实际为系统提供的处理能力,机器需要预留一部分处理能力,这一部分的处理能力是为了分配给操作系统、中间件应用服务器及数据库服务器的。M1一般来说为80%。
说明:
M0=10,参考目前厂商与TPC组织推荐的标准8~20,及借鉴相关类似系统(主要是中国现代化支付系统和中国银联交换系统)的取值情况,同时考虑到国库信息处理系统的单笔交易需要实时转发以及销号审核等信息整理,处理环节较多,自身交易有一定的复杂性。经估算,我们认为TIPS的交易复杂度系数M0取值10为宜。
T=96分钟,按照每天工作8个小时计算,同时根据2/8原则,即8*20%=1.6小时=96分钟内完成每天的工作量。
数据中心TPM-C = M*(M0/T/M1=10/96/0.8)=0.13 * M(其中M1=80%)。
关于业务量M的计算,按照日最大交易量来进行计算,同时按照
8/2原则,即在日高峰期要处理全天80%的业务。
表3-3 不同级别数据中心税票处理能力表
平均日 年度 类型 交易量 特大型 大型 2004 中型 小型 … … 25,122 4,195 … 97,443 16,272 … 77,954 13,017 … 10,134 1,692 … 176,061 55,854 交易量 交易量 71,022 22,531 682,903 546,323 216,6 173,317 高峰日 日高峰期 TPM-C 特大型 438,096 1,699,281 1,359,426 176,725 大型 2009 中型 小型 62,512 242,469 193,974 10,439 40,490 32,390 25,217 4,211 138,983 539,085 431,268 56,065 3.2.3.4. 存储容量分析
其中税票的数据格式如下表所示,长度约为2k。 表3-5税票信息表 要 素 属性 长度 说 明 11 征收机关的代码,参见征收机关代码表 税务机关代A 码 基层税务机 关 11 提交日期(开N2 票日期) 8 业务发起信息提出的日期 交易类型 流水号 N2 N2 2 20 “1”:划款 等(参见交易类型代码表) 预留20位,第1位为征收单位类型,1--国税,2--地税,3--海关,4—工商,5--财政,6--其他,作为整个系统中业务的唯一标识。(包括划款、冲正、退库、拨款、查询等信息) 经收处银行N2 号 11 纳税人缴纳税款的帐户的开户银行号。(同城交换行号,参见经收处银行号表) 缴款单位开 户行行名 60 收款国库代N2 码 11 请参见收款国库(单位)代码表 缴款期限 收款帐号 A 8 35 35 入库记帐帐号 纳税人缴纳税款的帐号 付款帐号(缴A 款单位账号) 缴款单位名 称 60 交易金额 N1 15 对于缴纳税款信息,交易金额应等于同一条信息中各明细金额的总数。 0 预算种类 1 1 1 1-代表预算内,2-代表预算外 1-代表本年度、2-代表上年度 缴款书类型 整理期标志 备注1 备注2 备注3 电子签名 120 120 120 100 1 委托银行打印银行划款凭证”标志 0:不打 1:打印 60 12 即付款人名称 自定,打印银行划款凭证”标志为“1”时必须。 打印付款凭N2 证标志 0 纳税人名称 A 纳税人编码 A 企业代码 60 80 标准计量局的国标码 扩展要素长度,以上是公共要素,以下为明细项目 扩展明细要 素长度 项目序号 1 8 明细项目序号1-10 打印银行划款凭证”标志为“1”时必须, 格式为YYYYMMDD 即:年月日 税款所属日N2 期起 税款所属日N2 期止 8 打印银行划款凭证”标志为“1”时必须, 格式为YYYYMMDD 即:年月日 明细金额 N1 15 1 必须 必须。 预算级次代N2 码 预算级次名 称 1 打印银行划款凭证”标志为“1”时必须。 分成比例代 码 10 必须 分成比例 8 打印银行划款凭证”标志为“1”时必须。 预算科目代N2 码 12 必须。 预算科目名 称(取消) 40 打印银行划款凭证”标志为“1”时必须。 税种名称 N2 3 打印银行划款凭证”标志为“1”时必须。 44. 备注 120 备用字段 收入退还书的格式同税票格式也为2k;更正通知书格式同税票格式业务2k;会计凭证的格式为500字节;财政支出凭证的格式为1k;额度为1k;报表为1k*1000=1M;其他按照1k计算。
表3-6 数据中心存储容量表
数据库实际 年度 类型 特大型 大型 2004 中型 小型 … … 特大型 大型 2009 中型 小型 3.2.3.5. 网络流量分析
根据业务量统计表,下表给出了每分钟交易数量。说明其中高峰交易量是根据2/8原则,即在工作时间内,80%的业务是在整个工作日的20%时间内完成,其中业务量按照每天可能发生的最大交易量乘80%来计算,其中工作时间按照正常工作时间8小时的20%来进行计算。
表3-7 单位时间内业务量统计表
高峰日 年度 机构 级别 交易量 (笔/日) 日高峰期 交易量(笔高峰期单位时间交易量 124G 75G 249G 149G 373G 224G 50G 30G … 498G 373G 100G 60G … 995G 746G 150G 100G … 1.5T 1.1T 纯数据量/年 存储量 200G 150G 400G 300G 600G 450G 两年存储量 /96分钟) (笔/分钟) 特大型 数据 大型 中心 中型 小型 特大型 地市 大型 2004 国库 中型 小型 特大型 县 大型 国库 中型 小型 特大型 数据 大型 中心 中型 小型 2009 特大型 地市 大型 国库 中型 小型 县 特大型 682,903 216,6 97,443 16,272 198,858 121,538 15,717 1,063 81,223 15,526 1,087 248 1,699,281 539,085 242,469 40,490 494,822 302,425 39,109 2,5 202,109 546,322 173,317 77,954 13,018 159,086 97,230 12,574 850 ,978 12,421 869 198 1,359,424 431,268 193,974 32,393 395,857 241,939 31,288 2,115 161,686 5,691 1,805 812 136 1,657 1,013 131 9 677 129 9 2 14,161 4,491 2,021 338 4,123 2,521 326 22 1,685 国库 大型 中型 小型 38,634 2,705 617 30,907 2,162 493 321 22 5 在执行每笔业务时,大约占用2K,假定不考虑网络带宽在传输过程中的效率损失,下表给出了对网络带宽的需求。 表3-8 单位时间内各级机构网络汇总流量估算表
日高峰期每高峰期单位分钟数据传年度 机构 级别 时间交易量输量(笔/分钟) (Kbit/Min) 特大型 数据 大型 中心 中型 小型 特大型 2004 地市 大型 国库 中型 小型 特大型 县 大型 国库 中型 9 144 2.5 129 2,0 39.5 5,691 1,805 812 136 1,657 1,013 131 9 677 91,056 28,880 12,992 2,176 26,512 16,208 2,096 144 10,832 1,517.5 481.5 216.5 36.5 442 270 35 2.5 180.5 输量(Kbps) 分钟数据传日高峰期每小型 特大型 数据 大型 中心 中型 小型 特大型 地市 大型 2009 国库 中型 小型 特大型 县 大型 2 14,161 4,491 2,021 338 4,123 2,521 326 22 1,685 321 22 5 32 226,576 71,862 32,328 5,414 65,907 40,330 5,215 358 26,953 5,136 358 79 0.5 3,776 1,198 538.5 91 1,100 672 87 6 449 86 6 1 国库 中型 小型 按照每笔业务处理需要2K,考虑到并发情况及网络利用效率等问题(效率损失为60%),实际所需要的网络带宽为下表所示。 表3-9 网络传输带宽估算表
不考虑网络效率损失的年度 级别 带宽要求(Kbps) 2004 要求(60%)(Kbps) 的带宽要求(Kbps) 考虑网络效率损失后的带宽假定传输压缩率67%,压缩后从省分库到全国数据中心 特大型 大型 中型 小型 1,517.5 481.5 216.5 36.5 2,529 802.5 361 61 834.57 2.82 119.13 20 从地市国库到省分库(或省数据中心) 特大型 大型 中型 小型 442 270 35 2.5 从县国库到地市国库 特大型 大型 中型 小型 180.5 39.5 2.5 0.5 301 57.5 4 1 99.33 18.97 1.32 0.33 736.5 450 58.5 4 243.04 148.5 19.3 1.32 从省分库到全国数据中心 特大型 大型 2009 中型 小型 3,776 1,198 538.5 91 6,293 1,997 8.5 152 2,076.69 659 296.5 50.16 从地市国库到省分库(或省数据中心) 特大型 1,100 1,832.5 604.73 大型 中型 小型 672 87 6 1,119.5 145.5 10 369.44 48.01 3.3 从县国库到地市国库 特大型 大型 中型 小型
449 86 6 1 749 143 10 2.5 247.17 47.19 3.3 0.82 3.3. 业务处理和系统响应时间
业务处理时间
在不考虑财政、征收机关、商业银行内部系统的处理时间的情况下,信息在TIPS内部的处理时间最长不超过3秒。
系统响应时间
系统登录时间最长3秒;
从报文或文件进入系统到接收回执时间不超过5秒; 报文或文件传输不成功时,在3-5秒时间内通知发送者; 因某种原因,报文或文件滞留在系统中时,应在30秒时间内向发送者发出提示信息。
为此要求:
实时联网交易在不通过小额支付系统进行时,系统响应时间应该
在5秒以内:其中税务、TIPS、金融机构之间整个网络延迟在3秒以内;数据处理中心处理时间和网间互联平台处理时间之和在2秒以内。
实时联网交易在通过小额支付系统进行时,应该在5秒加上小额支付系统和TBS的处理时间(包括中间的传输时间)。