1数据恢复基础知识(通用8篇)
篇1:1数据恢复基础知识
浙江大学城市学院实验报告
课程名称
数据结构基础
实验项目名称
实验一
熟悉Project组织应用程序
学生姓名
专业班级
学号
实验成绩
指导老师(签名)
日期
一.实验目的和要求
1、熟悉VC6.0开发环境;使用Workspace和Project组织应用程序;
2、回顾C语言程序设计,编写完整的实验应用程序,并调试通过。
3、掌握文件包含,以及库函数iostream.h中的标准输入、输出流对象cin和cout,理解“引用(&)”方式的参数传递。
二.实验内容
1、按下述介绍的方法,练习并掌握使用Project组织应用程序的方法。步骤:
① 启动VC++,选择“文件(File)”菜单中的“新建(New)”项,选择“工程(Projects)页,然后选择“Win32 Console Application”,在右上角输入project的名称(如:test1),再选择合适的存储路径,然后按下“确定”按钮。这样就建立了一个新的工程。如下图所示:
② 在窗口左侧出现WorkSpace视图,选择“FileView”页可浏览该工程所包含的文件。然后可在项目中新建源文件(菜单:文件新建),包括“C/C++Header File”和“C/C++Source File”两类文件,或将已有的源文件加入到这个工程中(菜单:工程增加到工程)。如下图:
完成后程序组织结构如下图:
其中Source Fileste中包含主程序等源程序文件(如:test1_main.cpp),Header Fileste中包含头文件等(如:test1_function.h)。
2、在VC中建立工程(取名为test1),并编写如下程序加入到工程中,编译执行该程序。要求使用cin和cout进行数据的输入输出。程序题目如下:
设a为长度为n的整数型一维数组。
(1)试编写求a中的最大值、最小值和平均值的函数。
请分别用两种方法完成:
分别编写三个函数int aMAX(int *a,int n)、int aMIN(int *a,int n)、int aAVE(int *a,int n)实现求最大值、最小值和平均值。
用一个函数void aMAX_MIN_AVE(int *a, int n, int &max, int &min, int &aver)实现求上述三个值,用“引用参数”带回结果。
(2)试编写函数 int prime_SUM(int *a, int n)计算a中所有素数之和。(3)编写函数 void aSORT(int *a,int n)对a进行从小到大的排序,并输出排序结果。
要求:
把以上函数存放在头文件test1.h中,并自行设计主函数来测试各类操作实现的正确性,主函数存放在文件test1.cpp中。
3、填写实验报告,实验报告文件取名为report1.doc。
4、上传实验报告文件report1.doc、源程序文件test1.cpp及test1.h到Ftp服务器上(ftp://10.61.14.240:5000)自己的文件夹下。
三.函数的功能说明及算法思路
(包括每个函数的功能说明,及一些重要函数的算法实现思路)
1、求a中的最大值 int aMAX(int *a,int n){ int i,max;max=a[0];for(i=0;i if(max max=a[i];} return max;} 2、求a中的最小值 int aMIN(int *a,int n){ int i,min=a[0];for(i=0;i if(min>a[i]) min=a[i];} return min;} 3、求a中的平均值 int aAVE(int *a,int n){ int i,sum=0,ave;for(i=0;i sum=sum+a[i]; ave=sum/n; return ave;} 4、用一个函数求a中的最大值、最小值、平均值 void aMAX_MIN_AVE(int *a, int n, int &max, int &min, int &aver){ int sum,i;sum=0;max=a[0];min=a[0];aver=a[0];for(i=0;i if(a[i]>max)max=a[i]; if(a[i] sum=sum+a[i];} aver=sum/n;} 5、计算a中所有素数之和 int prime_SUM(int *a, int n){ int i,sum=0;for(i=0;i if(prime(a[i])) sum=sum+a[i];} return sum;} int prime(int x) //判断一个数是否是素数 { int i;for(i=2;i<(x/2);i++) if(x%i==0)break; if(i>=x/2) return 1; else return 0;} 6、对a进行从小到大的排序,并输出排序结果 void aSORT(int *a,int n){ int i, index,j,temp;for(i=0;i index=i; for(j=i+1;j if(a[j] index=j; temp=a[i]; a[i]=a[index]; a[index]=temp;} } 四.实验结果与分析 (包括运行结果截图、结果分析等)input data:0 1 2 3 4 5 6 7 8 9 max in a:9 min in a:0 ave in a:4 sum of prime:18 max in a:9 min in a:0 ave in a:4 the sort is:0 1 2 3 4 5 6 7 8 9Press any key to continue 五.心得体会 (记录实验感受、上机过程中遇到的困难及解决办法、遗留的问题、意见和建议等。) 最开始编译时,总是有十几个错误,或是变量未定义,或是函数中有错误,在经过调试和与同学交流之后,终于解决了这些问题。这使我意识到自己在综合编程方面的不足,函数一多容易搞混,以后一定改正。【附录----源程序】 Test1_func.h int prime(int x) ////判断一个数是否是素数 { } int aMAX(int *a,int n){ } int aMIN(int *a,int n)int i,max;max=a[0];for(i=0;i } return max;if(max if(x%i==0)break;if(i>=x/2)return 1;else return 0;{ } int aAVE(int *a,int n){ } int prime_SUM(int *a, int n){ return ave;ave=sum/n;int i,sum=0,ave;for(i=0;i } return min;if(min>a[i])min=a[i]; } int i,sum=0;for(i=0;i } return sum;if(prime(a[i]))sum=sum+a[i];void aMAX_MIN_AVE(int *a, int n, int &max, int &min, int &aver){ } int sum,i;sum=0;max=a[0];min=a[0];aver=a[0];for(i=0;i } aver=sum/n;if(a[i]>max)max=a[i];if(a[i] void aSORT(int *a,int n){ int i, index,j,temp;for(i=0;i } index=i;for(j=i+1;j if(a[j] Test1_main.cpp }#include } int a[10],i,max,min,ave;cout<<“input data:”;for(i=0;i<10;i++)cin>>“%d”,&a[i];cout<<“max in a:”< 江苏省1:25万、1:100万基础数据修测与建库 1:25万、1:100万基础数据是江苏省地理空间信息基础框架的重要组成部分,本文根据江苏省地理空间信息基础框架的要求,结合全省现有的基础地理数据库建设的.现状,叙述了对全省范围内的17幅1:25万DLG、DOM,4幅1:100万DLG数据如何进行修测、更新和入库,并建立相应的元数据库的过程和方法. 1 制图底图 扫描纸质地图得到的1∶5000数字栅格地形图, 其变形控制在3‰以内。加工底图基于以下两种坐标系统: (1) 1980年西安坐标系, 高斯-克吕格投影, 3度分带, 1985年国家高程基准; (2) 1954黄海坐标系, 高斯-克吕格投影, 3度分带, 1985年国家高程基准。矢量化过程中统一转换为第一种坐标系统, 高程单位为米。 2 加工平台 目前国内外数字化软件很多, 如Autodesk公司的CAD Overlay、Epscan、MapGIS及吉威数源公司的Geoway等优秀的矢量化软件。下面笔者阐述的生产流程可以选用任意一款软件加以实现。 3 生产流程 生产流程如图1所示。 3.1 方案设计 作业方案是规模化、规范化作业的数据模板, 定义图层名称、图层属性和图层表现风格, 在每一图层内定义地物类名称和地物类编码 (地物类从属于确定的图层) 、 (地物) 类属属性和类属表现风格等。该项工作实际上就是对空间基础数据进行分类和编码, 以方便对基础数据的管理。另外, 在信息服务和数据共享时, 往往借助于分类编码向用户提供所需的数据, 不同系统间交换数据时, 分类编码也是最重要的数据标一记, 是实现系统间数据共享的重要基础。 目前, 与城市基础地理信息分类编码相关的国家标准主要有《1∶5000, 1∶10000地形图图式》 (GB/T 5791-93) , 《1∶5000, 1∶10000, 1∶25000, 1∶50000, 1∶100000地形图要素分类与代码》 (GB/T 15660-1995) 和《国土基础信息数据分类与代码》 (G B/T13923-92) 等。《1∶5000, 1∶10000, 1∶25000, 1∶50000, 1∶100000地形图要素分类与代码》采用线分类法, 根据分类编码通用原则, 将地形要素共分为九个大类, 并依次细分为小类、一级、和二级。分类代码采用四位数字层次码组成, 其中, 大类码、小类码、一级代码和二级代码分别用数字顺序排列。 3.2 底图的几何纠正和坐标配准 由于长期存放, 温度、湿度等周围环境条件的影响会引起纸质地图的缩放、旋转以及其它非线性变形, 所以扫描后的底图也是有变形的, 而且这种图纸的变形在图形编辑时是难以改正的。因此在坐标配准之前必须先进行纸质地图的几何纠正。其实质就是:选择一定数量的已知理论坐标的控制点, 并获得其在底图上的坐标值, 利用某种数学模型, 用待定系数法求出底图坐标向理论坐标转换的参数。然后求出图幅中网格上角点的理论坐标值, 用于下面的坐标配准。其实这个过程在软件中是和对底图进行的几何纠正同时进行的。所以在对底图进行几何纠正的同时就进行了坐标配准。 在软件中以矢量化任务新建工程并载入方案后就可以进行底图的几何纠正和坐标配准。 3.3 矢量化采集作业 使用软件的线跟踪、边角提取等快速矢量化命令交互式采集底图中原有的地物图形。在采集图形过程中运用“属性同步输入”或在采集后批量输入图形属性。 3.4 图幅数字化质量检查 首先利用软件检查, 然后再进行套合检查。质量控制可以对图形的几何现象、地物的属性信息、拓扑构建结果以及各种矛盾数据进行检测和控制.图形检测主要包括:自相交和打折、两线相交、公共边重复、悬挂点等。属性检测主要用到的是等高线高程值的空值检测。另外还有等高线、编码检测、重叠点检测等。套合检查是将矢量化后的矢量图和底图进行套合检查, 对于要素的错漏和要素间的关系等都可以从图面上很直观地表现出来。在质量检查中, 首先由生产人员自查, 然后同组人员之间互查。在互查时制定质量检查项目表, 统一检查项目。然后根据检查结果对每幅数字线划图进行模糊综合质量评价, 取得其质量评价等级。 3.5 坐标转换 每一幅地图都有一个坐标系, 坐标系是电子化地图中的关键因素。坐标系是空间数据的基准, 也是地理信息系统的基础。建立地理信息系统的首要任务是空间地图数据的采集和地图数据的转换。空间物体的位置可以通过多种坐标系来描述, 由于途径不同, 可能所使用的坐标系也不相同。因为加工底图基于1980年西安坐标系和1954黄海坐标系两种坐标系统, 所以在进行图幅接边之前要进行坐标转换.利用软件的“54系-80系的坐标转换”功能就可以完成此项坐标转换工作。 3.6 图幅接边 相邻两幅图所表示的地形应是连续的, 而采集到的数据由于各种误差的影响可能在接边边界处不连续, 所以必须进行图幅的接边检查和修改。利用软件的图幅接边功能可以方便的把相邻的图幅进行接边。首先新建一个接边工程, 数据源选择相邻的两幅图, 在接边索引图中把其中的一幅图设置为主图, 并且以主图为基准生成接边线, 接边线两侧一定范围内的属性相同的地物自动咬合到边界上.然后可以在进行接边设置后, 利用“自动接边”即可按照接边设置进行自动接边。自动接边完成后, 会将没有进行接边的悬挂接边点留在图上, 这时需再利用“手动接边”进行接边。 3.7 接边质量检查 利用套合检查的方法进行接边质量检查, 并将检查结果填入图幅数字化质量检查时制定的质量检查项目表中。 3.8 成果输出 为其它模块使用数据方便, 可以将数据导出为MapInfo交换格式 (*.MIF) 。另外, 为了生产数字高程模型 (DEM) 数据的需要, 可以将等高线地物类数据导出为MGE ASCII文件 (*.TXT) 。 摘要:本文基于笔者多年从事国土资源管理的工作经验, 以1∶5000基础地形图数据生产为研究对象, 论文以某县地形图数据生产为例探讨了整个数据生产流程, 全文是来自于笔者工作实践的技术总结, 同时, 笔者通过参阅大量相关文献将其提升到一定理论高度, 相信本文的研究对从事相关工作的同行有着重要的参考价值和借鉴意义。 关键词:1:5000地形图,数据生产,矢量,栅格 参考文献 [1]吴信才.地理信息系统原理与方法[M].北京:电子工业出版社, 2004. 关键词:基础地理信息;数据整合;数据迁移;探討 1、引言 全国1:10000基础地理信息数据库整合升级项目是按照国家数据规范和省专业技术设计的要求对原1:10000基础地理信息数据进行整合处理和补充完善。由于浙江省1:10000基础地理信息数据库的数据结构、要素选取和属性内容及表达方式与国家数据规范存在差异,为了使1:10000基础地理信息数据满足浙江省和国家测绘地理信息局的需求,我部门参与了浙江省1:10000基础地理信息数据整合升级。现就整合中遇到的问题、处理方式以及个人的体会做一个小结,供大家在以后的同类项目中借鉴和参考。 2、工作内容及技术方案 1:10000基础地理信息数据要素繁多,整合内容复杂。按类别分主要包括交通、水系、居民地及设施、管线、地貌、植被、境界与政区和地名共八大类,本次数据整合主要是对原1:10000基础地理信息数据进行要素表达方式的改造、内业要素补充采集和元数据改造。 数据整合的技术方案主要包括数据分层、属性表结构和属性项定义等,并依据现势性较强的DOM影像数据对要素进行补充完善。为了提高数据整合效率,摸索出适合自己的一套作业方法,即首先对整合区域按一定数量的图幅进行区块分割,然后把分割区块中的要素层进行要素分类,主要分为交通要素类、水系要素类、居民地和其它要素类共三大要素类。作业人员按照《1:10000(1:5000)基础地理信息地形要素数据规范》、《浙江省数据整合处理生产专业技术设计书》和《浙江省1:10000基础地理信息数据整合处理作业指导书》的要求采用省标分类代码对各要素类数据进行图形整合、补充完善和各要素属性挂接。必要时对分类代码及属性项进行适当扩充,以满足国家库的要求。数据整合过程中,需要赋名称和编码的交通要素类按照《1:50000数据库更新工程_全国国省道路线名称代码》和《GBT+25344-2010+中华人民共和国铁路线路名称代码》处理。需要赋名称和编码的水系要素类依据河流、水库和湖泊水系编码资料进行属性赋值。境界和行政区按照行政编码参考表进行名称和要素代码属性赋值。 各要素类整合成果数据经过数据合并形成区块成果数据,然后按照GEOWAY 1:10000基础地理信息数据库更新成果质检软件对区块成果数据进行质量检查形成区块最终成果。区块最终成果在满足自身图形和属性接边的基础上,进行各区块之间的接边和融合,最终形成完整的省1:10000基础地理信息整合数据。 经过接边处理的要素关系应基本协调合理。相同的更新年代或更新方法生产的数据应严格接边。因生产年代或生产方法不同而产生的部分重要社会经济要素的不接边,如高速公路、铁路、水库、大坝等,应收集资料尽量接边,确实无法接边的,可保持不接边状态,并记录在元数据中。[1] 3、数据整合处理经验探讨 整合成果数据库提交前要经过各质检部门检查验收,检查出的问题作业人员全部进行了修正,现就检查中出现的主要问题以及处理方法和建议整理如下,供大家在以后的同类项目中借鉴和参考。 ①数据整合中交通要素比较繁琐复杂,需要修改和添加属性的要素比较多,值得注意的是路网发达地区,尤其是铁路、高速、国省道并存且城市道路比较密集的时候,思路一定要清晰,做到有条不紊。整合数据检查时发现不少问题,比如:高速公路双向隧道处新采集的高速公路结构线补划不正确,双向隧道应分别补划高速公路结构线并在隧道出入口处与双向通行的高速公路结构线(与隔离带重叠表示)实接,建议遍历隧道结构线;单线路或双线路结构线与新采集的高速公路结构线的连接处处理不正确,应删除高速公路结构线上连接处的交点,建议遍历新采集的高速公路结构线并仔细查看;立交桥和匝道区分不正确,建议调用最新的DOM影像数据成果判断是否为立交关系,为立交关系的才能将匝道边线和匝道结构线修改为立交桥边线和立交桥结构线代码;栈桥式码头和浮码头补充采集的方向线方向错误,建议所有层要素可见并结合DOM影像判断相应码头方向线的方向。 ②数据整合中水系要素也是比较繁琐的一项内容,尤其在水网比较密集又紧邻海域的地区,由于需要添加的水系结构线比较多,且流向难以判断,往往出现河流结构线流向自相矛盾。比如:水网面积比较大且图幅内河流流向符号表示比较少,补充采集的双线河流结构线方向处理上比较难以把握,建议根据图中已有的水系流向先确定部分水系结构线的方向,该部分处理好后根据小支流汇入大支流,大支流汇入主河道的原则,从整体上确定河流的流向,确保各水系结构线之间以及水系点要素、附属线要素和水系结构线之间的关系处理妥当。处理后的水系结构线式样建议选择有方向箭头的线状符号,这样可以比较直观的判断水网的正确性。 ③数据整合中居民地要素主要是街区和居民地设施的处理。街区的把握主要是依据房屋毗连成片并经过比较大的综合等特征进行数据处理,但不乏掺杂一点主观因素在里面,常出现对房屋综合在度的把握上存在偏差,建议利用更新平台上巡视功能,按一定比例显示居民地要素并进行房屋综合;点状符号构面以及根据注记构空地面,常出现点状符号构面范围不正确,空地面和道路面、房屋面有重叠等,建议点状符号构面、空地构面时所有层要素可见并参考DOM影像数据和注记,妥善处理各要素层之间的拓扑关系。数据整合中地貌要素出现的问题和居民地设施相似,常出现乱掘地构面和露天采掘场构面范围不正确,田坎、沟堑和路堑、路堤的区分不正确等,建议所有层要素可见并结合DOM影像数据和注记判断乱掘地、露天采掘场的范围和田坎、沟堑和路堑、路堤的区分。 ④数据整合中境界的处理主要是根据行政编码参考数据核实行政区代码,国有农场、林场、牧场的构面及添加国有农场_林场_牧场_已定界等。值得注意的是添加的农场_林场_牧场_已定界和图中原已定界满足拓扑实接关系。 ⑤数据整合中管线的处理主要是管线点要素和线要素的拓扑关系。常出现电线杆不在电力线上,建议利用Arcgis平台上的Select by location工具根据位置判断选择不在电力线上的电线杆。 ⑥数据整合中地名点的处理主要是地名点的位置(点和面的关系)和同属性地名点要素的删除。比如河流的地名点落在水库面上,行政村或自然村地名点、住宅区名称对象点等没有落在所属区域房屋面内等。同属性地名点要素的删除,要注意把地名点要素和浙江省行政村界面要素属性叠加,通过叠加属性判断并删除重复地名点要素。 4、远期展望 符合国家规范要求的省1:10000基础地理信息数据库提交到国家局后,各省市技术人员进行省之间的数据接边和检查,形成全国1:10000基础地理信息数据库。对全国1:1万基础地理信息数据进行整合与数据库升级,实现全国范围的规范统一,对于尽早实现全国“一张图、一个网、一个平台”的战略发展目标具有十分重要的意义,将为建立国家与地方交换共享、协同更新和快速服务机制奠定坚实的基础,加速推进数字中国地理空间框架建设,对于国家与地方测绘地理信息事业的发展将产生深远的影响。[2] 参考文献: [1]《1:10000(1:5000)基础地理信息地形要素数据规范(试行稿)》 一、单选题(每题1分,以下备选项中,只有一项符合题目要求,不选、错选均不得分) 1、根据土地增值税法律制度的规定,下列各项中,属于土地增值税的征税范围是()。 A.房地产的出租 B.企业间的房地产交换 C.房地产的代建 D.房地产的抵押 2、根据印花税法律制度的规定,下列各项中,免征印花税的是()。 A.土地使用证 B.专利权转移书据 C.未按期兑现的加工承揽合同 D.发行单位与订阅单位之间书立的凭证 3、下列各项中,关于结转本年利润的方法表述不正确的是()。 A.表结法减少了月末转账环节工作量,且不影响利润表的编制 B.账结法无需每月编制转账凭证,仅在年末一次性编制 C.表结法下每月月末需将损益科目本月发生额合计数填人利润表的本月栏目 D.期末结转本年利润的方法有表结法和账结法两种 4、2013年4月20日,甲公司从二级市场购人乙公司股票100000股,购买价款为每股9.85元,包括已宣告但尚未发放的现金股利0.1元,另外,支付交易费用5000元,甲公司将其划分为可供出售金融资产,该资产的入账金额为()元。 A.980000 B.985000 C.975000 D.990000 5、根据支付结算法律制度的规定,下列银行卡中,发卡银行对其账户内存款不计付利息的是()。 A.准贷记卡 B.贷记卡 C.专用卡 D.转账卡 6、生产一种产品,投产2400件,耗用材料费10000元,人工费16000元,制造费4000元,完工产品600件,在产品1800件,完工度50%,计算完工产品成本()。 A.12000 B.15000 C.1600 D.2000 7、2014年5月,张某转让一项专利权,取得转让收入150000元,专利开发支出10000元。已知特许权使用费所得个人所得税税率为20%;每次收入超过4000元的,减除20%的费用。张某当月该笔收入应缴纳个人所得税税额的下列计算中,正确的是()。 A.(150000-10000)×(1-20%)×20%=22400(元) B.(150000-10000)×20%=28000(元) C.[150000×(1-20%)-1000003×20%=22000(元) D.150000×(1-20%)×20%=24000(元) 8、下列各项中,不计入营业外支出的是()。 A.诉讼案件败诉赔偿费 B.捐建希望小学支出 C.税收罚款支出 D.产品保修维修费 9、甲企业采用移动加权平均法计算发出甲材料的成本,2013年4月1日,甲材料结存300千克,每千克实际成本为3元;4月3日,发出甲材料100千克;4月12日,购人甲材料200千克,每千克实际成本10元;4月27日,发出甲材料350千克,4月末该企业甲材料的期末结存成本为()。 A.450 B.440 C.500 D.325 10、2014年12月初,坏账准备贷方余额10万元,本月收回上月已确定并转销的应收账款5万元,12月31日根据应收账款预计未来现金流量限制确定期末“坏账准备”贷方余额18万元,则本月应计提的坏账准备金额为()万元。 A.18 B.3 C.8 D.13 11、2014年5月,张某转让一项专利权,取得转让收入150000元,专利开发支出10000元。已知特许权使用费所得个人所得税税率为20%;每次收入超过4000元的,减除20%的费用。张某当月该笔收入应缴纳个人所得税税额的下列计算中,正确的是()。 A.(150000-10000)×(1-20%)×20%=22400(元) B.(150000-10000)×20%=28000(元) C.[150000×(1-20%)-1000003×20%=22000(元) D.150000×(1-20%)×20%=24000(元) 12、根据税收征收管理法律制度的规定,对欠缴税款、滞纳金的纳税人或其法定代表人需要出境的,税务机关可以采取的措施是()。 A.书面通知其开户银行从其存款汇总扣缴税款 B.责令提供纳税担保 C.核定、调整应纳税额 D.依法拍卖期间只相当于应纳税款的商品 13、根据土地增值税法律制度的规定,下列各项中,属于土地增值税的征税范围是()。 A.房地产的出租 B.企业间的房地产交换 C.房地产的代建 D.房地产的抵押 14、2014年5月,张某转让一项专利权,取得转让收入150000元,专利开发支出10000元。已知特许权使用费所得个人所得税税率为20%;每次收入超过4000元的,减除20%的费用。张某当月该笔收入应缴纳个人所得税税额的下列计算中,正确的是()。 A.(150000-10000)×(1-20%)×20%=22400(元) B.(150000-10000)×20%=28000(元) C.[150000×(1-20%)-1000003×20%=22000(元) D.150000×(1-20%)×20%=24000(元) 15、实行国库集中支付的事业单位,对于应收财政下返还的资金额度,应当借记会计科 目()。 A.应缴国库款 B.其他应收款 C.财政应返还额度 D.应收账款 【参考答案】C 16、企业将房地产存货转回为采用公允价值模式计量的投资性房地产,转换日存货公允价值小于原账面价值的差额应计入的会计科目是()。 A.公允价值变动损益 B.资本公积——其他资本公积 C.营业外支出 D.投资收益 17、下列资产负债表项目中,可以直接根据有关总账科目余额填列的是()。 A.货币资金 B.短期借款 C.长期借款 D.应收账款 18、根据消费税法律制度的规定,下列各项中,不征收消费税的是()。 A.汽油 B.眉笔 C.沐浴液 报购买入库的报告 云浮市公安局: DEA概述 一、数据包络分析(DEA)发展 在人们的生产活动和社会活动中常常会遇到这样的问题:经过一段时间之后,需要对具有相同类型的部门或单位(称为决策单元)进行评价,其评价的依据是决策单元的“输入”数据和“输出”数据,输入数据是指决策单元在某种活动中需要消耗的某些量,例如投入的资金总额,投入的总劳动力数,占地面积等等;输出数据是决策单元经过一定的输入之后,产生的表明该活动成效的某些信息量,例如不同类型的产品数量,产品的质量,经济效益等等.再具体些说,譬如在评价某城市的高等学校时,输入可以是学校的全年的资金,教职员工的总人数,教学用房的总面积,各类职称的教师人数等等;输出可以是培养博士研究生的人数,硕士研究生的人数,大学生的人数,学生的质量(德,智,体),教师的教学工作量,学校的科研成果(数量与质量)等等.根据输入数据和输出数据来评价决策单元的优劣,即所谓评价部门(或单位)间的相对有效性. 1978年由著名的运筹学家A.Charnes,W.W.Cooper和 E.Rhodes首先提出了一个被称为数据包络分析(Data Envelopment Analysis,简称DEA)的方法,去评价部门间的相对有效性(因此被称为DEA有效).他们的第一个模型被命名为CCR模型.从生产函数角度看,这一模型是用来研究具有多个输入、特别是具有多个输出的“生产部门”同时为“规模有效”与“技术有效”的十分理想且卓有成效的方法.1984年 R.D.Banker,A.Charnes和W.W.Cooper给出了一个被称为BCC的模型.1985年Charnes,Cooper和 B.Golany, L.Seiford, J.Stutz给出了另一个模型(称为CCGSS模型),这两个模型是用来研究生产部门的间的“技术有效”性的. 1986年Charnes,Cooper 和魏权龄为了进一步地估计“有效生产前沿面”,利用Charnes, Cooper和K.Kortanek于1962年首先提出的半无限规划理论,研究了具有无穷多个决策单元的情况,给出了一个新的数据包络模型——CCW模型. 1987年Charnes, Cooper,魏权龄和黄志民又得到了称为锥比率的数据包络模型——CCWH模型.这一模型可以用来处理具有过多的输入及输出的情况,而且锥的选取可以体现决策者的“偏好”.灵活的应用这一模型,可以将CCR模型中确定出的DEA有效决策单元进行分类或排队等等.这些模型以及新的模型正在被不断地进行完善和进一步发展. 上述的一些模型都可以看作是处理具有多个输入(输出越小越好)和多个输出(输入越大越好)的多目标决策问题的方法.可以证明,DEA有效性与相应的多目标规划问题的pareto有效解(或非支配解)是等价的.数据包络分析(即DEA)可以看作是一种统计分析的新方法.它是根据一组关于输入-输出的观察值来估计有效生产前沿面的.在经济学和计量经济学中,估计有效生产前沿面,通常使用统计回归以及其它的一些统计方法,这些方法估计出的生产函数并没有表现出实际的前沿面,得出得函数实际上是非有效的.因为这种估计是将有效决策单元与非有效决策单元混为一谈而得出来的.在有效性的评价方面,除了DEA方法以外,还有其它的一些方法,但是那些方法几乎仅限于单输出的情况.相比之下,DEA方法处理多输入,特别是多输出的问题的能力是具有绝对优势的.并且,DEA方法不仅可以用线性规划来判断决策单元对应的点是否位于有效生产前沿面上,同时又可获得许多有用的管理信息.因此,它比其它的一些方法(包括采用统计的方法)优越,用处也更广泛. 数据包络分析是运筹学的一个新的研究领域.Charnes和Cooper等人的第一个应用DEA的十分成功的案例,是在评价为弱智儿童开设公立学校项目的同时,描绘出可以反映大规模社会实验结果的研究方法.在评估中,输出包括“自尊”等无形的指标;输入包括父母的照料和父母的文化程度等,无论哪种指标都无法与市场价格相比较,也难以轻易定出适当的权重(权系数),这也是DEA的优点之一. 2004年(二十六年之后): DEA已经形成了一个数学、经济学、管理科学交叉研究的新领域. 应用十分广泛,已有大量的DEA应用文章发表,内容设计各个领域。 二、DEA研究热点 在DEA领域,在以下几个方面做了一系列奠基性的工作:(ⅰ)完成大量应用的实例; (ⅱ)DEA模型的扩充和完善 .例如, DEA模型BCC,FG和ST;加法模型;Log-型的DEA模型;带偏好的锥比率的DEA模型;具有无穷多个DMU的半无限规划的DEA模型;随机DEA模型;逆DEA模型;等等.(ⅲ)DEA模型和方法的经济背景和管理背景研究; (ⅳ)进行DEA模型的计算研究和DEA软件的研制; (ⅴ)DEA所依据的数学理论研究,三、初识一个简单的DEA模型 1978年:对当第一个DEA模型CCR,认为是一种关于效率评价的新方法. 设有n个决策单元(j=1、2、…、n),每个决策单元有相同的m项投入(i=1、2、…、m)和相同的s项产出(r=1、2、…、s)。用xij表示第j单元的第i项投入量,用yrj表示第j单元的第r项产出量,其投入产出简略表示如下: 若用vi表示第i项投入的权值,用ur表示第r项产出的权值,则第j决策单元的投入产出比hj的表达式为 hjuyrr1msrj vxi1iij通过适当选取权值v(i=1、2、…、m)和u(r=1、2、…、s),使对j= 1、ir2、…、n,有hj≤1。则对第j个决策单元的绩效评价可归结为如下分式规划 0问题: maxhj0uyrr1msrj0 vxi1iij0suryrjr11,(j1,2,n),mvixiji1vi0(i1,2,m),ur0(r1,2, ,s)为将其转化为一个线性规划问题,(用1962年Charnes和Cooper对于分式规划的Charnes-Cooper变换(称为 C2-变换):)令 1vxi1m,wivi,trur iij0可将上述分式规划转化为 maxhj0tryrj0 (1)r1ssm(2)wixijtryrj0,(j1,2,n),r1i1m 2wixij01,(3)(PCR)i1wi0(i1,2,m),tr0(r1,2,s)(4) DEA有效的定义: 弱DEA有效: 最优目标值(称为效率指数)h0= 1. 2000 0 0 DEA有效: 若(PCR)存在最优解ω,μ满足ω>0,μ>0,h0 = μy0 = 1. 22利用(PCR)来判别DMU的DEA有效性并不直接.考虑(PCR)的对偶规划问题。 若令式(2)的对偶变量为(-λ),式(3)的对偶变量为θ,则上问题的对偶问题为 min(5)njxijxij0,(i1,2,m),(6)j12(DCR)n jyrj0yrj0(r1,2,s),(7)j1j0(j1,2,n)(8)对偶问题(5)-(8)的经济意义很明显:为了评价第j0决策单元的绩效,可用一组假想的组合决策单元与之比较。式(6)、(7)的左端分别是这个组合决策单元的投入与产出,因而模型的意义为,如果θ的最优值小于1,则表明可以找到这样一个假想的决策单元,它可以用比被评价单元更少的投入,获得不少于被评价单元的产出,从而表明被评价的决策单元为非DEA有效。显然,只有当θ=1时,才能表明被评价单元DEA有效。 200DEA有效: 若(DCR)的任意最优解θ ,λj, j = 1,2, , n, 都满足 1,0xjj1n0jx0,0yjj1n0jy0,22利用(DCR)判断DMU的DEA有效性时也不直接.对于DEA模型(DCR),Charnes和Cooper给出了具有非阿基米德无穷小量的DEA模型. 此后,人们又发现用“两步法”判断DMU的弱DEA有效性和DEA有效性(即源于Charnes等人的目标规划形式的“加法模型”. 同时,人们又研究了DEA模型的计算稳定性和灵敏度分析,等等.DEA软件研制.至此,DEA有效性的判别和计算已经完成. 目前,DEA被看成为一种技术,通过明确地考虑多种投入(即资源)的运用和多种产出(即服务)的产生,它能够用来比较提供相似服务的多个服务单位之间的效率。它避开了计算每项服务的标准成本,因为它可以把多种投入和多种产出转化为效率比率的分子和分母,而不需要转换成相同的货币单位。因此,用DEA衡量效率可以清晰地说明投入和产出的组合,从而,它比一套经营比率或利润指标更具有综合性并且更值得信赖。 根据国家测绘地理信息局对全国基础测绘数据1∶10000生产和建库的要求, 实现图库一体化以及国家中小比例数据的联动更新, 提出了对基础数据的整合升级。内蒙古自治区测绘地理信息局在“十一五”和“十二五”这几年基本采用传统航测生产方式生产1∶10000地形图。先外业后内业, 先图后库, 生产两套数据, 需要进行一体化改造;其二, 前几年制定的数据生产标准与国家在全国1∶10000数据库整合升级项目制定的数据规范差别较大, 难以适应国家要求, 急需修订改造。 二、数据库整合任务量和工作内容 内蒙古自治区此次数据库升级整合, 主要完成2010年后生产的1∶10000图幅2006幅数据的整合升级工作。虽说数据较新, 但数据的采集生产与国家局的数据规范有很大的出入, 故需要处理的内容很多, 主要表现在数据的补采、数据属性内容的补充、数据表达方式的改变等多个方面。 数据的补采:主要采集生产方案中缺少的部分, 即面状道路、水系结构线等多个要素;属性项的补充部分主要依据现势资料等从相关部门获取的专业资料来补充, 此次不予外业采集;数据表达式的改变:主要体现在流向等要素上, 此次主要依靠程序自动处理大部分内容, 程序无法自动处理的内容由人工干预处理。 三、资料分析情况 (一) DLG数据现状分析 对照《1∶10000 (1∶5000) 基础地理信息地形要素数据规范》 (以下简称《数据规范》) 和《1∶10000基础地理信息数据库整合处理生产技术规定 (试行稿) 》 (以下简称《技术规定》) , 详细分析现有1∶10000 DLG数据在数学基础、分类代码、现势性、要素及属性内容、采集指标及表达方式、元数据、生僻字等方面的情况。 (二) DEM数据现状分析 我区生产DEM数据11932幅。部分数据采用1980西安坐标系, 还有一部分为CGCS2000坐标系, 按3°分带, 高斯-克吕格投影, 1985国家高程基准。数据格式主要为Arc GIS的BIL格式。数据主要采用数字摄影测量方法生产。 (三) DOM数据现状分析 我区生产1∶10000万DOM数据11932幅。数据采用1980西安坐标系和CGCS2000坐标系, 按3°分带, 高斯-克吕格投影, 1985国家高程基准。数据格式为GEOTIFF。数据年代为所采用的航片资料航摄时间。 (四) 其他专业资料分析 在1∶10000基础地理信息数据整合处理中还用到其他资料来进行补充或更新。 (1) 地理国情普查数据可以用来更新我区1:10000DLG数据。 (2) 数字城市大比例尺数据以及城市高分辨率正射影像数据可用来更新1∶10000 DLG、DOM数据。 (3) 高分辨率影像数据, 主要是优于1米的国情影像数据和近几年主要城市地区优于1米的影像数据。 四、整合处理技术方案 (一) 总体技术路线 1∶10000基础地理信息数据整合处理采用预先分析、总体设计、整合改造、全程质检的技术路线, 主要包括数据分析与准备、专业技术设计、数据整合转换、数据编辑整理、质量检查等。1∶10000DEM、DOM数据的整合转换主要包括数据拼接、坐标系统转换、数据裁切等。1∶10000DLG数据整合处理技术路线见下图。 (二) 整合处理方法与工艺流程 采用统一数据与质量标准, 结合我区1∶10000基础地理信息数据现状, 利用统一规范的技术支撑软件工具, 采用整合更新分步实施的工作模式, 以内业整合优先, 软件处理为主、人工交互为辅的技术方法, 开展数据整合处理工作。即:先对当前1∶10000数据进行整合处理, 待实施条件成熟时再实施数据更新, 逐步达到1∶10000数据规范的要求。 1. DLG数据整合处理 1∶10000DLG数据整合处理采用以内业和软件自动处理为主、人机交互处理为辅助, 必要时采用人工处理的技术方法与作业模式。其中数据格式转换、分类代码转换、要素分层整理、坐标系统转换等内容, 可通过软件自动处理完成;数据模型统一、补充完善更新、编辑整理、质量检查、生僻字处理、元数据整理需要辅以人工完成。整合处理技术方法见上图。 2. DEM、DOM数据整合处理 DEM、DOM数据整合处理的主要工作内容包括数据接边、数据拼接、坐标转换、数据裁切、元数据修改、数据的组织及文件命名修改等。 (三) 数据要素扩展方案 根据我区数据的实际情况, 以及充分考虑图库一体化的思路, 对DLG数据在要素和属性项等方面进行了适当的扩充。 (四) 整合处理技术要求 1. 数据分析与准备 数据准备;代码对照表设计。 2. 数据转换处理 (1) 格式转换 对1∶10000标准分幅DLG数据先将格式转换成ARCGIS Coverage, 按照分区拼接后转换为shape格式。 对1∶10000基础地理信息数据库分层分要素类格式转换成shape格式, 再按分区进行裁切。 将分块的SHAPE格式数据利用整合处理生产软件转成Geoway的GWP工程文件。 (2) 分类编码转换 我区1∶10000DLG数据库建库和更新过程中, 采用的要素分类代码标准不够统一, 分别采用了旧国标、测绘行标、1∶10000建库纲要、地方技术规程等, 且在此基础之上普遍自行进行了一定的扩充和修改。要素分类代码应按《数据规范》进行转换。 转换时, 对原数据的要素分类代码进行分析, 制定新、旧代码转换对照表, 利用软件逐类进行自动转换。 (3) 坐标系统转换 由于大部分的1∶10000DLG数据为1980西安坐标系, 需要统一转换至2000国家大地坐标系。 (4) 结构重组 数据层建立和扩展;要素分层整理;要素属性整理。 (5) 统一数据组织与表达我区1∶10000DLG数据模型主要为地理实体 (GIS) 模型和制图模型, 需要统一转换为地理实体 (GIS) 模型。 按照《数据规范》中“要素选取与表示”的要求, 对数据中的要素内容、采集指标和表达方式进行统一处理。 (6) 统一生僻字处理 使用全国统一的1∶10000地名字库系统 (含已登记编码并造字处理的3000多个生僻字) 录入生僻字。 (7) 统一元数据处理 在《数据规范》中定义的产品元数据基础上, 国家基础地理信息中心按照整合处理生产的需要统一扩展了相关元数据项, 用于记录整合处理生产过程中相关信息。 (8) 数据编辑整理 经过要素分层整理与模型统一后, 对数据进行统一的补充编辑整理, 使数据符合相关规范要求。编辑整理工作主要包括:图形编辑、拓扑处理、图幅接边和分幅裁切等内容。 (9) 图形编辑 对要素的相互关系、几何位置、属性信息等进行分析检查, 结合程序自动处理与人工编辑进行统一处理, 确保整体结果无矛盾和错误情况。 (10) 拓扑处理 重点检查数据层中存在的拓扑错误情况, 如线段的自相交、不合理的悬挂点、要素重复数字化、面层错误压盖、面要素公共边没有重合等。拓扑整理以程序自动检查为主, 辅以人工检查和处理。 (11) 图幅接边 要素经过整合处理后其几何形态或属性发生改变的, 在数据边沿会产生不接边情况, 应对数据进行严格的接边处理。分幅数据沿图幅内图廓线接边, 分区域数据沿区域范围线接边。 各省之间的1∶10000数据接边, 后期生产的省份负责与前期接边, 同期的由各省协调解决。 (12) 分幅裁切 经过坐标转换后的分区域成果数据, 如数据图幅范围与2000国家大地坐标系标准分幅范围不一致, 需将该幅数据与周围区域成果数据进行拼接, 按照标准图幅范围重新裁切。由于相邻图幅等高距不一致导致等高线不满幅的情况应补充, 裁切后的数据内容应完整准确, 无错误和遗漏。 项目将形成标准分幅成果和分区域成果两套。 五、结束语 经过选取不同年份、不同区域、不同地形类别的数据进行了试生产, 技术路线可行, 可以批量数据整合升级。 摘要:本技术方案主要探讨内蒙古基础测绘1∶10000数据整合升级中的数据分析、数据的补采、数据属性内容的补充、数据表达方式的改变等多个方面的技术。并对整个生产作业技术路线进行试生产。 【1数据恢复基础知识】相关文章: 1∶50000 DLG数据质量检查软件05-02 施工现场基础数据04-07 银行基础数据列表07-25 大数据知识要点04-30 城市空间基础数据05-03 数据结构知识总结07-15 创新创业基础数据平台10-23 工程造价基础数据04-21篇2:1数据恢复基础知识
篇3:1数据恢复基础知识
篇4:1数据恢复基础知识
篇5:1数据恢复基础知识
篇6:数据丢失报告1
篇7:数据包络分析(讲稿1)
篇8:1数据恢复基础知识