绿色壁垒外文文献

2022-07-09

第一篇：绿色壁垒外文文献

交通运输外文翻译外文文献

交通事故分析的可能性和局限性

S.Oppe 关键字：后果;目的;描述;限制;关注;事故分析;可能性

摘要：交通事故的统计数字，尤其国家一级的数据对监控和预测事故的发展，积极或消极检测事故的发展，以及对定义安全目标和评估工业安全特别有益。事故分析是应用非常有限的分析，是前瞻性分析和回顾性分析，能够对新开发的交通安全系统和特殊过程的安全措施进行评价。目前迫切需要一个将实时事故分析与研究相结合的行为。将自动检测和视频录制相结合的研究交通事故的科研论文会比较容易接受。这种类型的研究最终会对交通理念有个完善的认识。

1.简介

本文主要是基于个人的经验，研究有关交通安全、安全分析以及事故分析等在研究中的作用。由这些经验推导出的哲学思考就像通过研究和统计得出的实践观点。而这些调查数字已经在其他地方发表了。

在缺少直接观察的事故中，许多方法论问题的产生，导致不能直接测试对结果持续讨论。通过看事故视频来讨论是富有成效的。事实证明，用来解释事故的大部分有关信息就是事故中缺少的记录。深入研究还无法回忆起所有的必要的用来测试有关事故发生的假设数据，。尤其是车-车相撞发生的车祸，这是在荷兰城市道路交叉口录制的视频，一辆从岔路驶来的汽车与主干路的汽车相撞，下列问题可以问：为什么汽车来自次干路上，突然加速后又几乎停止，撞上了在左侧主路的一辆汽车呢?为什么没有注意到正在驶来的车?是不是因为两车从右边驶来，司机因为前面的交叉为他们提供了可能性而斤斤计较?难道他向左看过，但他认为停在拐角处的绿色货车能让他停下来?当然，交通状况并不复杂。目前这个事故中没有骑自行车或行人在拥挤路口分散他的注意。如果停着的绿色车能够在五分钟内消失，这两辆车可能就不会相撞。在事故发生的相关条件下，几乎不可能观察下一个交通行为，因为交通事故是不可预见的。由于新的视频设备和自动检测事故设备的不断发展，如在收集数据方面不需要很高的成本就能变得越来越逼真。必要的增加数据类型也能更好的解释交通中存在的危险因素。关于事故分析的可能性和限制性的问题是不容易回答的，我们不能确切的分析交通事故。因为事故分析涵盖了每一个活动中的不同背景，并根据不同的信息来源范围来补充资料，特别是收集事故的数据，背景资料等，我们首先要看看在交通安全领域的活动周期然后再回答事故分析的可能性与限制。这些行为主要是与交通系统的安全管理有关，有些则是相关的研究活动。

应该用下面的步骤来加以区分： ——检测交通安全问题;

——描述问题和它的主要特征; ——分析其原因分析和改进建议; ——选择和执行安全措施; ——评价所采取的措施。

虽然这个周期可以由同一人或一群人做出来，而问题在每个阶段(政治/管理或科学)都有不同的背景。我们用事故分析来描述这一阶段。做这个决定是重要的。很多关于分析结果的方法的讨论由于忽视之间的区别而成为徒劳的。政治家或道路管理人员对道路的个别事故不是很留意。他们对事故的看法往往都是一视同仁，因为总的结果比整个事故中的每个人的因素重要。因此，每次事故看做一个个体，之间相互协调就会达成安全的结果。

研究人员研究事故发生时一连串事件中每个人的兴趣。希望从中得到关于每次事故的详细信息并能发现其发生的原因和有关的条件。政治家们希望只是因为细节决定行动。在最高一级事故总数减少。信息的主要来源是国家数据库及其统计学处理系统。对他来说，统计意外数字及其统计的波动来进行事故分析。这适用于事故分析中的交通安全领域。因此，我们将首先描述了事故的这些方面。 2.事故的性质和它们的统计特性

事故基本概念是意外，不管是其发生的原因还是引起事故出现的过程。两个简单的假设通常是来描述交通事故的形成过程：

-事故发生的概率与以往发生的事故之间是独立; -事故发生在时间上是同性质的

如果这两个假设成立，那么事故是泊松分布。第一个假设与大多数的批判不符。事故是罕见的事件，因此不会受到以前事故的影响。在某些情况下，有一个直接的因果链(例如，大量的车开到一起)这一系列的事故被认为是一个个体事故但包含许多的车。这个假设并不适用于统计人员伤亡。伤亡人数往往与同一事故有关，因此，独立性假设不成立。第二个假设乍一看似乎不太容易理解。穿越空间或在不同地点发生的的事故同样具有可能性。然而，假设需要很长一段时间并且没有缓缴期。其性质是根据理论的假设。如果其短时间内能成立，那么它也适用于长时间，因为泊松分布变量的总和，即使他们的泊松率是不同的，但也属于泊松分布。对于这些时期的总和泊松率则等于为这些地方的泊松率的总和。假设与一个真正的情况相比较计数，无论是从一两个结果还是总情况来看都有一个基本情况比较符合。

例如，对比在一年中特定的一天例如下一天，下一个星期的一天发生的交通事故。如果条件是相同的(同一时间，交通情况相同，同样的天气条件等)，那么由此产生的意外数字是相同的泊松过程的结果。这一假设可以通过估算进行测试的两个观测值的基础上(估计是两个值的平均值)的速度参数。概率理论能够

考虑到这两个观察值的平均，用于计算的平等假设的可能性。这是一个相当强大的统计过程。泊松假设是研究了很多次，来获得证据支持。它已经应用于许多情况，数的差异表明在安全性的差异然后确定是否发生意外。这一程序的主要目的是检测在安全分歧。这可能是一个时间上的差异，或不同的地方或不同的条件。这种差异可以指导改进的过程。由于主要关注的是，以减少意外的发生，这种分析可能导致对治疗中最有前途的领域。为这样一个测试应用程序的必要条件是，那意外的数字进行比较是大到足以证明存在的分歧。在许多地方情况下，一个应用程序是不可能的。事故黑点分析往往阻碍了这一限制，例如，如果应用这种测试，找出事故是否在特定的位置数是高于平均水平。该程序的描述，也可以使用，如果发生意外乃根据数的特点找到有前途的安全目标。不仅聚集，而且还与分类泊松假设成立，而意外数字可以相互测试的泊松假设的基础。这种测试是相当麻烦的，因为每个特定的情况下，每一个不同的泊松参数，即，对所有可能结果的概率必须计算应用测试。然后，泊松分布近似为正态分布，均值和方差等于泊松参数。一旦均值和方差的正态分布，给出了所有的测试可以改写了标准零均值和

方差的正态分布条件。没有任何更多的必要计算，但测试统计，需要利用表绘制。3. 行车安全政策事故统计的应用

分析那些假设的基础上描述的测试程序的类型及其优点。这种应用最好的例子是为一个国家或地区进行超过一年的安全监测，用事故的总体数据(最终的特定类型，如死亡事故)与前几年的数据相比较。根据数年的事故序列，能够分析出它的发展趋势，并大致预测以后几年的事故数量。一旦建立了这样一种趋势，那么在误差范围内未来一年或几年都可以预见。从一个给定趋势的偏差也可以进行预测新的事件。最有名的是斯米德在1949年进行的分析。我们将讨论这个事故类型分析更详细的内容。

1、该测试应用推广到高阶分类。Foldvary和Lane(1974)，在衡量强制佩戴安全带的效果，谁是最早应用于值的4路表高阶相互作用的总卡方分配的。

2、测试不局限于总体影响，但卡方值就可以分解模型内子假说。另外，在双向表，卡方总可以分解成零件表互动的作用。对1的优势。和2。比以前的情况是，这对许多相互关联的(子)表和相应的智广场卡方检验是由大量分析，取而代之的是一个一卡方的确切划分。

3、投入更多关注的是参数估计。例如，在卡方分割使人们有可能以测试有关行参数的线性或二次限制或趋势的不连续性。

4、分析的单位是从数到广义加权计数。这对于道路安全分析，那里一段时间，道路使用者的数量，地点或公里数的车辆往往是必要的修正有利。最后一个选项是没有发现在许多统计软件包。安徒生1977年给出了一个用于道路双向安全分析表的例子。工资保障运动的一个计算机程序。这一级没有说明事故原因分

析。它会尝试检测安全问题需要特别注意。所需的基本信息包括事故数字，来形容不安全总额，暴露的数据来计算风险，并找到一个高风险的情况下或(团体)道路使用者。

4. 事故分析研究目的

交通安全的研究是有关的事故及其后果的发生。因此，人们可能会说，研究对象是意外。然而研究人员的兴趣较少集中在这个最后的结果本身，而是多在进程更多的结果(或不结果)的事故。因此，最好是把作为他的研究对象，在流量的重要事件。一个在交通意外的过程，结果是，该实际发生是由研究者未落观测研究的主要问题。

调查一宗交通意外，他将努力重建了间接来源的事件，如涉及的道路使用者，所提供的资料或目击者有关情况，车辆，道路和司机的特点。因此这不是科学独特的，也有一个间接的研究对象的研究更多的例子。但是，第二个困难是，该研究的对象不能被诱发。有系统的控制实验手段研究只对问题方面的可能，而不是问题本身。

间接观察和缺乏系统的控制组合使调查人员很难发现在什么情况下造成事故的因素。虽然研究人员主要是在事故处理领导有兴趣，他几乎完全信息的后果，它的产品，意外。此外，事故背景是复杂的。一般来说，可分为以下几个方面：

-考虑到交通系统，交通量和组成国家，道路使用者，他们的速度，天气条件下，路面情况，车辆，道路使用者和他们的相互作用的演习，意外可以或无法预防。

-由于发生事故，也对这样的速度和车辆质量的因素，大量的不同，碰撞角度，对道路使用者和他们的脆弱性，影响等位置的保护，伤害是严重或或多或少物质损失是多还是少可观。虽然这些方面不能独立研究从理论的角度看，它也从由此产生的结果的优势，区分交通情况有潜在危险的数字，是由有一个意外的可能性，在这种潜在的危险局势，给定一个特定事故。

这个概念框架是对风险的关于个别道路使用者，以及上级的决定控制器的决定制定的一般基础。在风险的数学公式，我们需要一个明确的概率空间的介绍，基本事件(的情况)，可能导致事故组成，每个类型的事件的概率，最终收在一次事故中，最后的具体成果，损失，鉴于事故的类型。

另一种方法是看事故特征组合，然后找出关键因素。这种类型的事故分析是通过分析事故的共组或子群来开展。事故本身是一个研究的单位，但也要研究道路因素：道路位置，道路设计(如一个弯道)等。

原文出处：SWOV institute for road safety research Leidschendam(会议记录)，记录者，S.Oppe.

POSSIBILITIES AND LIMITATIONS OF ACCIDENT

ANALYSIS

S.Oppe Keyword：Consequences; purposes; describe; Limitations; concerned; Accident Analysis; possibilities Abstraet：Accident statistics, especially collected at a national level are particularly useful for the description, monitoring and prognosis of accident developments, the detection of positive and negative safety developments, the definition of safety targets and the (product) evaluation of long term and large scale safety measures. The application of accident analysis is strongly limited for problem analysis, prospective and retrospective safety analysis on newly developed traffic systems or safety measures, as well as for (process) evaluation of special short term and small scale safety measures. There is an urgent need for the analysis of accidents in real time, in combination with background behavioural research. Automatic incident detection, combined with video recording of accidents may soon result in financially acceptable research. This type of research may eventually lead to a better understanding of the concept of risk in traffic and to well-established theories. 1. Introduction. This paper is primarily based on personal experience concerning traffic safety, safety research and the role of accidents analysis in this research. These experiences resulted in rather philosophical opinions as well as more practical viewpoints on research methodology and statistical analysis. A number of these findings are published already elsewhere. From this lack of direct observation of accidents, a number of methodological problems arise, leading to continuous discussions about the interpretation of findings that cannot be tested directly. For a fruitful discussion of these methodological problems it is very informative to look at a real accident on video. It then turns out that most of the relevant information used to explain the accident will be missing in the accident record. In-depth studies also cannot recollect all the data that is necessary in order to test hypotheses about the occurrence of the accident.For a particular car-car accident, that was recorded on video at an urban intersection in the Netherlands, between a car coming from a minor road, colliding with a car on the major road, the following questions could be asked:Why did the driver of the car coming from the minor road, suddenly accelerate after coming almost to a stop and hit the side of the car from the left at the main road? Why was the approaching car not noticed? Was it because the driver was preoccupied with the two cars coming from the right and the gap before them that offered him the possibility to cross? Did he look left before, but was his view possibly blocked by the green van parked at the corner? Certainly the traffic situation was not complicated. At the moment of the accident there were no

5 5

bicyclists or pedestrians present to distract his attention at the regularly overcrowded intersection. The parked green van disappeared within five minutes, the two other cars that may have been important left without a trace. It is hardly possible to observe traffic behaviour under the most relevant condition of an accident occurring, because accidents are very rare events, given the large number of trips. Given the new video equipment and the recent developments in automatic incident and accident detection, it becomes more and more realistic to collect such data at not too high costs. Additional to this type of data that is most essential for a good understanding of the risk increasing factors in traffic, it also important to look at normal traffic behaviour as a reference base. The question about the possibilities and limitations of accident analysis is not lightly answered. We cannot speak unambiguously about accident analysis. Accident analysis covers a whole range of activities, each originating from a different background and based on different sources of information: national data banks, additional information from other sources, specially collected accident data, behavioural background data etc. To answer the question about the possibilities and limitations, we first have to look at the cycle of activities in the area of traffic safety. Some of these activities are mainly concerned with the safety management of the traffic system, some others are primarily research activities. The following steps should be distinguished:description of the problem and its main characteristics;selection and implementation of safety measures;the probability of an accident to occur is independent from the occurrence of previous accidents; -the occurrence of accidents is homogeneous in time. If these two assumptions hold, then accidents are Poisson distributed. The first assumption does not meet much criticism. Accidents are rare events and therefore not easily influenced by previous accidents. In some cases where there is a direct causal chain (e.g. , when a number of cars run into each other) the series of accidents may be regarded as one complicated accident with many cars involved.The assumption does not apply to casualties. Casualties are often related to the same accident and therefore the independency assumption does not hold. The second assumption seems less obvious at first sight. The occurrence of accidents through time or on different locations are not equally likely. However, the assumption need not hold over long time periods. It is a rather theoretical assumption in its nature. If it holds for short periods of time, then it also holds for long periods, because the sum of Poisson distributed variables, even if their Poisson rates are different, is also Poisson distributed. The Poisson rate for the sum of these periods is then equal to the sum of the Poisson rates for these parts. The assumption that really counts for a comparison of (composite) situations, is whether two outcomes from an aggregation of situations in time and/or space, have a comparable mix of basic situations. E.g. , the comparison of the number of accidents on one particular day of the year, as compared to another day (the next day, or the same day of the next week etc.). If the conditions are assumed to be the same (same duration, same mix of traffic and situations, same weather conditions etc.) then the resulting numbers of accidents are the outcomes of the same Poisson process. This assumption can be tested by estimating the rate parameter on the basis of the two observed values (the estimate being the average of the two values). Probability theory can be used to compute the likelihood of the equality assumption, given the two observations and their mean. This statistical procedure is rather powerful. The Poisson assumption is investigated many times and turns out to be supported by a vast body of empirical evidence. It has been applied in numerous situations to find out whether differences in observed numbers of accidents suggest real differences in safety. The main purpose of this procedure is to detect differences in safety. This may be a difference over time, or between different places or between different conditions. Such differences may guide the process of improvement. Because the main concern is to reduce the

7 7

number of accidents, such an analysis may lead to the most promising areas for treatment. A necessary condition for the application of such a test is, that the numbers of accidents to be compared are large enough to show existing differences. In many local cases an application is not possible. Accident black-spot analysis is often hindered by this limitation, e.g., if such a test is applied to find out whether the number of accidents at a particular location is higher than average. The procedure described can also be used if the accidents are classified according to a number of characteristics to find promising safety targets. Not only with aggregation, but also with disaggregation the Poisson assumption holds, and the accident numbers can be tested against each other on the basis of the Poisson assumptions. Such a test is rather cumbersome, because for each particular case, i.e. for each different Poisson parameter, the probabilities for all possible outcomes must be computed to apply the test. In practice, this is not necessary when the numbers are large. Then the Poisson distribution can be approximated by a Normal distribution, with mean and variance equal to the Poisson parameter. Once the mean value and the variance of a Normal distribution are given, all tests can be rephrased in terms of the standard Normal distribution with zero mean and variance one. No computations are necessary any more, but test statistics can be drawn from tables. 3. The use of accident statistics for traffic safety policy. The testing procedure described has its merits for those types of analysis that are based on the assumptions mentioned. The best example of such an application is the monitoring of safety for a country or region over a year, using the total number of accidents (eventually of a particular type, such as fatal accidents), in order to compare this number with the outcome of the year before. If sequences of accidents are given over several years, then trends in the developments can be detected and accident numbers predicted for following years. Once such a trend is established, then the value for the next year or years can be predicted, together with its error bounds. Deviations from a given trend can also be tested afterwards, and new actions planned. The most famous one is carried out by Smeed 1949. We will discuss this type of accident analysis in more detail later. 1. The application of the Chi-square test for interaction is generalised to higher order classifications. Foldvary and Lane (1974), in measuring the effect of compulsory wearing of seat belts, were among the first who applied the partitioning of the total Chi-square in values for the higher order interactions of four-way tables.

2. Tests are not restricted to overall effects, but Chi-square values can be decomposed regarding sub-hypotheses within the model. Also in the two-way table, the total Chisquare can be decomposed into interaction effects of part tables. The advantage of 1. and 2. over previous situations is, that large numbers of Chi-square tests on many interrelated (sub)tables and

corresponding Chi-squares were replaced by one analysis with an exact portioning of one Chi-square. 3. More attention is put to parameter estimation. E.g., the partitioning of the Chi-square made it possible to test for linear or quadratic restraints on the row-parameters or for discontinuities in trends. 4. The unit of analysis is generalised from counts to weighted counts. This is especially advantageous for road safety analyses, where corrections for period of time, number of road users, number of locations or number of vehicle kilometres is often necessary. The last option is not found in many statistical packages. Andersen 1977 gives an example for road safety analysis in a two-way table. A computer programme WPM, developed for this type of analysis of multi-way tables, is available at SWOV (see: De Leeuw and Oppe 1976). The accident analysis at this level is not explanatory. It tries to detect safety problems that need special attention. The basic information needed consists of accident numbers, to describe the total amount of unsafety, and exposure data to calculate risks and to find situations or (groups of) road users with a high level of risk. 4. Accident analysis for research purposes. Traffic safety research is concerned with the occurrence of accidents and their consequences. Therefore, one might say that the object of research is the accident. The researchers interest however is less focused at this final outcome itself, but much more at the process that results (or does not result) in accidents. Therefore, it is better to regard the critical event in traffic as his object of study. One of the major problems in the study of the traffic process that results in accidents is, that the actual occurrence is hardly ever observed by the researcher. Investigating a traffic accident, he will try to reconstruct the event from indirect sources such as the information given by the road users involved, or by eye-witnesses, about the circumstances, the characteristics of the vehicles, the road and the drivers. As such this is not unique in science, there are more examples of an indirect study of the object of research. However, a second difficulty is, that the object of research cannot be evoked. Systematic research by means of controlled experiments is only possible for aspects of the problem, not for the problem itself. The combination of indirect observation and lack of systematic control make it very difficult for the investigator to detect which factors, under what circumstances cause an accident. Although the researcher is primarily interested in the process leading to accidents, he has almost exclusively information about the consequences, the product of it, the accident. Furthermore, the context of accidents is complicated. Generally speaking, the following aspects can be distinguished: Given an accident, also depending on a large number of factors, such as the speed and mass of vehicles, the collision angle, the protection of road users and their vulnerability, the location of impact etc., injuries are more or less severe or the material damage is more or less substantial. Although these aspects cannot be studied independently, from a theoretical point of view it has advantages to distinguish the number of situations in traffic that are potentially dangerous, from the probability of having an accident given such a potentially dangerous situation and also from the resulting outcome, given a particular accident.

This conceptual framework is the general basis for the formulation of risk regarding the decisions of individual road users as well as the decisions of controllers at higher levels. In the mathematical formulation of risk we need an explicit description of our probability space, consisting of the elementary events (the situations) that may result in accidents, the probability for each type of event to end up in an accident, and finally the particular outcome, the loss, given that type of accident.

A different approach is to look at combinations of accident characteristics, to find critical factors. This type of analysis may be carried out at the total group of accidents or at subgroups. The accident itself may be the unit of research, but also a road, a road location, a road design (e.g. a roundabout) etc.

第二篇：外文文献检索

万方数据库

1. The NASA Astrophysics Data System -- 世界最大免费全文网站，超过300,000篇全文

主要学科：天体物理学

2. HighWire Press -- 世界第二大免费全文网站，超过235，812篇全文主要学科：生物学、医学

3. arXiv.org 主要学科：物理、数学、非线性科学、计算机科学等。文件格式以PostScript为主，如没有相应的阅读软件，可以选择生成PDF文件格式。

4. Behavioral and Brain Sciences 主要学科：行为科学、脑科学

5. Centers for Disease Control and Prevention (CDC) 主要学科：医学

6. CogPrints 主要学科：心理学、神经科学、行为科学、语言学、人工智能、哲学

7. GPO Access 美国政府文献

8. Inter-university Consortium for Political and Social Research (ICPSR) 世界最大的社会科学文献网站

9. National Academy Press 美国国家科学院、国家工程院、医学协会等机构报告

10. National Center for Health Statistics (NCHS) 美国国家卫生统计中心的统计报告

11. NCSTRL 计算机科学研究报告和论文

12. Project Gutenberg Electronic Public Library 电子图书，2002前提供10000种全文电子图书

13. Thomas Legislative Information on the Internet 美国国会图书馆提供的美国国会报告和历史文献

14. UNESCO 联合国教科文组织提供的文档

15. United States Geological Survey 美国地质考察报告

16. World Development Sources (World Bank) 世界银行报告 17. Delphion 世界各国专利，可看到前十三页全文

18 美国数学学会(AMS)的三种免费期刊 Bulletin

Electronic Research Announcements

Notices of the American Mathematical Society

19 Physics Today 美国物理学会(American Institute of Physics)提供的免费杂志

20 Frontiers in Bioscience 生物科学期刊和图书，文章被Biosis、CA、Medline等重要二次文献数据库引用

21 The World Wide Web Journal of Biology 被Biosis Previews引用

22 Science Magazine 23 Scientific American 24 ACM Digital Library 25 Issues in Science and Technology 《科学与技术问题》，美国。

1984年创刊，全年4期，ISSN 0748-5492，National Academy of Sciences，探讨和阐述科学、技术和卫生事业发展中的政策问题。

26 Bulletin of Symbolic Logic 《符号逻辑通报》，美国。

1995年创刊，全年4期，ISSN 1079-8986，刊载数学、哲学、计算机、语言学等领域中有关符号逻辑方面的论文、书评和会议论文摘要。

27 Progress of Theoretical Physics 《理论物理学进展》，日本。

1946年创刊，全年12期，ISSN 0033-068X，发表日本理论物理学者的研究成果。文章用英文、德文、法文发表。

28 Australian Journal of Physics 《澳大利亚物理学杂志》，澳大利亚。

1948年创刊，全年6期，ISSN 0004-9506，刊载物理学(从基本粒子到天体物理学)领域的研究论文、简讯和评论。

29 New Journal of Physics 《新物理学杂志》，英国。

1998年创刊，ISSN 1367-2630，是一种全文电子杂志,它在物理学领域相当具有权威性。该杂志编辑竭力通过出版对物理学家有益并能引起物理学家关注的高品质文章，从而把《新物理学杂志》办成本领域最主要的科学杂志。

30 Journal of Biological Chemistry 《生物化学杂志》，美国。

1905年创刊，全年52期，ISSN 0021-9258，Journal of Biological Chemistry Subscription，刊载生物化学领域的研究成果。高价刊。

31 Chemical and Pharmaceutical Bulletin 《化学与药学通报》，日本。

1953年创刊，全年12期，ISSN 0009-2363，发表生物分析化学、生物化学、药理学、毒理学和生物药学方面的研究论文及报告，用英文出版。

32 Journal of Micromechanics and Microengineering 《微型机械与微型工程杂志》，英国。

1991年创刊，全年4期，ISSN 0960-1317，刊载微型机电、微型机械和真空微电子技术方面的研究论文，涉及微型系统的控制、程序和建造、微型结构和器件、集成电路、电子与光子器件等基本结构、器械和系统设计研究。

33 VDI-Z 《德国工程师协会综合生产杂志》，德国。

1857年创刊，全年12期，ISSN 0042-1766，刊载机器制造、金属加工工艺、生产规划管理、生产系统、生产评价以及金属加工设备与系统等方面的论文，兼及行业新闻、新产品介绍。

34 Modern Machine Shop 《现代机械车间》，美国。

1928年创刊，全年12期，ISSN 0026-8003，全面报道制造与机械工业的新闻和技术信息，内容包括工程、工业机器人、研究与开发、程序设计、安全规则与设备等。

35 Process Engineering 《加工工程》，英国。

1920年创刊，全年12期，ISSN 0370-1859，刊载化工加工技术以及设备、材料和保养等方面的文章。

36 Signal 《信号》，美国。

1946年创刊，全年12期，ISSN 0037-4938，美国武装部队通信与电子学会的会刊，刊载有关电信、电子和技术摄影在军事应用方面的文章，以及指挥、控制、通信与情报的研究进展报道。

第三篇：1300外文文献翻译

Agricultural Land and Regulation in the Transition Economy of Russia Ekaterina Gnedenko1 & Michael Kazmin2 Published online: 7 July 2015 # International Atlantic Economic Society 2015 JEL Classification C10 . L33 . O57 . Q00 This research note explores the link between farmland conversion and existing land regulation in Russia. We conclude that lan

俄罗斯经济转型中的农业用地与监管

Ekaterina Gnedenko1 & Michael Kazmin2。在线出版:2015年7月7日。国际大西洋经济学会2015。冻胶分类C10。L33。O57。Q00 本研究报告探讨了俄罗斯农地转换与现有土地规制之间的关系。我们的结论是，土地监管滞后于俄罗斯转型经济的新市场趋势。由于市场力量继续渗透经济，在地方土地利用规划和管理方面显然存在管理和法律问题，妨碍了更有效地利用土地。为了应对吸引农业投资的需要，俄罗斯科学和教育部为我们的研究项目提供了资金，该项目涉及对政府政策和农田损失之间相互依赖关系的主要数据收集和计量分析。我们独特的数据集包含社会经济、人口和空间。2010年莫斯科都市地区39个市辖区的地理数据。通过对该数据集的计量分析，探讨了在联立方程框架下，耕地数量、其评估值、私有化耕地占比、农地税和土地利用区划之间的关系。

虽然俄罗斯房地产市场发展迅速，但农业用地市场仍很薄弱。农田交易是有限的，部分原因是土地产权的不确定性挥之不去。国有农田仍然很重要。我们的莫斯科地区数据显示，私有化耕地和耕地面积的比例之间存在着强烈的正相关关系，尽管单独和集体私有化耕地的比例仅为57%。禁止向外国人直接出售农田，也禁止减少潜在的外国投资。因此，农地占用的面积一直在稳步下降，质量也在不断恶化。在1990年至2005年期间，俄罗斯的可耕种土地减少了1050万公顷(占耕地面积的7.9%)。

由于缺乏经验和足够的知识，地方政府只能依靠前苏联提供的土地保护政策。特别是，为了遏制主要农田的流失，监管机构保留了禁止改变土地状况的旧土地用途分区法。然而，强大的发展压力和广泛的腐败往往会消灭分区制的理想效果。我们的计量分析结果表明，靠近莫斯科城市和人口增长对农田的数量有显著的负面影响，即使是在严格的农业地区，这表明莫斯科的首都地区的城市压力很大。在人口增长方面，耕地面积的估计弹性为0.3。非法改变土地状况的一种腐败做法，反映在土地仍然被归为联邦土地登记册上的土地的土地被转变为住宅或工业区的事实。这标志着一个管理问题，也许可以通过引进更灵活的分区和增加地方政府的责任范围和土地的财产权来解决。

其他经济工具不可或缺的土地政策、土地评估,也是基于前实践后共产主义时期的联邦法律规定的一般公式,考虑土壤生产力标准,地貌景观的灌溉的存在,但仍然没有与市场价格的农田。农业土地税计算时的评估价值的百分比农田,这通常是低于其实际市场价值,当地政府发展当地的农业基础设施不感兴趣或增加农业用地基地,因为他们将无法获得任何重大税收优惠。再加上联邦政府规定的低税率(占农业和居住用地评估价值的0.3%)，这将导致当地税收收入不足，并过度依赖政府间转移。根据我们对莫斯科地区的数据，虽然地方倾向于征收最高允许的税率，但地方预算的土地税收收入的平均份额仅为5%。据我们收集的数据显示，由于各城市的农田平均分摊价值比目前的平均销售价格低1000倍，这并不令人惊讶。

由于土地价值被低估而导致的地方土地税收不显著，导致地方基础设施投资不足，进一步抑制了农田价值，加快了土地流转。经济计量分析结果表明，在莫斯科地区，耕地和耕地数量的评估价值缺乏统计意义，使得农地税率在土地政策中是无效的。耕地数量和现有土地政策之间缺失的联系可能使这些政策不仅无效，甚至是浪费。政府保留发展权利等创新办法可能是一种临时解决办法。在解决地方问题上日益依赖地方治理，将意味着改善土地利用和公共财政规划，也许还会减缓农地转换的趋势。

第四篇：王雷外文文献翻译

三连杆铰接式机器手臂的设计控制和实施

毕业论文提交

阿克伦大学研究生学院

申请学位理学硕士

Donald R. Dentler II

2008.8月

摘要

在自动进行的最重复的和最复杂的任务范围和生产环境中，机器人已成为司空见惯的了。随着技术的进步，机器人技术的发展，需要更精确和实用。本研究的目的是通过使用三杆铰接式机器手臂来研究机器人系统的行为。在深入介绍各种包括执行器，控制器和驱动程序后。机械手臂设计将遵循物理定理满足静态和动态需求。设计过程包括两个检查结构的要求和控件实现。组件选择必须优化性能和物理性能设计。通过使用机器人手臂和模拟运动的程序，协调解决出现的关于前进后退的(动力)传输问题。

第一章

简介

机器人已经成为平常在生产环境中，使得从重复性最高的任务到最复杂的实现自动化。随着科技的发展，机器人需要发展成更精确和实用。这项研究的目的有两个。第一，此文本应作为机器人和用于控制的机器人系统的力学的概述。第二，本文介绍的机器人技术原则和一般在设计中所涉及的工程知识应用和操作的机器人手臂类似。第二章概述的机器人系统的元素。详细地介绍了执行器、控制器和驱动电路，以及计算机接口。更详细的是联系这些组件于一体的物理准则。

第二章

机器人系统概述

通常，机器人用于执行困难、危险或对人类来说单调的作业。他们举起重物、油漆、焊接、处理化学品，其长时间执行工作而不会疲劳。机器人由各自的运动性质所决定。本节介绍机器人有以下的分类： • 笛卡尔

• 圆柱

• 极地

• 铰接式

笛卡儿机器人

笛卡尔或龙门机器人由三棱柱形接头 (图 1) 受限制的运动来定义。由矩形造成的重合的轴定义工作区圆柱机器人：

如果直角坐标机器人的棱柱形接头之一交换的关节型，形成了一个圆柱的机器人。圆柱机器人的运动是由圆柱的坐标系定义的。图 2 说明了带壳圆柱工作区

旋转接头球机器人：

两棱柱形节点形式球形机器人。球形、或极性，机器人是其轴构成极坐标系统的设备。这个机器人手臂工程工作在带壳球区中，图 3 所示。

铰接式机器人：

代以关节型最终棱柱形接头变成机械臂的手臂。任何其手臂已至少三个旋转接头的机器人被认为是一种铰接式的机器人 (图 4)。工作区是一套复杂的交叉领域。

在机器人领域的最常用作动器的电动马达，其分为步进或伺服的类型。步进电机开环系统中的最佳表现和伺服电动机非常适合封闭的环的应用程序。将随开放和封闭环路系统详细讨论这些两个具体的执行机构。

步进电机步：

步进电机是简单的机械，相比其他电机在内部没有复杂设计。电枢转动是通过按顺序切换磁场中实现的。步进电机的类型，基于永久磁铁和/或铁转子的使用与叠层钢定子的不同可以分为三个类别：

• 永磁

• 变磁阻

• 混合。电机绕组：

混合步进电机定子，可以以两种方式，unifilar 和双线绕组。线圈影响当前电流如何流经电机，和马达又如何执行。

Unifilar绕组：

Unifilar 有只有一个定子磁极线圈。图10阐释了典型的 unifilar 电机的接线原理图：双线绕组：

双线绕组电动机有两个一模一样的绕组对每个定子极点来说。图 11 演示了这两个 6 和 8 铅配线图。

步进电机可能会加强取决于如何以及何时定子电压式三种方式之一。步进模式有：

• 全步模式

• 半步模式

• 斯达微步模式

驱动程序功能确定哪些步进模式是用户可用的。完整步进：

标准混合步进电动机有 200 转子牙齿或 200 每电机轴的革命的全部步骤。200 的步骤分为 360 度旋转，等于 1.8º 全步的角度。通常情况下，完整步骤模式被通过交替倒车当前时断电两个线圈。本质上，从驱动程序的一个数字输入是等效的一步。半步进：

进半步只是意味着一电机的 200 牙齿旋转在革命每 400 步骤。在此模式中，一个线圈通电，然后两个线圈激发交替，导致在半的距离或 0.9º 旋转转子。半步进是更实际的解决办法不过，在工业应用中。尽管它提供了稍差一些的扭矩 (约 70%的电机额定的控股扭矩)，半步模式增加全步模式的决议，并增加位置精度。扭矩减少可以通过相应地调整大小马达来抵销该应用程序。

微步：

细分是相对较新的步进电机技术，用于控制当前在电机绕组进一步细分的两极之间的职位数目的程度。目前，斯达微步驱动程序都可以旋转，1/256 的一步 (每步) 或超过 50,000 每革命的步骤。这提供电机手术非常顺利，为减少机械噪声和系统共振。这种增强的性能与权衡下跌电机扭矩。图 12 海图的扭矩减少单步是划分。每步电机 256 步骤只生产 0.61%的全部持有扭矩。在某些情况下，这不可能甚至是足够的扭矩，旋转的轴，这将影响电机的准确性。

伺服电动机：

"伺服电机"一词没有指向一个单一种电动机。相反，它是指任何类型的命令信号接收从控制器的电机。在这同一方面，任何闭环系统可以被称为伺服系统。图 13 关系图一种典型的伺服系统的运作。

这种灵活性允许的几种适合类型的电动马达在伺服系统中使用。这些电动马达包括：

• 永磁直流电动机

• 无刷直流电机

• 异步交流电机

电磁电机运行基于原则上带电导体在磁场中的磁场力是垂直于该字段。这是由定义：

F =qv *B

(1)

其中：

• F 是描述磁力

• q 的向量是电荷

• v 的严重程度是带电粒子速度

• B 的矢量幅度是描述磁场的矢量

不过，电动马达的情况下，可作为标量量化力：

F = I * L * B

(2) 其中：

• F 是线圈的磁力

• i是线圈中的电流 • L是线圈的长度 • B是磁场强度

永磁直流电动机: 直流永磁电机基于永磁步进电机，一个类似的概念，但它是机械逆。PM 步进依赖固定线圈和附加到转子动产的磁铁，直流永磁电机却平稳的电磁铁。线圈缠在转子和换向器，这可以切换当前的方向，并导致电机顺时针旋转或逆时针方向通过电刷耦合 (图 14)。因为当电流在时，电机轴将可以自由旋转，编码器必须用于向控制器提供反馈。直流永磁电机较为常见，但是很多的马达问题与相关的电刷和通勤之间的接口，可以是成本效益。这两个组件之间的接触导致摩擦，并可以打乱了较高的速度。无刷直流电机解决了这些问题。

无刷直流电动机 [17] : 一个无刷直流电机换向器替换电子控制器的电刷。此控制器保持固定线圈中适当的电流。图 15 显示基本图的无刷直流电机。

应当指出的是无刷直流电机的内部布局看上去非常类似于永磁步进，然而依赖反馈装置如霍尔效应来跟踪的转子位置传感器直流无刷电机。这提供了精确的速度控制。无刷直流电机有更高得初始成本比传统的直流电机，但这些费用通常由提高了性能和消除的替换电刷所需的维修费用。

电机驱动电路：

通常诱使电机旋转的必要扭矩产生的控制电路的电流不足够高。为此，受雇驱动电路。他们管理由电动机电流较高和数字控制信号从控制器转换由电动机的运动。驱动程序还管理的电流产生顺时针或逆时针旋转运动的方向。步进电机驱动程序的类型

一般，有三种基本类型的步进驱动程序技术，它们是：

• 单极

• 电阻/有限驱动器电阻

• 双极斩波

所有驱动程序利用"翻译"的步骤和方向的信号从索引器转换到电动机的电脉冲。"交换机设置"或瘳电机绕组的电路的驱动程序选项的本质区别。图 21 显示从控制器步进电机的信息的流动。

单极驱动器：

一个单极驱动器由与中心抽头绕组的或两个单独的绕组每相，这限制了当前指向一个方向流动。将反向，从一个移动当前使用每个相位，两个交换机，如图 22 所示的另一半绕组的一半。因此，单极的交换机集是驱动器的简单又便宜。然而，单极驱动器利用只有一半可用导电线上的卷清。因此，单极的驱动程序的输出扭矩被减少了将近 40%相比其他技术。单极的驱动程序的速度相对较低的一步操作的应用程序中有用。

电阻/有限驱动器电阻：

有限 (R/L) 驱动程序简单又便宜。驱动程序限制供电电压和绕组的电阻电流。通过增加供电电压的高速性能得到改进。此增加的供应电压 R/L 驱动器中必须附有额外的电阻器的限制 (图 23) 上一级电流线圈系列。此称为滴的电阻器的电阻被添加到保持有用的速度在增加。这种方法的缺点是滴电阻器的功率损失。此过程还会产生过多的热量，必须依靠其当前的源的直流电源。双极斩波两极斩波器：

到目前为止，双极斩波两极斩波器驱动程序用于工业应用最广泛使用的驱动程序。虽然他们通常设计更昂贵，但他们提供高性能和高效率。此驱动程序采用了两种不同的原则，来控制在电机绕组的当前流：双极开关集和截流。本节解释了这两个。双极性的驱动，顾名思义，切换当前方向上单绕组转移跨终端的电压极性。极性开关来实现使用四个交换机配置如图 24 所示。此配置称为 H 桥。

斩波器驱动程序背后的方法是马达的使用是马达的导致显著增加，在当前的标称电压比高出数倍的供电电压。通过控制工作周期的菜刀，创建了平均电压和平均当前平等名义电机电压和电流。此恒流控制的优势是，具有较大的扭矩，无论电源供电电压变动的管理。它还提供了最短可能当前集结和逆转的时间。

此外，这些驱动程序使用与循环二极管和维护反馈电压成正比电机当前的感应电阻器的 H 桥的四个晶体管。电机绕组，使用双极斩波器驱动程序，都要充分供应水平受到打开开关晶体管的一套。感应电阻发展线性上升，直至达到所需的级别比较器由监察的电流与电压。此时的顶尖的开关打开并通过底部的开关和二极管维护电机线圈中的电流。电流衰减发生直到达到预设的位置并重新开始这一进程。这种"劈"效果是供应的什么维护正确的当前电压电机在所有时间 (图 25)。

图 26 所示 H 桥配置为恒定电流斩波。取决于如何在关闭期间切换 H 桥，当前要么通过一个晶体管和一个二极管 (路径 2) 重新分发，给当前的慢衰减，或通过电源 (路径 3) 重新分发。

伺服电动机[6]：

使用电子脉冲控制伺服驱动程序。通常情况下，使用规管脉冲晶体管。有三个基本的晶体管电路用于伺服电机控制 ;线性脉冲，脉冲宽度调制和脉冲调制频率。线性驱动程序：

线性驱动程序运行使用晶体管，但在规管的供电量始终处于活动状态。晶体管作为一个阀，，基于输入电压，它从连接的电压源绘制的当前。以这种方式，控制器作为一个水龙头。例如，如果晶体管收到全系列输入电压的一半，然后电机运行在半电源。线性驱动器提供一个稳定的电机转速和控制。脉冲宽度调制驱动程序：

脉宽调制驱动程序通过调整不同的时间周期，它适用于电机调节电源。这种方式，平均功率控制通过脉冲的工作周期。如果脉冲宽 (亦即，电源周期) 发送到的平均功率电机是高导致其转得更快，等等。图 27 所示脉冲宽度是如何确定的平均电压。这种方法的优点是因为全额功率消耗的晶体管它始终是处于完全在低电压下或短路状态。需要更少的电力意味着晶体管可以小一些，导致可使用较小包装的驱动程序。脉冲频率调制驱动程序：

能控制的不是同脉冲的工作周期，而不是本身的脉冲宽度。这种技术被称为脉冲频率调制。PFM 驱动程序运行在给定的时间段生成高的平均电压和许多生成低的平均电压脉冲应用到几个脉冲。图 28 演示脉冲频率调制的概念。随着 PWM，晶体管要么是完全打开或关闭。由于对调制脉冲频率所需的系统比较复杂，脉冲频率调制的驱动程序并不常用。

计算机接口：通常情况下，设机器人控制器的计算机。计算机可以翻译数据脉冲马达驱动程序所处理的程序的命令。本节概述了其中一个最常见的接口、并行端口和如何跨它传输数据的详细信息。

并行端口 [7] [8]：

当 PC 将数据发送到打印机或其他使用并行端口的设备时，它可以同时发送数据 (1 字节) 的 8 位。这些 8 位在相互平行被传输，相对于同一八位正在传输顺序进行，一次通过串行端口 1 位。标准的并行端口是能够发送的数据，每秒 50 到 100 kb 为单位。图 29 显示的常见的配置并行端口，有 25 针的 DB25 的布局。以下是针脚的说明： • 针 1 — — 维护 2.8 和 5 伏特，称为闪光信号之间的电压。数据发送到打印机时，电压低于 0.5 伏计算机发送一个字节的数据。

• 针脚 2 — —9 通过使用 PC 和接收实体之间交换数据。一种简单方法，用于指示是否有点的值为 1 或 0。每次电平5 伏通过发送特定的针的位值为 1。电平指示值为 0。 • 针 10 — — 在针 1 相似的方式运行。电压降指示到确认收到数据的计算机。这被称为确认信号。·

• 11 — — 通常用作打印机忙的信号时被控销。在打印机准备好接收更多的数据时，电压低于 0.5 伏。

• 针 12 — — 一个被控在打印机缺纸时的 5 伏信号。

• 针 13 — — 打印机联机信号。不断的反应，表明打印机是积极和准备好接收信息。 • 针 14 — — 自动喂给移动通过系统纸打印机的信号。

• 针 15 — — 错误信号，让计算机知道是否有任何问题。它表示错误使用低于 0.5 伏，类似于其他的针脚，电压降。

• 针 16 — — 低于 0.5 伏的电压降初始化打印机. • 针 17 — — 正在充电会使打印机脱机。直到宜使打印机联机. • 针脚 18-25 — — 这些都是要用作低 (低于 0.5 伏) 电平的参考信号的地面针脚。十六进制转换：

当从一个端口写入或读取，整个字节 (8 位) 的状态将定义一次。当更新的状态时，二进制数是写入 (或从读取) 的端口 1 或 0 的每一位。例如，如果要将移动到逻辑状态 1 2 和 7 针的二进制的输入应 0,0,1,0,0,0,0,1。为加快编程，以其十进制等效，33 输入此号码(表 2 显示公约 ) 将转换为二进制与十进制数字十六进制。虽然表在这里被截断，点票可以轻松地继续达 255 (最多可以写入一个字节) 使用此方法。例如，十进制的规模 16 对应于 10000 的二进制的规模。此外，应该指出的是添加前导零为二进制数不会增加其十进制值。换句话说，如果逻辑状态设置为 1针上 2 和其他的针脚上 0 二进制输入将 00000001，但它仍会输入 1 作为十进制格式。

第三章

机器人臂的设计

本节讨论具体的假设和有关为这项研究的目的建造的机械臂设计参数。

速度：

一个三角形速度配置文件被假定为这项研究。加速和减速都被假定为 5 秒。峰值 ω 和峰值 α 分别为峰值角速度和加速，并定义：

peak ω= 0.3142 peak ω rad/s α= 0.0628 peak α rad/s2 peak 运动学设计：

机器人由3个完全旋转接头构成。其自由度是3。控制：

使用此设计的控制器三轴，开放环阻力有限 (R/L) 型控制器。

执行器：

步进电机被选为这个机器人手臂的驱动器。

材料：

6061 T6 铝用于这个机器人手臂和加工性能组件的大多数。321 不锈钢建造底座部分。

机械手臂设计：

专为这篇论文使用在南汽软件建模设计的 3 连杆链接的机器人手臂的装配图。图 37 显示装配图，而图 38 给组件的分解视图。

机器人工作区：

工作区是通过图41和39 定义的。深度是 4.5 英寸、高度是 15.0 英寸和总共 (链接 0) 旋转角度是 90 °，由 [0,90] 的范围定义 (图 40)。链接 1 允许具有一系列变化范围 [-40,70] (图 41 (a))，共有 110 ° 和链接的旋转 2 允许的范围 [-80,90] (图 41 (b))，总的 170 ° 旋转。

翻译：王雷

班级：机自0804

时间：2012/3/20

*以上即为对此文献对应的翻译，其中图片只在原文(英文)文献中标出。

第五篇：4-外文文献译文

毕业设计(论文) 外文文献原文及译文

毕业论文题目：常用博客和论坛数据自动抓取系

统的设计与实现

文献中文题目： UbiCrawler：一种可扩展的全分布式

网络爬虫

文献英文题目： UbiCrawler: a scalable fully distributed Web crawler 专业软件工程学

号学生姓名指导教师答辩日期 2015-06-25

哈尔滨工业大学哈尔滨工业大学本科毕业设计(论文)(外文文献)

外文文献译文

UbiCrawler：一种可扩展的全分布式网络爬虫

1. 引言

在本文中我们介绍ubicrawler的设计与实现，一种可扩展的，可容错的全分布式网络爬虫，并且我们从先验和后验两方面评估了它的性能。ubicrawler设计的整体结构在[1]，[2]和[3]进行了描述。

这项工作是一个项目的一部分，其目的是收集大量的数据集，研究Web的结构。这是从统计分析特定的网络域[4]估计的分布经典参数，如页面排名 5]和重新设计阿里安娜发展的技术，最大的意大利搜索引擎等。

由于该项目的第一阶段，我们发现集中爬虫已不再是足够的在网络中抓取有意义的部分。事实上，它已经认识到，“作为网络的大小成长，成为爬行的过程并行化势在必行，为了完成下载页在一个合理的时间量[6,7]。

许多商业和研究机构运行他们的网络爬虫收集关于Web的数据。即使没有可用的代码，在一些情况下，基本的设计已被公开：这都是是案例，例如，墨卡托 [8](AltaVista爬虫)，原来的谷歌爬虫[9]，和一些在学术界的爬虫{10–12]。

尽管如此，几乎没有发表的作品实际上探讨了在爬行过程中所涉及的不同任务的并行化这个基本的问题。特别是，我们知道的所有的方法都是使用某种集中管理，决定去访问哪些网址，并存储已经被抓取的网址。最好，这些组件可以被复制，他们的工作可以被划分为静态。

相反，当设计ubicrawler，我们决定把每一项任务，具有明显的可扩展性和容错性方面的优势。

ubicrawler的基本特征： • 平台独立性;

• 充分分配每一个任务(没有单一的故障点和没有集中协调); • 基于一致哈希的局部可计算的地址分配;

• 容忍故障：永久性以及短暂的优雅地处理故障; • 可扩展性。

- 1哈尔滨工业大学本科毕业设计(论文)(外文文献)

• 网址的分布应该是平衡的，即，每个代理应该负责约相同数量的网址。在异构代理的情况下，网址的数目应该是成正比的代理的可用资源(如内存，硬盘容量等)。

可扩展性。每秒的页面数和代理应该是(几乎)独立的代理数量。换句话说，我们期望的吞吐量与代理的数量呈线性增长。

文雅性。一个平行的爬虫决不应该试图从一个给定的主机上获取一页以上的一页。此外，一个合适的延迟，应在随后的请求之间引入相同的主机。

容错性。一个分布式的爬虫应该能继续工作在崩溃故障下，这是当一些代理突然死亡的时候。在这种崩溃的存在下，没有行为可以被假定，除了有缺陷的代理停止通信;特别是，一个不能规定任何行动，一个崩溃的代理人，或恢复其状态之后。当一个代理崩溃，剩余的代理应继续满足就地平衡计算分配的要求：这意味着，在特定的URL，这架代理将被重新分配。

这有2个重要的后果。

• 不可能假设网址是静态分布。

• 由于“就地平衡计算任务的要求必须满足在任何时间”，在崩溃之后依靠分布式分配协议这是不合理的。事实上，在重新分配的要求将被破坏。

3. 软件体系结构

ubicrawler由几个代理，自主协调它们的行为，在这样一种方式，每个人扫描其网络的共享。一个代理执行它的任务，通过运行多个线程，每一个单独的主机单独访问。更确切地说，每一个线程扫描一个主机使用广度优先访问。我们确保不同的线程访问不同的主机在同一时间，因此，每个主机不超载太多的要求。这是不是本地主机的给定样本被派遣到代理权，使其在页面被访问队列。因此，整体的Web访问是广度优先，但尽快达到一个新的主机，它是完全访问(可能有界深度达到或总页数)，再次在广度优先的方式。

更先进的方法(可以考虑适当的优先级相关的网址，如，他们的排名)可以很容易地实现。然而，值得注意的是，有几个作者(见，例如，[13])认为，广度优先访问倾向于在爬取的时候找到高质量的网页。关于页面质量的一个更深入的讨论，在第6节中给出。

哈尔滨工业大学本科毕业设计(论文)(外文文献)

一个重要的优势是，每个主机广度优先访问DNS请求是罕见的。网络爬虫使用全球广度优先策略必须在DNS服务器的高延迟：这通常是由一个多线程缓存缓冲请求通过了。同样，没有缓存是由“机器人排除标准”[ 14 ]所需的robots.txt文件需要;事实上这样的文件可以下载，当主机访问开始。

代理的主机分配考虑到在每个代理的质量存储资源和带宽。这是目前所做的一个单一的指标，称为能力，这是作为一个权重的分配功能分配主机使用。在某些情况下，每一个代理的主机比例的比例，其容量的主机(见4节的一个精确的描述如何工作)。注意，即使每个主机的URL数量参差不齐，代理人之间的URL分布趋于均匀在大爬虫中。除此之外的经验统计的原因，也有其他的动机，如用于边界的最大数量的网页抓取的政策的使用和访问的最大深度。这样的政策是必要的，以避免(可能是恶意)网络陷阱。

最后，对ubicrawler必不可少的组成部分，是一个可靠的故障检测器[15]使用超时检测撞剂;可靠性是指一个撞剂最终会被每一个活性剂(通常称为故障探测器的理论完备性较强的属性)。故障检测器是ubicrawler唯一同步组件(即使用定时功能的唯一部件);所有其他的组件在一个完全异步的方式进行交互。

4. 功能分配

在本节中我们描述的ubicrawler功能分配，和我们解释为什么这个功能可以实现每一个任务和实现容错的目标。

让A表示我们的代理标识符(即潜在的代理的名字)，L ⊆ A是活着的代理设置：我们必须指定主机代理L.更确切地说，我们已经设置了功能δ，每个非空集合L活剂，和为每个主机H，代表的责任，取(URLs)H的代理δL(H)∈L 。

下列属性是需求的功能分配。

1.平衡。每个代理应该得到大约相同数量的主机;换句话说，如果m是主机(总数)，我们想要|δ−1L (a)| ∼ m/|L| 对于每一个 a ∈ L. 2.逆变。分配给一个代理主机的设置应该就在失活和活剂激活设置在逆变方式转变。更确切地说，如果L ⊆ L 然后 δ−1 L (a) ⊇ δ−1 L(a);也就是说，如果代理的数量增长，每一个代理的网页抓取的部分必须收缩。逆变具有根本性的后果：如果增加一个新的代理，没有旧的代理将

- 45哈尔滨工业大学本科毕业设计(论文)(外文文献)

引用

1 Boldi P, Codenotti B, SantiniM, Vigna S. Trovatore: Towards a highly scalable distributed web crawler. Poster Proceedings of the 10th International World Wide Web Conference, Hong Kong, China, 2001. ACM Press: New York, 2001; 140–141. Winner of the Best Poster Award. 2 Boldi P, Codenotti B, Santini M, Vigna S. Ubicrawler: Scalability and fault-tolerance issues. Poster Proceedings of the 11th International World Wide Web Conference, Honolulu, HI, 2002. ACM Press: New York, 2002. 3 Boldi P, Codenotti B, Santini M, Vigna S. Ubicrawler: A scalable fully distributed web crawler. Proceedings of AusWeb02.The 8th Australian World Wide Web Conference, 2002. 4 Boldi P, Codenotti B, Santini M, Vigna S. Structural properties of the African web. Poster Proceedings of the 11 International World Wide Web Conference, Honolulu, HI, 2002. ACM Press: New York, 2002. 5 Page L, Brin S, Motwani R, Winograd T. The pagerank citation ranking: Bringing order to the web. Technical Report,Stanford Digital Library Technologies Project, Stanford University, Stanford, CA, 1998. 6 Cho J, Garcia-Molina H. Parallel crawlers. Proceedings of the 11th International World Wide Web Conference, 2002. ACM Press: New York, 2002. 7 Arasu A, Cho J, Garcia-Molina H, Paepcke A, Raghavan S. Searching the web. ACM Transactions on Internet Technology 2001; 1(1):2–43. 8 Najork M, Heydon A. High-performance web crawling. Handbook of Massive Data Sets, Abello J, Pardalos P, Resende M (eds.). Kluwer: Dordrecht, 2001.

th哈尔滨工业大学本科毕业设计(论文)(外文文献)

9 Brin S, Page L. The anatomy of a large-scale hypertextual web search engine. Computer Networks 1998; 30(1/7):107–117. 10 Yan H, Wang J, Li X, Guo L. Architectural design and evaluation of an efficient Web-crawling system. The Journal of Systems and Software 2002; 60(3):185–193. 11 Zeinalipour-Yazti D, Dikaiakos M. Design and implementation of a distributed crawler and filtering processor. Proceedings of NGITS 2002 (Lecture Notes in Computer Science, vol. 2382). Springer, 2002; 58–74. 12 Shkapenyuk V, Suel T. Design and implementation of a high-performance distributed web crawler. IEEE International Conference on Data Engineering (ICDE), 2002. IEEE Computer Society, 2002. 13 Najork M,Wiener JL. Breadth-first search crawling yields high-quality pages. Proceedings of the 10th International World Wide Web Conference, Hong Kong, China, 2001. ACM Press: New York, 2001. 14 Koster M. The Robot Exclusion Standard. http:/// [2001]. 15 Chandra TD, Toueg S. Unreliable failure detectors for reliable distributed systems. Journal of the ACM 1996; 43(2): 225–267. 16 Karger D, Lehman E, Leighton T, Levine M, Lewin D, Panigrahy R. Consistent hashing and random trees: Distributed caching protocols for relieving hot spots on the World Wide Web. Proceedings of the 29th Annual ACM Symposium on Theory of Computing, El Paso, TX, 1997. ACM Press: New York, 1997; 654–663. 17 Karger D, Leighton T, Lewin D, Sherman A. Web caching with consistent hashing. Proceedings of the 8th International World Wide Web Conference, Toronto, Canada, 1999. ACM Press: New York, 1999. 18 Devine R. Design and implementation of DDH: A distributed dynamic hashing algorithm. Proceedings of the Foundations of

- 89

本文来自 360文秘网(www.360wenmi.com)，转载请保留网址和出处

【绿色壁垒外文文献】相关文章：