网格计算和SGE 从概念上讲,网格很简单。它是执行任务的计算资源的集合。对用户而言,它就是一个大系统,提供单个切入点,以访问强大而分散的资源。用户将网格视作单个计算资源。资源管理软件(如Su n Grid Engine)接受由用户提交的作业,并根据资源管理策略将作业安排在网格内适当的系统上执行。用户可以一次提交数千个作业,而不必考虑它们在何处运行。 什么是Clu ster grids? 网格的类型:Clu ster grids , campu s grids and global grids. 集群网格(clu ster grids)包括许多计算资源,SGE 帮助我们将这些一起工作的资源合理地提供给一个项目或一个部门的用户。 SGE 的工作原理 Su n Grid Engine 软件为用户提供了向Su n Grid Engine 系统提交要求计算的任务的方法,以透明地分配相关的工作负荷。用户可以向Su n Grid Engine 系统提交批处理作业、交互式作业和并行作业。 Su n Grid Engine 用以下方式调解可用资源和作业需求。 通过 Su n Grid Engine 系统提交作业的用户描述出作业需求的概况。此外,系统还要检索用户的身份以及他或她与项目或用户组的从属关系。用户提交作业的时间也将存储起来。 准确地说,在队列被定为可以对新作业执行操作的那一刻, Su n Grid Engine 系统就决定了适合该队列的作业,并立即分派具有最高优先级或等待时间最长久的作业。 ? Su n Grid Engine 队列允许同时执行许多作业。Su n Grid Engine 系统将尽量在负荷最小且最适合的队列中开始新的作业。 为什么用SGE? ? 用户:用户能够自由地在单一的控制节点上投放上千个的任务,而不必关心任务在哪个节点运行,这样就大大简化了用户的使用。 ? 管理员:提供广泛的工具,用以监控投放的任务。 SGE 能做什么? ? 系统接受用户所投放的任务,并基于最优的资源管理方案,将任务列队在适合的网格内系统上,等待运行。 ? SGE 依据由管理者制定的规则,检测到网格内的所有可用资源,聚集资源,并在该网格内自动地最优地分配和路由资源。 SGE 怎样工作? ? 接受用户投放的任务; ? 在任务运行以前,将任务放在一个存储区域; ? 发送任务到一个执行设备,并监控任务的运行; ? 运行结束时写回结果并记录运行日志。 SGE 的组成 ? 节点(Hosts) ? 后台程序(Daemons) ? 队列(Qu eu es) ? 用户命令(Client Commands) SGE 的组成 ? 节点(Hosts) ? Master...