AstekHPC

parallelComputing

ارزیابی کارایی کلاسترهای موازی

یکی از نیازهای مهم در کلاسترهای محاسباتی و سیستمهای پردازش موازی، ارزیابی میزان کارایی سخت افزار و نرم افزار محاسباتی طراحی شده می باشد. در این مطلب یک Benchmark از ناسا معرفی شده است که ترکیبی از اجرای مسائل پیچیده محاسباتی با ورودیهای مختلف در تعدادی از رشته های تخصصی ریاضی، مکانیک سیالات و .. می باشد. این محاسبات با چارچوبهای مختلفی از قبیل OpenMP, MPI و زبانهای برنامه نویسی C و Fortran نوشته شده است.

NAS PARALLEL BENCHMARKS

The NAS Parallel Benchmarks (NPB) are a small set of programs designed to help evaluate the performance of parallel supercomputers. The benchmarks are derived from computational fluid dynamics (CFD) applications and consist of five kernels and three pseudo-applications in the original "pencil-and-paper" specification (NPB 1). The benchmark suite has been extended to include new benchmarks for unstructured adaptive mesh, parallel I/O, multi-zone applications, and computational grids.  Problem sizes in NPB are predefined and indicated as different classes. Reference implementations of NPB are available in commonly-used programming models like MPI and OpenMP (NPB 2 and NPB 3).

BENCHMARK SPECIFICATIONS

The original eight benchmarks specified in NPB 1 mimic the computation and data movement in CFD applications:

  • five kernels
    • IS - Integer Sort, random memory access
    • EP - Embarrassingly Parallel
    • CG - Conjugate Gradient, irregular memory access and communication
    • MG - Multi-Grid on a sequence of meshes, long- and short-distance communication, memory intensive
    • FT - discrete 3D fast Fourier Transform, all-to-all communication
  • three pseudo applications
    • BT - Block Tri-diagonal solver
    • SP - Scalar Penta-diagonal solver
    • LU - Lower-Upper Gauss-Seidel solver

Multi-zone versions of NPB (NPB-MZ) are designed to exploit multiple levels of parallelism in applications and to test the effectiveness of multi-level and hybrid parallelization paradigms and tools.  There are three types of benchmark problems derived from single-zone pseudo applications of NPB:

  • BT-MZ - uneven-size zones within a problem class, increased number of zones as problem class grows
  • SP-MZ - even-size zones within a problem class, increased number of zones as problem class grows
  • LU-MZ - even-size zones within a problem class, a fixed number of zones for all problem classes

Benchmarks for unstructured computation, parallel I/O, and data movement

  • UA - Unstructured Adaptive mesh, dynamic and irregular memory access
  • BT-IO - test of different parallel I/O techniques
  • DC - Data Cube
  • DT - Data Traffic

GridNPB is designed specifically to rate the performance of computational grids. Each of the four benchmarks in the set consists of a collection of communicating tasks derived from the NPB. They symbolize distributed applications typically run on grids.

  • ED - Embarrassingly Distributed
  • HC - Helical Chain
  • VP - Visualization Pipeline
  • MB - Mixed Bag

DOCUMENTS ON BENCHMARK SPECIFICATIONS:

BENCHMARK CLASSES

  • Class S: small for quick test purposes
  • Class W: workstation size (a 90's workstation; now likely too small)
  • Classes A, B, C: standard test problems; ~4X size increase going from one class to the next
  • Classes D, E, F: large test problems; ~16X size increase from each of the previous classes

Details of NPB Problem Sizes and Parameters.

REFERENCE IMPLEMENTATIONS

Vendors and others implement the detailed specifications in the NPB 1 report, using algorithms and programming models appropriate to their different machines. NPB 1 implementations are generally proprietary and are not distributed by NAS.

A set of reference implementations of the NPB specifications has been written and distributed by NAS as NPB 2 and NPB 3. These source-code implementations are intended to be run with little or no tuning, and approximate the performance a typical user can expect to obtain for a portable parallel program. NPB 2 contains MPI-based source code implementations of the original eight benchmarks, and NPB 3 has included new benchmarks and problem classes as well as implementations using other programming models.  The latest release is NPB 3.3.1.

Summary of source code releases
Version Benchmarks Included Problem Classes Programming Models Used Major Changes
NPB 3.3 IS, EP, CG, MG, FT, BT, BT-IO, SP, LU, UA, DC, DT S,W,A,B,C,D,E MPI, OpenMP, serial added Class E
NPB 3.3-MZ BT-MZ, SP-MZ, LU-MZ S,W,A,B,C,D,E,F MPI+OpenMP, OpenMP, serial nested OpenMP version
NPB 3.2 IS, EP, CG, MG, FT, BT, BT-IO, SP, LU, UA, DC, DT S,W,A,B,C,D MPI, OpenMP, serial added DC, DT
NPB 3.2-MZ BT-MZ, SP-MZ, LU-MZ S,W,A,B,C,D,E,F MPI+OpenMP, SMP, serial added Class E, Class F
NPB 3.1 IS, EP, CG, MG, FT, BT, BT-IO, SP, LU, UA S,W,A,B,C,D MPI, OpenMP, serial added UA, Class D to OpenMP, serial
NPB 3.1-MZ BT-MZ, SP-MZ, LU-MZ S,W,A,B,C,D MPI+OpenMP, SMP, serial allowed a variable number of threads
GridNPB 3.1 ED, HC, VP, MB S,W,A,B Globus, Java, serial added Globus version
NPB 3.0 IS, EP, CG, MG, FT, BT, SP, LU S,W,A,B,C OpenMP, HPF, Java new programming paradigms
NPB 2.4 IS, EP, CG, MG, FT, BT, BT-IO, SP, LU S,W,A,B,C,D MPI added BT-IO, Class D
NPB 2.3 IS, EP, CG, MG, FT, BT, SP, LU S,W,A,B,C MPI, serial added CG, serial version

 

 

Login
HPCLab Media
HPCLab RSS

Site encyclopedia section

In this section, you will find articles and information you need.

Paper Categories
نرم افزار پایش کلاسترهای محاسباتی

این نرم افزار میزان استفاده از منابع محاسباتی و همچنین کار های در حال اجرا بر روی کلاستر را پایش میکند. به منظور نصب نسخه موبایل استک ابتدا JuiceSSH نصب شود.

Download More

PuTTY

PuTTY is a free and open-source terminal emulator, serial console and network file transfer application. It supports several network protocols, including SCP, SSH, Telnet, rlogin, and raw socket connection. It can also connect to a serial port.

Download More

Winscp

WinSCP is a free and open-source SFTP, FTP, WebDAV and SCP client for Microsoft Windows. Its main function is secure file transfer between a local and a remote computer.

Download More

VNC Viewer

VNC offers a deceptively simple service it allows you to view and control a remote system as though seated next to it, wherever you are.

Download More

NEWS

ابر رایانه واتسون جان زن مبتلا به سرطان را نجات داد

با این که توانایی این کامپیوتر عظیم برای شناسایی بیماری‌‌های مختلف و آنالیز علائم حیاتی بیماران بسیار بالا و احتمالا از هر پزشکی بر روی کره‌ی زمین دقیق‌تر است، اما مطمئنا حداقل تا چندین سال دیگر شاهد به کار گرفته شدن هوش مصنوعی و کامپیوترهای قدرتمندی نظیر ابر رایانه واتسون در مراکز درمانی و بیمارستان‌ها نخواهیم بود. علاوه بر این برای این که این نوع از سیستم‌های مبتنی بر AI بتوانند یک بیماری را ...

چین قدرتمندترین ابر کامپیوتر جهان را ساخت

بحث ابر کامپیوترها همواره برای عاشقان دنیای تکنولوژی و فناوری جذاب و در رتبه اول قرار داشته است. کامپیوتر از آغاز شروع به کار خود مسیر پر پیچ و خم را طی کرده‌اند تا به لپ‌تاپ‌های امروزی که وزنی کمتر از 2 کیلوگرم داشته و دارای سرعت پردازشی بسیار خوبی هستند، رسیده‌اند. جالب است بدانید کامپیوترهای اولیه حجمی به‌اندازه یک اتاق 20 متری را اشغال می‌کردند و برای روشن شدن نیازمند انرژی الکتریکی بسیار ...

IBM موفق به ساخت تراشه ای شد که می تواند مانند انسان فکر کند !

این تراشه که ترونورث نامیده می‌شود، هنوز نیازمند برنامه‌ای است که بتواند از عملکرد آن پشتیبانی کند زیرا عملکرد آن با تراشه‌های سنتی که هنوز در کامپیوترهای مدرن کاربردی هستند، متفاوت است. در پردازشگرهای سنتی، پردازشگر و حافظه از یکدیگر مجزا هستند، اما در مدل به‌هم‌پیوسته ترونورث، پردازش داده‌ها در زمانی مشابه تراشه‌های سنتی از کارایی بیشتری برخوردارند. در این تراشه به‌جای صفر و یک‌های دوتایی،‌ واحد‌های محاسباتی را اسپایک&zwnj ...

فوجيتسو و فروش يک ابر کامپيوتر 20 ترافلاپي به کانن

کاربران ابر کامپیوتر فوجیتسو را اغلب موسسه‌های تحقیقاتی و علمی تشکیل می‌دهند. اولین نمونه آن، به دانشگاه توکیو فروخته شد و سال گذشته هم اداره هواشناسی مرکزی تایوان، میزبان یکی از FX10 های ساخت فوجیتسو بود. به گفته سخن‌گوی شرکت، فروش یک نمونه تجاری به کانن نه اولین، بلکه یکی از مهم‌ترین معام.   ...

IBM موفق به ساخت تراشه ای شد که می تواند مانند انسان فکر کند !

این تراشه که ترونورث نامیده می‌شود، هنوز نیازمند برنامه‌ای است که بتواند از عملکرد آن پشتیبانی کند زیرا عملکرد آن با تراشه‌های سنتی که هنوز در کامپیوترهای مدرن کاربردی هستند، متفاوت است. در پردازشگرهای سنتی، پردازشگر و حافظه از یکدیگر مجزا هستند، اما در مدل به‌هم‌پیوسته ترونورث، پردازش داده‌ها در زمانی مشابه تراشه‌های سنتی از کارایی بیشتری برخوردارند. در این تراشه به‌جای صفر و یک‌های دوتایی،‌ واحد‌های محاسباتی را ...

درباره ما

شرکت دانش بنیان رایانش سریع هزاره ایرانیان به منظور طراحی، ساخت و گسترش کاربردهای رایانش سریع در علوم مختلف پایه گذاری شده است. این شرکت به دنبال ایجاد بستری با ظرفیت محاسباتی و ذخیره سازی بالا مبتنی بر CPU و GPU می باشد تا بتواند از آن طریق سرویسهای متعددی را به محققین، اساتید، دانشجویان تحصیلات تکمیلی و سایر علاقه مندان این حوزه ارائه نماید.


خدمات این شرکت در حوزه های زیر ارائه می گردد :

  • - رایانش سریع و ابری (HPC & Cloud Computing)
  • - کلان داده و پردازش داده های حجیم (Big Data Analysis)
  • - طراحی و پیاده سازی کلاسترهای محاسباتی مبتنی بر Linux
  • - طراحی و اجرای پروژه های انبار داده Data Warehouse
  • - مجازی سازی و اجرای شبکه های مبتنی بر نرم افزار (Software Defined Network)
شرکت دانش بنیان رایانش سریع هزاره ایرانیان