김완석* 김정국**

본 고는 메타 컴퓨팅 고출력 컴퓨팅 그리드 포털 데이터 그리드에 대한 다양한 그리드 기술의 활용 형태 및 기술요소와GGF의 활동을 중심으로한 그리드의 표준화 동향를 살펴 보고자 한다. 그리드 활용 형태와 기술요소의 파악을 통하여 IBM, MS, SUN, HP, ORACLE 등의 해외 업체와 KISTI, 삼성종합기술원 등의 국내 그리드의 연구 동향을 파악하고자 한다.

사용자 삽입 이미지

I.서 론

일상생활에서 스위치만 켜면 전등과TV 그리고 실내의 모든 가전을 손쉽게 사용할 수 있다. 또한 수도꼭지만 틀면 세수와 식기 세척 등을 마음대로 할 수 있다. 어디 전기와 수돗물뿐이겠는가? 도시가스가 그렇고 전화 역시 그러하다. 이 모든 것들이 어디서 어떻게 제공되는지 모르지만 모두들 편리하게 사용하고 있다.

그리드(Grid)란 격자모양을 의미하며, 그리드라는 용어는 미국 알콘누 국립연구소의 Ian Foster가 1998년 6월에 저술한The Grid: Blueprint for a New Computing Infrastructure가 발단이 되어 사용되기 시작한 것으로 알려져 있다. 따라서 그리드는 컴퓨터류만 연결된 기존의 인터넷에 모든 종류의 비컴퓨터류의 기계장치들을 인터넷상에 연결시켜 컴퓨터와 더불어 활용하는 기술을 지칭한다. 그리드 컴퓨팅(Grid Computing, 혹은 간단히 그리드라 칭함) 기술은 하나의 커다란 일거리를 일의 성격에 따라 개별화하고 동일 종류의 작업은 작게 나눈다. 그리하여 여러 대의 컴퓨터와 계측장치와 같은 다수의 기계장치 등을 활용하여 개별로 처리한 후에 모든 개별 결과를 취합한 최종 결과물을 얻는다. 즉, 그리드 기술은 하나의 일처리를 지구상의 모든 컴퓨터와 모든 기계장치의 연결을 통하여 구축되는 슈퍼머신을 통하여 처리하고자 한다.

그래서, 그리드 기술이 보다 더 발전하여 일반화된다면, 수도물을 사용하듯이 온라인 비디오나 최신 가요를 인터넷을 통해 시청하는 등의 콘텐츠 서비스와 네트워크 게임이나 고속컴퓨팅처리를 위해 필요한 컴퓨팅 파워를 인터넷에 연결된 슈퍼컴퓨터에서 차용할 수 있는 것이다. 또한 한달뒤 여행할 목적지의 지진 발생 확률 정보나 기상예측 정보를 인터넷에 연결된 계측기들로부터 직접 얻을 수도 있다.

이러한 서비스를 위해 슈퍼컴퓨터, 전자천체만원경, 전자지진계측기, 전자온도계, 데스크탑 컴퓨터, PDA, 핸드폰뿐만이 아니라 아파트 상가 앞의 커피 자동판매기, 지하철 요금지불기, 현금지급기, 가정내의 TV, 오디오, 게임기 등 지리적으로 분산된 모든 컴퓨터류, 비컴퓨터류의 기계장치들이 그리드 기술에 의해 자연스럽게 인터넷에 연결된다. 동시에 네트워크에 연결된 개인은 인터넷상의 모든 콘텐츠, 컴퓨팅 파워, 측정 데이터 등에 대한 공유협업활용이 가능해진다.

웹 인프라와P2P 기술 개념을 기반으로 연구되고 있는 그리드 기술은 정보자원들의 집합 및 활용(Resource aggregation), 데이터베이스 공유(Database-sharing), 협력(Collaboration)에 대한 3가지 주요 프로토콜을 기반으로 한다. 즉, 지능화된 네트워크(Advanced Networks), 고성능 컴퓨터와 최첨단 장비(Advanced Marchines 혹은 Computer & Equipment), 차세대 응용과제(Advanced Application), 그리드 이용 기술(Advanced Technonolgy 혹은 Human Resource)로 기술적 특성을 요약할 수 있다

미국 아르곤(Argonne) 국립 연구소, 남가주대, 시카고대 등이 수행하고 있는 글로버스(Globus)는 가장 대표적인 그리드 프로젝트이다. 글로버스는 인터넷상에서 큰 업무를 작게 나누어 처리할 경우에 필요한 사용자 서비스 미들웨어, 작업을 스케줄링하거나 자원을 선정하는 등의 응용 미들웨어, 보안 및 자원 할당 등을 수행하는 인프라들을 중심으로 구성되어 있다. 그리고 계산 그리드(컴퓨팅 파워 활용), 데이터 그리드(연결된 DB 활용), 액세스 그리드(전자공간 공유를 통한 협업)의 지원을 목적으로 하고 있다.

II. 그리드의 활용 분류와 기술요소

그리드의 미들웨어로서 글로버스 툴키트류가 업계의 표준이 되어 있지만, 글로버스 툴키트만으로 그리드를 운용할 수는 없다. 그 이유는 (그림 1)과 같이 글로버스 툴키트는 플랫폼에 직결된 자원관리, 자원정보서비스, 데이터관리와 같은 기본적 기능만을 그리드가 제공하기 때문이다. 현재 미국에서는 그리드를 위한 미들웨어를 패캐지화하는 NMI(NSF Middleware Initiative) 프로젝트가 진행되고 있다. 여러 그룹에서 개발한 다양한 도구들을 컴포넌트로 조합하는 경우, 효율적이고 간편한 그리드 환경의 구축과 운용이 가능하게 되는 경우가 많다. 본 장에서는 다양한 그리드의 활용 형태(PC 그리드 제외)와 그리드의 기술요소를 소개하고자 한다.

사용자 삽입 이미지

1. 메타 컴퓨팅

그리드 환경에 접속된 컴퓨터는 다수의 사람들이 이용하고, 1대의 컴퓨터로 해결할 수 없는 대규모적인 형태의 문제를 해결하는 메타 컴퓨터로서 그리드의 이용방법이 주목받고 있다. MPI(Message Passing Interface)를 이용하여 다수의 컴퓨터사이에 병렬처리를 하게 하는 것은 메타 컴퓨팅 활용의 한 방법이다. HLRS(High Performance Computing Center Stuttgart)에서 개발한 PACX-MPI나 미국 알콘누연구소 등에서 개발한 MPICH-G2는 다수의 컴퓨터로 MPI를 실현한 미들웨어의 예이다. 이러한 미들웨어의 대부분은, 컴퓨터내에서는 업체들이 제공하는 MPI를 이용하고, 컴퓨터사이에는 TCP/IP에 의한 통신방법으로 구현한 것이다. 따라서, MPI로 개발된 병렬 프로그램은 컴퓨터에 큰 변화를 주지 않고도 그리드 환경으로 사용할 수 있게 해 준다[6].

최근에는 글로버스 툴키트를 이용한 그리드 환경을 구축하는 그룹이 많기 때문에, MPICH-G2와 같은 글로버스의 자원관리나 시큐리티를 이용하는 미들웨어가 증가하고 있다.

이종 컴퓨터사이의 병렬 컴퓨팅의 실현을 통하여 문제를 해결하는 환경으로Cactus가 있다. 원래는 상대성원리의 수치해석 실현을 위하여 개발하였지만, 많은 사용자그룹과 기업들의 지원으로 PC에서부터 슈퍼컴퓨터까지 다양한 플랫폼에서 이용가능하고, 적용분야도 확대되고 있다. 이 Cactus도 MPICH-G2를 통하여 글로버스에 대응하도록 되어 있다.

글로버스 툴키트(Toolkit)는 현재의 OGSA에 대응하여 진행되고 있기 때문에 MPI를 실현하는 미들웨어도 GT3 또는 OGSA에 대응하게 될 것으로 예상된다. 메타 컴퓨팅분야에서는 실행성능의 고도화를 추구하기 때문에, 성능면에서 GT3와의 피드백(feed-back)이 기대된다.

2. 고출력 컴퓨팅(High Thoughput Computing)

그리드의 가장 간단한 활용방법은 다수의 처리를 그리드상의 컴퓨팅 자원을 분산하여 고속으로 실행하는 것이다. 구체적 실현방법으로는 다수의 업무를 스케줄링하여 복수의 원격 컴퓨터 자원을 투입하는 방법으로 이를 RPC(Remote Procedure Call)라고 부른다.

글로버스 툴키트에도 지역적 자원에 대한 업무도 수행할 수 있지만, RSL(Resource SpecificationLanguage)이라고 부르는 복잡한 API로 작업 정보를 지정해야만 한다. 또한 복수의 자원을 동시에 확보하는 기능(Dynamically Updated Request Online Co-allocator: DUROC)이 있지만, 자원사이의 작업에 대한 부하분산 스케줄링 기능은 없다. 지역적인 자원에 대한 작업관리와 자원사이의 동적 부하분산을 행하는 스케줄러를 글로버스와 조합하는 것이 고출력 컴퓨팅의 간단한 실현 방법이다.

지역적 작업관리로서는 플랫폼컴퓨팅사의 제품인LSF(Load Sharing Facility)나, 본래 NASA를 위해 개발하여 상용화한PBS(Portable Batch System) 등이 있다. 한편, 글로버스의 상위에 위치하며 자원사이의 동적 부하분산을 포함한 스케줄러로서, 사용자 요구와 자원의 매칭(matching)을 시도하는 미국 워시콘신대학이 개발한 Condor-G나 과금정보와 작업의 종료기한 등을 조건으로 하여 자원검색과 스케줄링을 행하는 호주의 모나쉬대학이 개발한 Nimrod/G 등이 있다. 이들도 글로버스의 자원관리기능에 접속이 가능하다.

앞으로도 다양한 부가가치를 가진 스케줄러가 개발되겠지만, 다른 소프트웨어와 접속이나 타 사이트와의 심리스한 연동을 위하여 표준화를 염두에 두어야 할 것이다. 이와 같은 배경에 따라, 작업 기술언어나 리소스에 대한 공용적 기술 방법 등이 OGSA를 기반으로한 논의가 시작되고 있다. 한편, 그리드 환경상에서 RPC(Grid RPC)를 사용하여 그리드 환경에 접속되는 슈퍼컴퓨터나 전용 컴퓨터 등의 희소한 컴퓨팅 자원의 공유 또는 다수의 자원을 분산처리함에 따라 처리의 고속화 등이 가능하다. 그리드RPC를 이용하면 마스터 스레이브형의 병렬/분산 프로그램 개발이 가능하며, 앞에서 언급한 메타 컴퓨팅도 실현할 수 있다.

그리드RPC는 미국 테네시대학의 Dongarra그룹의 NetSolve와 일본 산총연을 중심으로 하는 Ninf-G가 대표적이다. NetSolve나 Ninf-G도 글로버스의 컴포넌트와의 연동이 가능하게 설계되어 있다. (그림 2)는 GRIS(Grid Resource Information Service), GRAM(Grid Resource Allocation & Management), Globus-I/O 등의 글로버스 기능을 이용한 Ninf-G의 구조를 나타낸다[7].

사용자 삽입 이미지

NetSolve와 Ninf-G의 공통적인 개념을 중심으로 그리드RPC의 API 스팩이 정해져 있다. 2002년 10월 이후, GGF6와 GGF7의 회의에서 연속하여 그리드RPC의 BOF가 개최되어, 국제적 표준화 스팩에 대한 WG가 설립되었다.

최근에는 본격적인 고출력 컴퓨팅 그리드를 구축하기 위한 프로젝트들도 진행되고 있다. 현재 컴퓨팅 그리드중에서 세계 최대 규모의 프로젝트는 DTF(Distributed Terascale Facility) 테라 그리드 구축 프로젝트이다. DTF는 전미 과학 재단(NSF)의 자금 지원하에 NCSA(국립 슈퍼컴퓨팅 응용센터), SDSC(샌디에이고 슈퍼컴퓨팅 센터), 아르곤 국립 연구소, 캘리포니아 공대가 공동 진행하는 프로젝트이다. 이렇게 미국의 대표적인 4개 연구소가 리눅스 클러스터를 서로 연결하여 초당 13조회의 연산 성능을 제공할 수 있는 DTF 테라 그리드를 개발하고 있다. IBM은 세계 최대 규모인 DTF 테라 그리드 구축 컨소시엄의 시스템 제공 업체로 선정되었다. DTF 테라 그리드는 향후 가장 대표적인 고성능 컴퓨팅 그리드 사례로 언급될 것이다.

3. 그리드 포탈

그리드의 프로그래밍이나 실행방법은 그리드의 환경이나 응용에 따라 다양하다. 단지 시뮬레이션 결과를 원하는 사용자는 그리드 환경이나 응용에 따른 번잡함을 의식하기를 원하지 않는다. 그리드 포탈은 한번의 로그인으로 복수의 사이트에 접근 가능한 싱글사인온(single signon) 등을 활용하여, 그리드상의 다양한 자원, 서비스 등을 편리하게 이용할 수 있는 보다 사용자 친화적인 그리드 기술이다.

컴퓨팅 자원에 대한 접근 수단을 제공하는 포탈의 예로는NPACI의 HotPage가 있다. HotPage는 그룹내의 컴퓨팅 자원의 이용상태를 파악하여 휴지상태의 컴퓨터를 새로운 작업에 투입한다. 한편, 컴퓨팅 자원뿐만이 아니라 기능에 대한 접속을 제공하는 포탈도 사용자에게 유용하다. 일본 산총연 TACC가 공개하기 시작한 QC Grid/Gaussian Potal은 양자화학계산 사용자용의 포탈 예이다. 포탈은 단순한 서비스의 접점이 아니라 스케줄링, 수행한 작업 결과의 검색이나 비교, 복수의 서비스 연동 등에 대한 기능도 제공하여 사용자의 편리성을 향상시킬 수 있다.

웹서비스에 대한 포탈 관련 기술도 개발중에 있는데, WSIA(Web Services for Interaction Application), WSRP(Web Services for Remote Portals), WSXL(Web Services eXperience Language) 등의 다양한 스팩이 공존하고 있는 상태이다. 그리드가 OGSA 기반이 됨에 따라, 그리드 포탈 기술도 장기적으로는 웹서비스 포탈 기술을 활용하게 될 것으로 예상된다. 따라서, 그리드의 커뮤니티에서는 웹서비스 포탈 기술 표준화에 보조를 맞추어 그리드 포탈을 구축해 가야 할 것이다.

4. 데이터 그리드

고에너지 물리학이나 천체물리, 바이오 인포메틱스 등의 분야에서는 측정된 데이터의 공유에 대한 요구가 높다. 또한, 측정장치의 수는 적은데 측정할 데이터가 대용량인 경우, 장치의 수가 많지만 측정 대상의 데이터도 아주 많아 대용량 데이터 해석에 많은 연구자들의 협력이 요구되는 경우 등이 있다. 현재도 인터넷을 통해 데이터를 공유하고, 필요한 경우 데이터를 다운로드 받기도 한다. 하지만 기존 방법으로는 방대한 데이터를 공유하기가 어렵다. 수백억 바이트의 자료를 다운로드 받기 위해서는 엄청난 시간이 걸린다. 혹 다운로드 받는다고 해도 수백억 바이트 자료들을 어디에 저장할 것인가? 예를 들면, 입자 가속기와 같은 고가의 첨단 실험 장치들을 각 대학이나 연구소마다 보유할 수는 없으며, 초대형 입자 가속기 같은 경우에는 국가 차원에서도 갖추기가 쉽지 않다. 그런데 전세계의 대표적인 연구소가 입자 가속기를 이용하여 실험한 데이터를 공유하고자 한다고 하자. 매번 실험을 할 때마다 엄청난 데이터가 만들어진다. 그것을 각 나라의 연구원들이 다운로드받고 저장할 수는 없다. 이런 요구와 필요를 채우기 위해 대용량의 데이터를 네트워크를 통해 공유하기 위하여 시도되고 있는 것이 데이터 그리드이다.

한편, 그리드상에서 데이터베이스의 활용에 대한 연구개발도 진행되고 있다. 관련한 프로젝트로는, 영국 e-사이언스센터나 IBM, ORACLE이 중심이 되어 원격 데이터베이스 접근과 분산통합처리를 행하는 미들웨어를 개발하는 OGSA-DAI(Open Grid Services Architecture Data Access and Integration) 프로젝트가 있다. OGSA 고유의 코아 서비스로서 DB(RDB 혹은 XMLDB)에 대한 원격 접근 수단 제공을 목적으로, 현재 GT3 알파판상에서 동작하는 소프트웨어가 배포되고 있다.

데이터 그리드로 구축된 구체적인 프로젝트의 예는 유럽분자물리연구소(CERN) 등의 실험물리를 중심으로 하는 유럽의 연구기관에 의한 데이터 그리드 프로젝트나, 미국내의 대학 혹은 공적 연구기관을 중심으로 고도 물리학에 있어 데이터 해석기술의 연구개발을 추진하고 있는 그리드PhyN(Grid Physics Network) 프로젝트 등이 있다. 유럽의 CERN 연구소는 32개국 150개의 기관에서 일하는 1,800여 명의 연구원들에게 데이터를 제공하기 위해서 데이터 그리드를 구축한 다음, 하루 900조 바이트 이상의 데이터를 서비스하고 있다. CERN 데이터 그리드에 이어 본격적으로 데이터 그리드를 구축하는 사례가 미국 NDMA(National Digital Mammographic Archive) 그리드 프로젝트이다. 유방암 검사 등에 이용되는 유방 X선 뢴트겐 사진 등의 의료 데이터들을 디지털 기술을 이용하여 저장하고 공유함으로써 임상의들이 치료와 예방을 목적으로 데이터를 보다 쉽게 활용할 수 있게 하는 프로젝트이다. 최근 FDA는 의료 데이터를 디지털 정보로 변환하여 저장하는 것이 의료 발전에 크게 기여할 수 있다고 인정하고, 매년 2,000여 개의 병원이 14조 바이트의 정보를 저장하게 되면 약 28 페타 바이트의 정보가 생성된다고 발표하였다.

과학기술분야는 데이터 크기가 대규모인 동시에Write Once라는 특성을 갖는 경우가 많다. 대규모 데이터이기 때문에 한 곳에 저장하지 않고 분산 파일로서 취급하려는 요구가 있다. 이러한 특성을 살린 글로벌 분산 파일시스템으로 Gfarm(Grid Data Farm) 시스템이 있다. Gfarm 시스템의 개발은 일본 산총연 고에너지 가속기연구기구(KEK), 동경대학 소립자물리국제연구센터(ICEPP), 동경공업대학이 공동연구로 시작하였다. 2003년 4월 Gfarm 버전 1.0 베타판이 웹사이트 http://datafarm.apGrid.org/ 혹은 http://www.gtrc.aist.go.jp/에 공개되어 있다. Gfarm은 마치 하나의 기억을 취급하는 것처럼 세계적으로 배포되어 있는 많은 데이터들을 결합하는 공개 자료 소프트웨어로 네트워크에 연결되어 있다. 많은 자료가 하나의 파일 시스템 집합체를 이룸에 따라, 사용자는 막대한 양의 저장 자원들이 실제로 어디에 위치하는 지를 의식하지 않고 처리할 수 있다. 그리드 안전 하부 구조 때문에 다른 관리 시스템의 하부 자원은 싱글사인온으로 안전하게 공유될 수 있다. 현재의 실험에서는, 디스크 용량 70TB(1TB = 1012바이트(70장의 TB = 15,000장의 DVD 디스크))의 방대한 공유 파일 시스템을 일본과 미국에 존재하는 6개 조직이 보유한 236대의 PC로 구성하여, 구성된 공유 파일 시스템을 통하여 1.8 TB 데이터를 분석하는 데모 실행을 통하여 빠른 성능을 증명하였다.

GGF(Global Grid Forum)는 표준화와 소프트웨어의 구현을 병행하여 수행하고 있다. DAIS (Database Access andIntegration Services)-WG는 원격 데이터베이스의 접근과 분산통합처리를 위한 스팩을 정하는 것을 목적으로 하고 있다. GGF7에서는 원격 데이터베이스 접근 스팩을 거의 정한 상태이며, 금후 분산데이터베이스 사이의 통합이나 접근 시큐리티, 데이터 전송 등이 논의될 것으로 예상되고 있다.

비즈니스분야에서도 대규모 데이터처리나 데이터 공유의 요구가 높다. 석유 등의 지구자원탐색, 위성사진이나 항공사진을 이용한 지도정보처리, 시장분석이나 서비스 향상을 위한 고객데이터관리 등이 비즈니스분야의 대규모 데이터처리에 대한 대표적인 예이다. 따라서 비즈니스에 있어서도 데이터 그리드의 활용이 지속적으로 발전할 것으로 기대된다[1]

III. 그리드의 표준화 동향

현재, 그리드 기술 표준화는 GGF가 추진하고 있다. GGF는 1999년 미국을 중심으로 시작한 그리드포럼에 유럽 아시아의 많은 나라들이 참여하여 2000년 11월에 조직된 유일한 그리드 관련 국제 표준화 단체이다.

GGF에는 7개 영역(① Application, Programming Model and Environments, ② Architecture,Data, ④ Security, ⑤ Information Systems and Performance, ⑥ Peer-to-Peer, ⑦ SchedulingResource Management)이 있고, 영역 마다 워킹그룹(Working Group: WG)과 리서치그룹(Research Group: RG)이 표준화 활동을 주도하고 있다. WG는 특정의 기술에 초점을 맞춘 스팩서, 가이드라인, 추진사항에 대한 문서화된 자료의 제공을 목표로 한다. RG는 권고하기에는 시기적으로 빠른 주제에 대하여 장기적인 논의를 진행한다. 매년 3회 정도의 회합을 개최하고 있으며, 2003년 3월에 제7회째의 GGF7이 처음으로 아시아(일본 동경)에서 개최되었다.

GGF는 표준화 활동의 진행과 소프트웨어 개발에 대한 개별적 프로젝트를 추진하고 있다. 글로버스 툴키트는 일종의 업계표준(defect standard)으로서 유명하다.

사용자 삽입 이미지

2002년 2월에 캐나다의 토론토에서 개최된 GGF4에서 글로버스 프로젝트와 IBM은그리드 기반의SOAP(Simple Object Access Protocol), WSDL(Web Service Description Language)등의 웹서비스를 기반으로 그리드의 모든 기능을 서비스로 제공하는 새로운 구조 OGSA(Open Grid Services Architecture)를 제안하였다. 글로버스 툴키트는 미국 알콘즈국립연구소와 남켈리포니아대학을 중심으로한 대학, 그리고 IBM, MS와 같은 기업들이 참가한 글로버스 프로젝트팀에 의하여 개발되고 있다. 2002년 10월에 배포된 글로버스 툴키트 2.2가 최신판이다.

글로버스 프로젝트에서도OGSA에 대응하는 미들웨어 글로버스 툴키트 3.0(GT3)의 개발을 진행하고 있으며, 2003년 1월에는 OGSI부분을 포함한 GT3 알파판을 공개하였다. 글로버스 이외에도 유럽의 UNICORE 프로젝트 등이 OGSA를 구현하고 있다. 그리드의 커뮤니티는 신속한 논의를 통하여 OGSA의 기본 부분인 OGSI(Open Grid Services Infrastructure)에 대한 스팩의 제1판을 2003년 3월에 GGF에 제출하였다. 이와 같은 과정에서 그리드 기술의 표준화를 검토하는 많은 WG가 설립되었다. OGSA에 관한 표준화와 소프트웨어의 구현이 진행중에 있기 때문에, 그리드를 도구로서 이용하기를 원하는 프로젝트들은 아직 OGSA를 사용할 수 없다. 실제로 대부분의 그리드 프로젝트는 글로버스 툴키트 2.2를 적용하고 있다. 글로버스와 주변 소프트웨어층은 (그림 4)와 같다.

사용자 삽입 이미지

현재, 그리드 기술 표준화는 OGSA를 중심으로 진행되고 있는 것이 현실이다. 여러 대학이나 연구소, 소프트웨어 업체 등이 OGSA를 지원하고 있으며, OGSA 기반 위에서 다양한 연구개발들이 수행되고 있다. 글로버스 툴키트를 대상으로 하여 연동하는 많은 소프트웨어도 OGSA에 대응하고 있다. OGSA/GT3와 그리드 미들웨어의 이행에 있어, GT2를 이용한 그리드의 실적은 일종의 참고 사례가 되고 있으며, 기능향상과 성능향상에 도움이 될 것으로 기대된다[4,8,9].

IV. 해외 그리드 연구 동향

그리드를 실현하기 위해 지난 몇 년 동안 해외의 대학이나 정부연구소 등에서 집중적인 연구가 이루어 졌다. IBM마이크로소프트선마이크로시스템스HP 등 외국의 주요 IT업체들은 이미 그리드 연구를 경쟁적으로 수행하고 있다.

그리드 구축계획은 지난1998년 처음 등장했다. 현재 미국유럽일본 등의 선진국은2004년 상용화를 목표로 개발에 박차를 가하고 있다. 미국에서는 슈퍼컴퓨터센터 및 정부출연 연구소를 중심으로 1998년부터 인간게놈지도 작성 사업, 항공기 통합 설계작업, 지진 예측분석 사업 등 다양한 그리드 프로젝트가 추진되고 있다. 유럽연합(EU)은 유럽 각국의 연구기관을 연결하는 연구시험망(155 Mbps)인TEN-155기반의 유로피언 데이터 그리드(기초과학 연구지원 사업), 유로 그리드(산업기술 연구지원 사업) 등을 1999년부터 활발하게 추진하였다. 일본도 오는 2006년까지 스위스 제네바의 CERN의 입자가속기와 연동해 고에너지 물리학 연구를 수행하는 그리드 프로젝트를 진행하고 있다.

많은 선진 기업들이 경쟁적으로 그리드 연구를 하고 있는 가운데, IBM, Sun, Compaq 3개 기업은 경쟁이라도 하듯이 각각 그리드 컴퓨팅 전략을 발표하였다. 연구용이나 상업용의 거대한 컴퓨팅 파워를 구축하는 것이다. 이들 그리드 연구에는 공적 활용을 목적으로 하고 있지만, 상업용은 2003년까지 40억 달러 이상의 시장가치를 창출할 것으로 보인다. 선진 기업들이 그리드 전략으로 전향하는 이유가 바로 여기에 있는 것이다.

IBM의 BlueGrid 프로젝트는 2005년까지 전세계 198개 국가의 정부, 연구소, 학계를 그리드로 연결하여 온디멘드 e-Biz를 실현한다는 전략이다. 또한 IBM은 2001년 11월 노스 캐롤라이나(North Carolina)주의 라이프 사이언스에 게놈 유전공학 연구용 그리드 컴퓨팅 시스템을 구축한다고 발표했으며, 노스캐롤라이나주의 Research Triangle Park 소재 비영리 단체인 MCNC를 지원하고 있다. 소위 North Carolina Bioinformatics Grid라는 컴퓨팅 시스템을 구축하는 것인데, North Carolina Genomics and Bioinformatics Consortium으로, 이 프로젝트에는 기업, 대학, 바이오 연구소 등 60 개 그룹 이상이 참여하고 있다.

Sun사는 2001년 11월 13일 Sun 그리드 Engine Enterprise Edition 5.3의 베타 버전을 발표하였다. 이는 기업 내의 모든 것들을 연결하는 컴퓨터 소프트웨어이다. Sun사가 새롭게 출시한 소프트웨어는 무료로 다운 받을 수 있는데, 그리드 시스템을 사용할 때 각종 자원을 지원하고 배분하는데 사용된다. 이는 2000년 9월에 발표된 그리드 엔진 소프트웨어와 기술의 후속 버전이다. Sun사의 그룹 마케팅 담당인 Peter Jeffcock는 이번 엔터프라이즈 그리드 소프트웨어가 기업의 캠퍼스 그리드 시스템을 구축하고 운영하는데 도움을 줄 것이라고 말하였다. 이것은 기업 내의 모든 내부 연구소나 지식 콘텐츠 정보자원을 연결해주는 것으로 이미 2000년 9월 27일에 발표된 오리지널은 12,000개나 하적(download)되었으며, 이를 활용한 그리드는 118,000 CPUs를 넘는다고 하였다. Sun사는 클러스터 그리드, 캠퍼스 그리드, 그리고 글로벌 그리드를 연결하는 전략을 세우고 있다.

뒤를 이어Compaq사 또한 월드와이드 그리드 컴퓨팅 솔루션 프로그램을 개발하는데, 소프트웨어 및 하드웨어를 공급하여 고객들이 그리드 컴퓨팅 시스템을 사용하도록 하는 것이다. Compaq사는 Platform Computing Inc사와 제휴를 맺고 이를 추진하고 있으며 글로버스의툴키트와Grid Suite를 활용하고, Compaq사의 Tru64 Unix AlphaServer 시스템과 리눅스 베이스 ProLiant 서버를 사용한다. 이를 위해 뉴 햄프셔주의 Nashua에 그리드 컴퓨팅 연구소(AdvancedCenter for the Study of Grid Computing)를 설립했다.

이와 같이 이미 선진 기업들은 글로벌 오픈 스탠다드 베이스의 각종 자원들을 개발 공유하고 컴퓨팅 데이터베이스를 공유하여 상호 협력함으로써 기업과 고객을 여기에 연결하여 새로운 비즈니스 모델을 창출하고자 노력하고 있다.

V. 국내 그리드 연구 동향

우리나라 역시 이러한 그리드 컴퓨팅의 중요성을 인식하여, 2001년 5월 정보통신부와 한국과학기술정보연구원(KISTI)이 주축이 되어 국가그리드기본계획을 수립하였다. 그리고 이의 보급과 확대를 위해 Grid Forum Korea(http://www.gridforumkorea.org)를 구성하였다. 한편, 우리나라 과학기술 개발을 지원하기 위해 요구되는 슈퍼컴퓨터 용량은 2005년에는 50TFlops, 2010년에는 거의 840TFlops 정도로 예측된다.

2002년에 시작된 정보통신부의 Korea@home 프로젝트가 2007년에 완료되면 국내 PC의 10%의 이용률을 확보하면, 약 635((1,500만 PC×10%)/3만 PC×12.7Tflops)Tflops의 성능이 제공될 것으로 추정된다(현재 국내는 1,500만 대의 PC가 존재하며, 정보통신부의 예측은Korea@home 이 약 3만 대의 유휴 PC를 확보할 경우에 미국 ASCI White와 동등한 12.7Tflops의 성능을 제공할 수 있을 것으로 언급하고 있음). 한편, Korea@home 프로젝트의 신약후보물질 탐색에 대한 시범사업이 진행중이다.

삼성그룹은 민간기업으로는 처음으로 계열사가 보유한 고성능 컴퓨팅 자원을 삼성인트라넷 기반에서 사용할 수 있는삼성 그리드 프로젝트를 추진하고 있다. 삼성그룹은 현재 삼성전자와 삼성종합기술원에서 각각 사용하고 있는 고성능 컴퓨터(100개 CPU 규모)를 업무자동분산 기능 소프트웨어를 이용해 통합 사용할 수 있는 환경을 구축하여 반도체 설계분석 관련업무에 적용하고 있다. 삼성은 올해 삼성전기삼성SDI 등 타 계열사로 이 프로젝트를 확산하여 그리드 컴퓨팅 환경을 확대해 나갈 계획이다.

KISTI삼성종합기술원부산대 등3개 기관은 각각의 컴퓨팅 파워를 일정 부분씩 할당해 200여개 CPU 규모의 그리드 컴퓨팅 시스템 구축을 추진하고 있다. 이들 3개 기관은 연내 시스템 구축을 완료해 반도체 설계연구, 생명공학, 우주공학 등의 분야에 활용할 예정이다.

한국슈퍼컴퓨팅협의회(의장 김형주 서울대학술정보원장)는 과기부가 추진하고 있는e사이언스프로젝트가 조만간 본격 추진될 것으로 보고 시범적으로 협의회 소속 2개 슈퍼컴퓨터센터를 그리드로 묶는 프로젝트를 추진키로 했다. 협의회는 KISTI의 예산을 지원받아 조만간 대상센터를 선정해 연내 시스템 구축을 완료할 방침이다[10].

사용자 삽입 이미지

VI. 결 론

그리드는 분산된 다수의 정보자원(컴퓨터 데이터베이스 측정장치 회의실 등)을 많은 사람들에게 공유할 수 있는 방법을 제공한다. 그리드는 전기 수도 가스 등과 같이 정보 플러그에 접속하기만 하면 언제 어디서나 필요한 때 필요한 만큼의 정보자원을 이용할 수 있는 새로운 사회 인프라로 기대되고 있으며, 그리드의 실현을 위하여 그리드 기술의 연구개발과 표준화 정책이 병행하여 진행되고 있다.

물론 기술의 고도화와 전문화라는 측면에서 그리드 기술이4A(Advanced Networks, Advanced Marchines, Advanced Application, Advanced Technonolgy)라는 단어와 같이 고도화, 전문화, 특화될 수밖에 없는 101가지 이유가 있겠지만, 기술의 단순화와 용이성을 추구하는 IT기술진화의 트랜드측면에서의 개념적 그리드와 실제 프로젝트 사이에는 다소 괴리가 발견된다. 첫째, 기존의 그리드 프로젝트들은 암세포 해석, 항공기 통합 설계, 인간게놈 분석 등 특별한 응용에 의존적이다. 둘째, 그리드 프로젝트들이 사용하는 기술은 클라이언트 서버 혹은 P2P 기술을 기반으로 하는 다층 구조의 복잡한 미들웨어적 기술이다. 셋째, 웹은 웹서버가 필요하지만, 웹 기술이 진화하여 가상적 실시간 인터넷 인프라를 제공하는 퓨어 P2P는 서버가 없다. 그런데 P2P 기술보다 더 진화되어야 할 그리드에는 서버가 존재한다.

현재의 그리드 기술은 특화된 응용분야, 복잡한 다층 미들웨어 구조, 부가적 많은 도구와 전문인력을 필요로 하고 있어 일반인이나 일반적 인터넷 인프라상에서 활용하기에 무리한 면이 없지 않다. 또한, 그리드의 서버 기반 시스템 구조는 서버와 클라이언트가 하나(servant = server + clinet)로 통합되고 있는 기술 진화 추세를 역행하고 있으며, 이로 인하여 시스템의 가상화를 방해한다. 그래서,앞으로 몇 년 사이에 그리드가 인텔이나 시티은행 혹은GM 등에는 도입될 수 있지만 가정에서는 사용되지 않을 것이라는 가트너 데이터퀘스트사 짐 캐셀 부사장의 예측이 일리가 있다고 판단된다(http://postnology.wenetcom.co.kr/ 참조).

본 고는 주로[1]의 내용을 인용하였다. 보다 상세한 내용이 요구되면 [1]을 확인하기 바란다.

<참 고 문 헌>

[1]   IPSJ Magazine Vol.44 No.6 June 2003

[2]   Floding@home, http://folding.standford.edu

[3]   NTT데이터 cell computing, http://www.cellcomputing.jp

[4]   GGF, http://www.globalgridforum.org/

[5]   Globus toolkit, http://www.globus.org/

[6]   MPICH-G2, http://www3.niu.edu/mpi

[7]   Ninf-G, http://ninf.apgrid.org/

[8]   OGSA-DAI, http://www.ogsadai.org.uk/

[9]   SCGlobal, http://www.sc-conference.org/sc2003/global.html

[10] http://www.etnews.co.kr/

[11] http://postnology.wenetcom.co.kr/

'System > Grid' 카테고리의 다른 글

[펌] 차세대 인터넷 그리드에 관한 연구  (0) 2005.03.22

Posted by 영웅기삼
,