메뉴 바로가기 본문 바로가기 하단 바로가기

Korea Bioinformation Center

국내 생명연구자원정보의 총괄관리와 생명정보 분야의 전문연구를 위한 범부처 국가센터

공개 분석 파이프라인

#Whole Genome Sequencing
#WGS
#Genomics
#Next Generation Sequencing
#Precision Medicine
#Clinical Genomics
#noncoding genome
#GATK
#fastp
#Cutadapt
#BWA
#SortSam
#MarkDuplicates
#CountBase
#BaseRecalibrator
#ApplyBQSR
#HaplotypeCaller
#somalier
KOBICian's Story
바이오 기술의 비약적인 발전은 바이오 데이터를 통해 질병을 예측하고, 개인 맞춤형 치료를 가능하게 하는 정밀의료 시대를 앞당기고 있습니다. 이러한 정밀의료의 핵심은 ‘바이오 데이터’입니다. 그러나 데이터를 수집하고, 등록하고, 분석해 활용하는 전 과정이 매끄럽게 이어지기란 쉽지 않습니다. 규제가 지나치게 복잡하거나, 해석이 제각각이어서 오히려 혁신이 멈추는 경우도 많습니다. K-BDS 플랫폼을 운영하다 보면 이러한 현실을 자주 마주합니다. 플랫폼을 개발하려 해도, 데이터를 등록·활용하려 해도, 기관마다 다른 해석과 절차로 인해 진행이 되려다가 멈추는 일이 생깁니다. 예를 들어 한 연구자가 연구계획을 수립하여 기관생명윤리위원회(IRB)의 심의를 통과하고 이에 따라서 유전체 데이터를 수집하였지만, 막상 플랫폼에 등록하고 활용을 촉진하려 해도 법령 적용 해석이 달라 갈피를 잡지 못하는 사례가 있었습니다. 데이터는 있어도, 어떻게 다뤄야 할지 기준이 엇갈리니 아무것도 하지 못하는 상태가 되는 것입니다. 개발도 마찬가지입니다. 연구 목적의 플랫폼을 구축하려 해도, 공공 시스템 수준의 보안 인증, 망 분리, 시스템 문서화 기준이 똑같이 적용됩니다. 이런 절차는 본래 국민 생활과 직결된 행정 서비스를 위한 기준이지만, 실험적 시도와 유연한 테스트가 중요한 연구 플랫폼에까지 동일하게 적용되면, 개발 자체가 어려워집니다. 이런 기준들은 원래 행정 정보시스템을 위한 것으로, 연구 환경에는 맞지 않는 과잉 설계가 되는 경우가 많습니다. 반면 미국과 같은 나라들은 데이터의 민감성을 인정하면서도, 활용을 전제로 설계된 시스템을 운영합니다. 미국 국립보건원(NIH)은 유전체 데이터를 비롯한 인체유래 데이터를 비식별 처리한 뒤, 연구 목적에 따라 조건부로 공유합니다. 연구자는 데이터 사용 신청서를 제출하고 승인을 받으면, 클라우드 기반 플랫폼에서 직접 데이터를 분석할 수 있습니다. 중요한 점은, 기관 간 해석이 엇갈리지 않도록 일관된 가이드라인이 있다는 것입니다. 예를 들어 미국의 Common Rule(공통 윤리 규정, https://www.ecfr.gov/current/title-45/subtitle-A/subchapter-A/part-46)은 IRB 기준, 데이터 공유 범위, 민간 협력까지를 포괄하며, 연구기관과 정부기관 모두 이 기준을 따릅니다. 국내에서는 부처나 기관별로 제도 해석에 차이가 발생하는 경우가 있어, 동일한 데이터를 두고도 적용 방식이 달라질 수 있습니다. 이러한 점은 데이터 활용의 일관성을 높이기 위한 제도적 정비의 필요성을 시사합니다.개발 측면에서도 미국은 목적에 따라 요구사항을 조절합니다. 실험적 연구 플랫폼에는 보안 인증 요구 수준이 낮고, 대신 투명한 사용기록, 데이터 추적성 등 실질적인 안전 장치에 더 집중합니다. 한국은 어떤 목적의 시스템이든 동일한 망분리, DRM 적용, 보안 프레임워크 준수 등을 요구해 개발 속도와 유연성이 크게 떨어지는 것과 대비됩니다. 또한 해외처럼 클라우드 기반 플랫폼에서 데이터를 직접 분석하고자 해도, 국내에서는 이러한 환경을 구축하기가 쉽지 않습니다. 예를 들어, 국내 공공기관에 클라우드 서비스를 제공하려면 CSAP(Cloud Security Assurance Program) 인증을 반드시 받아야 하며, 이는 사실상 일부 국내 기업만이 충족할 수 있는 구조입니다. 보안과 안전이라는 명분 아래 해당 인증 요건을 고수할 경우, 글로벌 클라우드 기업의 국내 진입이 어려워지고, 그 결과 국내 연구 환경은 세계적 수준의 기술 인프라에서 점점 더 멀어지게 됩니다. 민원이 발생하거나 향후 논란이 벌어진 것을 우려한 나머지 ‘안전’이라는 표면적인 이유를 내세워 “하지 못하게 합시다”라는 소극적인 자세를 가질 것이 아니라, “이걸 어떻게 잘 사용할 수 있을까?”라고 질문을 던져야 합니다. 이 질문에 답하려면, 우리가 지금 마주하고 있는 실제 장벽부터 돌아봐야 합니다. 예를 들어, 유전체 데이터를 안전하게 비식별 처리하고도 공유하지 못하는 상황이 있습니다. 기관마다 해석이 달라 등록조차 막히고, 데이터를 연동해보려 해도 기술적으로는 가능한데 제도적으로는 할 수 없는 구조에 부딪힙니다. 결국 지금 필요한 것은 모든 분야에 동일한 기준을 일률적으로 적용하는 것이 아니라, 목적에 따라 구분된 설계와 단계별 적용 기준입니다. 중요한 것은 무조건 막는 것이 아니라, 어떻게 하면 안전하게 열 수 있을지를 고민하는 설계의 전환입니다. K-BDS 플랫폼은 단순한 정보화 시스템이 아닙니다. 그 안에는 미래 과학, 산업, 보건의료를 위한 공공 자산이 담겨 있습니다. 그렇기에 더 많은 연구자와 기관이 데이터를 활용하고, 함께 협력할 수 있는 구조를 만들어야 합니다. 연구 중심 플랫폼은 연구의 방식으로 설계되어야 합니다. 여기서 ‘설계’란 단지 기술적인 구조만이 아니라, 연구의 흐름에 맞는 제도, 절차, 규칙의 틀을 새롭게 정비하는 것을 말합니다. 우리는 이제 규제가 아닌 설계를 통해, 진짜 혁신을 만들어야 할 때입니다.

바이오익스프레스 서비스는 동적 컨테이너 기반 자동화된 워크플로우 분석 플랫폼과 고속 데이터 전송 서비스를 통해 과학 분야의 빅데이터 분석을 가능하게 하는 국내 유일의 클라우드 기반 통합 데이터 분석 서비스입니다.

다운로드

환경에 맞는 OS용 워크벤치 및 고속전송 서비스를
다운로드 해주세요.

6,076

사용자

1,047

워크스페이스

88,336

실행 태스크
국가바이오데이터스테이션 데이터 활용 바로가기

바이오 연구 데이터란 생명과학 분야의 국가 R&D 사업을 통해 생산된 모든 종류의 데이터를 의미하며, 이러한 데이터를 활용한 혁신 연구 방식이 각광받으면서 R&D 혁신을 견인하는 핵심요소로 부각되고 있습니다. 이를 위하여 부처·사업·연구자별 흩어져 있는 데이터를 통합 수집·제공하는 국가바이오데이터스테이션을 구축하여 데이터 기반 바이오 연구 환경을 조성하려 합니다.

데이터별 등록 현황

  • 2,094

    바이오프로젝트
  • 107,575

    바이오샘플
  • 2,378,804

    등록된 데이터

바이오 프로젝트 등록 현황

등록 누적 건수(건)
국가 바이오 빅데이터 사업 사업소개 바로가기

정밀의료의 근간이 되는 바이오 빅데이터는 사후적 치료 중심에서 개인 맞춤형 치료·예방의료로 전환됨에 따라 중요도가 커지고 있습니다. 특히 선점 효과가 큰 바이오 산업의 경우 선제적 투자가 필요하며, 주요국들은 대규모 바이오 빅데이터를 구축하고 있습니다. 이에 따라 국가적으로 미래 의료 선도를 위한 국가 바이오 빅데이터를 구축하기 위해 본 사업이 시행되었습니다. 정밀의료 시대의 중심인 '바이오 빅데이터'를 국가차원에서 수집-저장-활용 할 수 있는 기반을 조성하고, 신산업 촉진 및 건강한 삶의 증진에 기여하고자 합니다.

임상정보 수집

16개 희귀질환 협력기관을 지정 운영하여 희귀질환자 모집 후 임상정보 수집

데이터 분석

수집된 희귀질환자의 검체를 자원 제작 기관으로 운송 후 유전체 데이터 생산ㆍ분석

데이터 공유

수집된 임상정보 및 유전체 데이터는 3개의 기관에서 컨소시엄을 구성해 공유

데이터 활용

분석한 데이터는 희귀질환자 상담 및 진료 ㆍ연구 활동 등에 활용

유전체 데이터 25,000
변이분석 데이터 25,000
임상 정보 25,000
코호트 7
감염병 연구정보포털 소개 바로가기

감염병 연구정보포털(Infectious Disease Data Portal)은 전 세계 감염병 바이러스의 연구데이터를 통합 제공하는 포털 서비스 입니다. 빠르게 변화하는 상황에서 감염병을 이해하고 치료법과 백신을 개발하기 위해 데이터와 결과를 조화롭게 공유하기 위해 KOBIC은 전세계 감염병의 연구정보데이터를 통합하여 제공하고 있습니다.

시퀀스 대시보드

88,386 국내 유전체 서열
1,354 국내 단백질 서열
19,685,177 국외 유전체 서열
35,837,682 국외 단백질 서열
19,764,289 코로나 유전체 서열
35,333,179 코로나 단백질 서열
바이러스

감염병 개요, 입자 및 유전체 구조, 생활사, 역학, 변이 등 바이러스에 대한 통합 정보를 제공

데이터

전세계에서 수집한 염기서열 및 단백질 서열, 단백질 구조를 품질분석하여 제공

통계

바이러스 데이터의 발병 시기, 지역, 변이 등 다양한 통계 서비스

분석도구

간단한 웹 기반의 감염병 표준 염기서열 BLAST 서비스

연구지원

국내 생명과학 연구의 활성화를 위하여 생명정보학 전문지식 습득 및 전산자원이 필요한 연구자 여러분들께 다양한 생명정보학 관련 연구를 지원합니다.

  • 042-879-8544
  • swhwang@kribb.re.kr

KOBIC 온라인 교육

바로가기
  • 042-879-8582
  • bkbaik@kribb.re.kr
TOP