메뉴 바로가기 본문 바로가기 하단 바로가기

Korea Bioinformation Center

국내 생명연구자원정보의 총괄관리와 생명정보 분야의 전문연구를 위한 범부처 국가센터

공개 분석 파이프라인

Single-Cell-RNA-Sequencing-Pipeline

Whole-genome sequencing pipeline

The Whole-genome sequencing(WGS) pipeline is a modular toolkit for processing WGS data. This pipeline takes a FASTQ file as input and provides haplotype call results and annotations and visualizations based on GATK pipeline. First, raw read data with well-calibrated base error estimates in FASTQ format are mapped to the reference genome. The BWA mapping tool is used to align reads to the human genome reference, allowing for up to two mismatches in 30-base seeds, and generate a technology-independent SAM/BAM reference file format. Next, duplicate fragments are marked and removed using Picard(http://picard.sourceforge.net), mapping quality is assessed and low-quality mapped reads are filtered, and Paired-read information is also evaluated to ensure that all mate-pair information is in sync between each read. We then refine the initial alignments with local realignment and identify suspicious regions. Using this information as a covariate along with other technical covariates and known sites of variation, the GATK base quality score recalibration(BQSR) is performed. Germline SNPs and indels are called via local reassembly of haplotypes using the recalibrated and realigned BAM files. Finally, we provide Somalier, a tool to quickly assessing sample relevance from sequencing data in BAM, CRAM or VCF format.
#Whole Genome Sequencing
#WGS
#Genomics
#Next Generation Sequencing
#Precision Medicine
#Clinical Genomics
#noncoding genome
#GATK
#fastp
#Cutadapt
#BWA
#SortSam
#MarkDuplicates
#CountBase
#BaseRecalibrator
#ApplyBQSR
#HaplotypeCaller
#somalier

Single-Cell-RNA-Sequencing-Pipeline

Single-cell RNA sequencing pipeline

The Single-cell RNA sequencing pipeline is an extensible toolkit for analyzing single-cell gene expression data using the Scanpy framework. It includes methods for preprocessing, visualization, clustering, and differential expression testing. Its Python-based implementation efficiently handles datasets containing more than one million cells. We introduce ANNDATA, a generic class for managing annotated data matrices. The pipeline features: 1. Regression of confounding variables, normalization, and identification of highly variable genes. 2. t-SNE and graph-based (Fruchterman–Reingold) visualizations that show cell-type annotations derived from comparisons with bulk expression data. 3. Clustering of cells and visualization using the Louvain algorithm, with support for other clustering algorithms as well. 4. Ranking differentially expressed genes in clusters to identify marker genes corresponding to bulk expression labels.
#Single-cell RNA sequencing
#Next-generation sequencing
#Bioinformatics
#Single-cell genomics
#Human Cell Atlas
#Cell_Biology
#Genomics
#transcriptome
#Biotechnology
#heterogeneity
#Multiomics
#scRNA-seq
#scATAC-seq
#Epigenetics
KOBICian's Story
만족도 조사는 현대 사회의 수많은 서비스와 정책 속에서 사용자의 목소리를 담아내는 중요한 도구입니다. 이는 서비스 제공자와 수요자 간의 간극을 좁히고, 실질적인 변화를 이끌어냅니다. 정책, 제도, 서비스는 운영자 입장에서 설계되지만, 실제 효과는 사용자만이 판단할 수 있으며, 만족도 조사는 사용자의 경험을 수치와 언어로 표현하여 보이지 않던 불편을 드러나게 합니다. 이러한 피드백은 개선 전략 수립, 자원 재분배, 서비스 방향 전환의 핵심 자료로 활용됩니다.예를 들어, 공공기관 복지 서비스의 만족도 조사는 단순히 예산 집행률이나 이용자 수로는 알 수 없는 담당자의 응대 태도, 접근성, 이용 절차의 간편성 등을 밝혀냅니다. 이를 통해 기관은 서비스 질을 정량 및 정성적으로 점검하고 성과를 평가할 수 있습니다. 만족도 조사는 또한 성과 중심 행정 및 경영 체계를 강화하는 데 기여하며, 조직은 내부 지표만으로는 파악하기 어려운 외부 반응을 이용자 평가를 통해 점검하게 됩니다. 높은 만족도는 올바른 방향성을, 낮은 만족도는 변화의 필요성을 시사하며 이는 공공부문뿐 아니라 기업, 교육기관, 의료기관 등 다양한 조직에 보편적으로 적용됩니다.만족도 조사는 조직 내부 구성원에게도 의미 있는 영향을 미칩니다. 높은 만족도는 서비스 제공자에게 자긍심과 동기를 부여하고, 낮은 만족도는 개선의 필요성을 자각하게 합니다. 이는 단순한 질책이 아닌 데이터 기반의 객관적인 피드백이므로 더욱 설득력 있고 수용되기 쉬우며 결과적으로 조직 전체의 학습과 성장을 돕습니다.무엇보다 중요한 것은 만족도 조사가 '경청의 문화'를 정착시키는 데 기여한다는 점입니다. 사용자의 의견을 경청하는 조직은 신뢰를 얻고, 신뢰는 참여로 이어져 더 나은 정책과 제도를 만듭니다. 특히 공공기관은 이용자의 참여와 신뢰 없이는 지속 가능한 발전을 기대하기 어렵고, 만족도 조사는 이러한 사회적 신뢰를 형성하는 데 중요한 역할을 합니다.물론 만족도 조사는 응답자의 일시적인 감정에 따른 왜곡된 평가나 낮은 응답률로 인한 대표성 부족 등의 한계를 가질 수 있습니다. 그러나 이러한 한계는 조사 설계의 정교함과 후속 조치의 진정성으로 극복 가능하며, 조사 결과를 형식적인 통계로 끝내지 않고 실제 변화로 연결하려는 의지가 중요합니다. 결국 만족도 조사는 단순한 설문이 아니라 소통, 변화, 그리고 더 나은 사회를 위한 집단적 성장의 도구입니다. 우리는 질문하고 더 잘 들어야 하며, 그 안에 우리가 바라는 미래가 숨어 있습니다.KOBIC 역시 매년 바이오 분야의 정보시스템 이용자를 대상으로 만족도 조사를 실시하고 있습니다. 만족도 조사가 형식적인 절차로 끝나지 않도록 조사 결과를 적극적으로 분석하고 개선하며, 이를 위해 전담 인력을 배치하고 정책 반영에 적극적으로 활동하고 있습니다. 이처럼 이용자들의 평가와 의견이 완성도 높은 시스템을 만드는 데 기여합니다. 상대방의 의견에 귀 기울이고 적극적으로 해결하려는 노력은 바이오 정보 분야에서 KOBIC의 성장을 이끌 것입니다.결론적으로, 만족도 조사는 단순한 피드백 수집을 넘어, 기관의 운영 및 성과 개선, 고객과 직원의 만족도를 동시에 높이는 선순환 구조를 구축하는 핵심 도구입니다. 앞으로도 더 나은 서비스를 제공하기 위해 만족도 조사에 참여하는 이용자들의 냉정한 평가와 진심 어린 조언을 당부드립니다.

바이오익스프레스 서비스는 동적 컨테이너 기반 자동화된 워크플로우 분석 플랫폼과 고속 데이터 전송 서비스를 통해 과학 분야의 빅데이터 분석을 가능하게 하는 국내 유일의 클라우드 기반 통합 데이터 분석 서비스입니다.

다운로드

환경에 맞는 OS용 워크벤치 및 고속전송 서비스를
다운로드 해주세요.

6,308

사용자

1,111

워크스페이스

90,502

실행 태스크
국가바이오데이터스테이션 데이터 활용 바로가기

바이오 연구 데이터란 생명과학 분야의 국가 R&D 사업을 통해 생산된 모든 종류의 데이터를 의미하며, 이러한 데이터를 활용한 혁신 연구 방식이 각광받으면서 R&D 혁신을 견인하는 핵심요소로 부각되고 있습니다. 이를 위하여 부처·사업·연구자별 흩어져 있는 데이터를 통합 수집·제공하는 국가바이오데이터스테이션을 구축하여 데이터 기반 바이오 연구 환경을 조성하려 합니다.

데이터별 등록 현황

  • 2,147

    바이오프로젝트
  • 110,159

    바이오샘플
  • 2,371,142

    등록된 데이터

바이오 프로젝트 등록 현황

등록 누적 건수(건)
국가 바이오 빅데이터 사업 사업소개 바로가기

정밀의료의 근간이 되는 바이오 빅데이터는 사후적 치료 중심에서 개인 맞춤형 치료·예방의료로 전환됨에 따라 중요도가 커지고 있습니다. 특히 선점 효과가 큰 바이오 산업의 경우 선제적 투자가 필요하며, 주요국들은 대규모 바이오 빅데이터를 구축하고 있습니다. 이에 따라 국가적으로 미래 의료 선도를 위한 국가 바이오 빅데이터를 구축하기 위해 본 사업이 시행되었습니다. 정밀의료 시대의 중심인 '바이오 빅데이터'를 국가차원에서 수집-저장-활용 할 수 있는 기반을 조성하고, 신산업 촉진 및 건강한 삶의 증진에 기여하고자 합니다.

임상정보 수집

16개 희귀질환 협력기관을 지정 운영하여 희귀질환자 모집 후 임상정보 수집

데이터 분석

수집된 희귀질환자의 검체를 자원 제작 기관으로 운송 후 유전체 데이터 생산ㆍ분석

데이터 공유

수집된 임상정보 및 유전체 데이터는 3개의 기관에서 컨소시엄을 구성해 공유

데이터 활용

분석한 데이터는 희귀질환자 상담 및 진료 ㆍ연구 활동 등에 활용

유전체 데이터 25,000
변이분석 데이터 25,000
임상 정보 25,000
코호트 7
감염병 연구정보포털 소개 바로가기

감염병 연구정보포털(Infectious Disease Data Portal)은 전 세계 감염병 바이러스의 연구데이터를 통합 제공하는 포털 서비스 입니다. 빠르게 변화하는 상황에서 감염병을 이해하고 치료법과 백신을 개발하기 위해 데이터와 결과를 조화롭게 공유하기 위해 KOBIC은 전세계 감염병의 연구정보데이터를 통합하여 제공하고 있습니다.

시퀀스 대시보드

88,386 국내 유전체 서열
1,354 국내 단백질 서열
19,685,177 국외 유전체 서열
35,837,682 국외 단백질 서열
19,764,289 코로나 유전체 서열
35,333,179 코로나 단백질 서열
바이러스

감염병 개요, 입자 및 유전체 구조, 생활사, 역학, 변이 등 바이러스에 대한 통합 정보를 제공

데이터

전세계에서 수집한 염기서열 및 단백질 서열, 단백질 구조를 품질분석하여 제공

통계

바이러스 데이터의 발병 시기, 지역, 변이 등 다양한 통계 서비스

분석도구

간단한 웹 기반의 감염병 표준 염기서열 BLAST 서비스

연구지원

국내 생명과학 연구의 활성화를 위하여 생명정보학 전문지식 습득 및 전산자원이 필요한 연구자 여러분들께 다양한 생명정보학 관련 연구를 지원합니다.

  • 042-879-8544
  • swhwang@kribb.re.kr

KOBIC 온라인 교육

바로가기
  • 042-879-8582
  • bkbaik@kribb.re.kr
TOP