Skip to content

"Repository for the 'Artificial Intelligence for Biology' course project. Implements PPI prediction using GCN and Protein Language Models."

Notifications You must be signed in to change notification settings

this0655/GNN-protein-interaction

Repository files navigation

Biomedical PPI Prediction Project

단백질 상호작용(PPI) 예측을 위한 딥러닝 프로젝트입니다. GCN과 다양한 단백질 언어 모델(PLM)을 활용하여 학습 및 예측을 수행합니다.

설치 및 실행 방법

  1. 작업 경로 설정: 다운로드 받은 폴더를 반드시 **실행 경로(Current Working Directory)**로 설정해주세요.
  2. 실행 파일: prediction.ipynb 파일을 실행하여 전체 프로세스를 진행합니다.
  3. 결과 저장: 실행 시 biomedical 폴더가 자동으로 생성되며, 모든 중간 데이터와 결과 모델이 해당 폴더에 저장됩니다.

주의사항: 코드 내부 의존성 문제로 인해, 제공된 파일들의 이름을 절대 변경하지 마십시오.

설정 옵션 (Configuration)

prediction.ipynb 내부에서 다음 변수들을 수정하여 실험 환경을 설정할 수 있습니다.

1. PLM Model (단백질 언어 모델)

사용할 임베딩 모델을 선택할 수 있습니다.

  • ProtBERT
  • ProtT5
  • ESM1b
  • ESM2

2. PCA (차원 축소)

임베딩 벡터의 차원 축소 여부 및 차원 수를 설정합니다.

  • 0: PCA 적용 안 함 (원본 차원 사용)
  • 256: 256차원으로 축소
  • 512: 512차원으로 축소

3. L2 Normalization (정규화)

ProtBERTProtT5 모델 사용 시 적용 가능합니다.

  • True: L2 정규화 적용
  • False: 적용 안 함

About

"Repository for the 'Artificial Intelligence for Biology' course project. Implements PPI prediction using GCN and Protein Language Models."

Topics

Resources

Stars

Watchers

Forks