- 상호작용 상대방을 고려한 단백질-결합 RNA 염기 예측 기법
- ㆍ 저자명
- 이현진,한경숙,Lee. Hyunjin,Han. Kyungsook
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터
- ㆍ 권/호정보
- 2013년|19권 5호|pp.229-234 (6 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
최근 단백질-RNA 복합체의 구조가 많이 알려짐에 따라 단백질에서의 RNA-결합부위를 예측하는 연구가 수행되었으나, 단백질과 상호작용하는 상대방 RNA를 전혀 고려하지 않기 때문에 상호작용하는 RNA가 달라져도 주어진 단백질에 대하여 항상 동일한 결합부위를 예측하는 단점이 있다. 한편, 단백질 서열에서의 RNA-결합부위 예측 연구와 달리, RNA 서열에서의 단백질-결합부위 예측 연구는 거의 수행되지 않았다. 본 논문은 RNA와 단백질 정보를 모두 사용하여, 단백질과 결합하는 RNA 염기를 예측하는 기법과 초기 결과를 논한다. support vector machine (SVM)을 이용하여 예측 모델을 개발하였고 RNA 서열의 전체적인 특징, 개별적인 염기의 특징, 염기 triplet과 아미노산의 결합 성향, 결합 상대방인 단백질의 특성 등을 특징 벡터에 표현하였다. SVM 예측모델을 3,149개 RNA-단백질 서열 쌍에 시험한 결과, 92.2% 민감도, 77.8% 특이도, 85.0% 정확도를 보였다.
As many structures of protein-RNA complexes were resolved recently, several studies have been carried out to predict RNA-binding residues in protein sequences. However, none of these consider interacting partners (i.e., RNA) for a given protein when predicting RNA-binding amino acids. Thus, they always predict the same RNA-binding sites for a given protein sequence even if the protein binds to different RNA molecules. Unlike the studies that predict RNA-binding amino acids, there has been little attempt to predict protein-binding nucleotides in an RNA sequence. This paper presents a new approach that predicts protein-binding nucleotides in an RNA sequence from RNA and protein sequences. To predict protein-binding RNA nucleotides, we developed a prediction model using a support vector machine (SVM) and represented several features of RNA and protein sequences, which include global features of the RNA sequence, local features of individual nucleotides, interaction propensities of nucleotide triplets, and partner features. In 5-fold cross-validation with 3,149 protein-RNA sequence pairs, the SVM model predicted protein-binding nucleotides with an accuracy of 85.0%, a sensitivity of 92.2%, and a specificity of 77.8%.