| |
KAIST 전산학과 박종철 교수 |
후와이어드 보도에 따르면 국내 연구진이 암 관련 유전자 정보를 정확하고 신속하게 찾을 수 있는 검색엔진을 개발했다.
한국과학기술원(KAIST) 전산학과 박종철 교수와 광주과학기술원(GIST) 이현주 교수 연구팀은 의학 및 생물학 연구문헌에서 유전자 발현량 변화와 유전자 변화에 따른 암 상태 변화를 기술하는 문장을 찾아내는 검색엔진 '온코서치(OncoSearch)'를 개발했다고 22일 밝혔다.
암은 수천 개 이상 유전자의 비정상적 변화와 그에 따른 신호전달 체계 교란이 주요 원인으로 암의 원인을 이해하고 치료하기 위해서는 이들 유전자 변화와 암과의 관련성을 이해하는 것이 중요하다.
그동안 각종 암 관련 유전자 연구결과는 문헌 데이터베이스로 축적돼 왔다. 하지만 관련 연구 문헌의 양이 너무 방대한 데다 기존 검색 엔진은 유전자가 암에 어떻게 영향을 미치는지를 이해하는 데 필요한 정보인 유전자 발현량 변화 및 이에 따른 암 상태 변화에 대한 검색 기능을 제공하지 못했다.
온코서치는 첨단 텍스트마이닝 기술인 사건 정보 추출 시스템과 최대 엔트로피 분류기를 사용해 문장의 구조를 분석, 유전자 발현량의 증감 및 암의 진행상태 파악을 용이하도록 했다.
특히 각 유전자가 암 진행에 기여하는 정도를 문장 구조 분석 및 추론을 통해 파악하기 때문에 암 관련 유전자 역할에 대한 명시적인 표현이 없어도 관련된 정보를 파악할 수 있다.
또 생물학 및 의학 연구문헌을 저장하는 데이터베이스인 메드라인(Medline)에 등재된 논문에서 1700종 이상의 악성종양과 7500개 이상의 유전자에 관한 문헌정보를 빠르고 정확하게 검색할 수 있다.
박 교수는 "온코서치가 첨단 텍스트마이닝 기술을 사용해 연구문헌에서 자동으로 수집한 암 관련 유전자에 대한 대량의 정보는 향후 자동 추론기술 등을 활용해 암 연구를 위한 새로운 도구로 활용될 수 있다"고 설명했다. 이번 연구성과는 생물학 분야 학술지인 핵산연구(Nucleic Acids Research) 온라인판에 지난 9일 게재됐다.